(Vision) GPT-4o Vision - 이미지를 보고 AI가 한글로 설명해주는 파이썬 예제

1 분 소요

GPT-4o Vision: 이미지를 보고 AI가 한글로 설명해주는 파이썬 예제

1. 소개

OpenAI의 GPT-4o (비전 지원) API를 활용해 이미지 URL을 입력하면 AI가 이미지를 분석해 한글로 설명해주는 초간단 파이썬 예제를 소개합니다.

  • ✅ 이미지 분석 + 자연어 설명 자동화
  • ✅ 한글, 영어 등 원하는 언어로 설명 가능
  • ✅ 챗봇, 블로그, 이미지 캡션 생성 등에 활용

2. 전체 코드 구조

import os
import requests
import warnings
from openai import OpenAI
import openai
from dotenv import load_dotenv
from playsound import playsound
import sounddevice as sd
from scipy.io.wavfile import write

# 경고 무시 설정
warnings.filterwarnings("ignore", category=UserWarning)

# .env 파일에서 OPENAI_API_KEY 불러오기
load_dotenv(dotenv_path='openapi_key.env')
api_key = os.getenv("OPENAI_API_KEY")
openai.api_key = api_key

# OpenAI 클라이언트 생성
client = OpenAI()

# 이미지 분석 + 한글 설명 요청 (GPT-4o Vision API)
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "한글로 설명해줘."},
            {
                "type": "image_url",
                "image_url": {
                    "url": "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg",
                },
            },
        ],
    }],
)

print(response.choices[0].message.content)

3. 주요 동작 설명

  • OpenAI Vision API

    • "한글로 설명해줘."라는 명령어와
    • 분석하고 싶은 이미지 URL을 동시에 전달
  • GPT-4o가 이미지를 보고 한글로 자동 설명을 생성
  • 결과는 print()로 바로 확인

4. 실습 & 활용 팁

  • 이미지 URL만 바꿔주면 다양한 사진, 그림, 도면 등을 AI가 설명
  • 메시지 내 "영어로 설명해줘.", "이 이미지를 표로 정리해줘." 등 다양한 명령으로 확장 가능
  • 인스타, 블로그, PT, 챗봇 등에 AI 자동 이미지 캡션 활용

5. 마치며

  • 최신 GPT-4o Vision API를 이용하면

    • 이미지를 이해하고 원하는 언어로 설명/요약까지 모두 자동화 가능!
  • 파이썬에서 단 몇 줄로, 누구나 강력한 AI 이미지 해설을 바로 실전 적용할 수 있습니다.


참고

댓글남기기