(Vision) GPT-4o Vision - 이미지를 보고 AI가 한글로 설명해주는 파이썬 예제
GPT-4o Vision: 이미지를 보고 AI가 한글로 설명해주는 파이썬 예제
1. 소개
OpenAI의 GPT-4o (비전 지원) API를 활용해 이미지 URL을 입력하면 AI가 이미지를 분석해 한글로 설명해주는 초간단 파이썬 예제를 소개합니다.
- ✅ 이미지 분석 + 자연어 설명 자동화
- ✅ 한글, 영어 등 원하는 언어로 설명 가능
- ✅ 챗봇, 블로그, 이미지 캡션 생성 등에 활용
2. 전체 코드 구조
import os
import requests
import warnings
from openai import OpenAI
import openai
from dotenv import load_dotenv
from playsound import playsound
import sounddevice as sd
from scipy.io.wavfile import write
# 경고 무시 설정
warnings.filterwarnings("ignore", category=UserWarning)
# .env 파일에서 OPENAI_API_KEY 불러오기
load_dotenv(dotenv_path='openapi_key.env')
api_key = os.getenv("OPENAI_API_KEY")
openai.api_key = api_key
# OpenAI 클라이언트 생성
client = OpenAI()
# 이미지 분석 + 한글 설명 요청 (GPT-4o Vision API)
response = client.chat.completions.create(
model="gpt-4o-mini",
messages=[{
"role": "user",
"content": [
{"type": "text", "text": "한글로 설명해줘."},
{
"type": "image_url",
"image_url": {
"url": "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg",
},
},
],
}],
)
print(response.choices[0].message.content)
3. 주요 동작 설명
-
OpenAI Vision API에
"한글로 설명해줘."
라는 명령어와- 분석하고 싶은 이미지 URL을 동시에 전달
- GPT-4o가 이미지를 보고 한글로 자동 설명을 생성
- 결과는
print()
로 바로 확인
4. 실습 & 활용 팁
- 이미지 URL만 바꿔주면 다양한 사진, 그림, 도면 등을 AI가 설명
- 메시지 내
"영어로 설명해줘."
,"이 이미지를 표로 정리해줘."
등 다양한 명령으로 확장 가능 - 인스타, 블로그, PT, 챗봇 등에 AI 자동 이미지 캡션 활용
5. 마치며
-
최신 GPT-4o Vision API를 이용하면
- 이미지를 이해하고 원하는 언어로 설명/요약까지 모두 자동화 가능!
-
파이썬에서 단 몇 줄로, 누구나 강력한 AI 이미지 해설을 바로 실전 적용할 수 있습니다.
참고
- OpenAI Vision 공식 문서
- 더 다양한 응용, 자동화, 챗봇 연동 팁 등은 댓글로 문의해 주세요!
댓글남기기