AI 세부 실습 17 - 유튜브, 이메일, OCR, 문서 요약 자동화
유튜브, 이메일, OCR, 문서 요약 자동화
이 글은 다음 원본 실습 파일을 기준으로 정리합니다.
50_automation_20250520_01_youtube.py
50_automation_20250520_01_youtube_voice.py
50_automation_20250520_02_LangGraph.py
50_automation_20250520_03_email_01.py
50_automation_20250520_03_email_02_sendtext.py
50_automation_20250520_03_email_03_sendfile.py
50_automation_20250520_04_pyautoui_01.py
50_automation_20250520_04_pyautoui_02.py
50_automation_20250520_05_summary_01_mp3_ppt.py
50_automation_20250520_05_summary_02_pdf_excel_01.py
50_automation_20250520_05_summary_02_pdf_excel_02.py
50_automation_20250521_01_email.py
50_automation_20250521_02_ocr.py
50_automation_20250907_01_youtube.py
50번 실습은 앞에서 배운 내용을 실제 업무 자동화로 연결합니다.
유튜브 요약
유튜브 URL 입력
-> 영상 ID 추출
-> 자막 가져오기
-> 번역
-> 요약
-> 파일 저장
자막이 없는 영상은 처리할 수 없으므로 예외 처리가 필요합니다.
LangGraph 자동화
LangGraph를 사용하면 각 단계를 노드로 나눌 수 있습니다.
ExtractTranscript
-> TranslateText
-> SaveTranslationTxt
-> SummarizeText
-> SaveSummaryTxt
상태 객체에 자막, 번역문, 요약문, 저장 경로를 담아 단계별로 전달합니다.
이메일 전송
smtplib를 사용하면 요약 결과를 이메일로 보낼 수 있습니다.
중요한 점은 비밀번호를 코드에 직접 넣지 않는 것입니다.
EMAIL_PASSWORD=앱_비밀번호
그리고 .env 파일에서 불러옵니다.
load_dotenv("email.env")
email_password = os.getenv("EMAIL_PASSWORD")
OCR 자동화
OCR은 이미지 속 글자를 추출합니다.
이미지 입력
-> OCR
-> 텍스트 추출
-> AI 요약
-> 결과 저장
영수증, 스캔 문서, 강의 자료 사진 정리에 활용할 수 있습니다.
PDF, Excel, PPT 요약
문서 요약 자동화는 다음 흐름입니다.
파일 읽기
-> 텍스트 또는 표 추출
-> 긴 내용은 나누기
-> AI 요약
-> txt, docx 등으로 저장
Excel은 pandas로 읽고, PDF는 PyMuPDF나 문서 로더를 사용할 수 있습니다.
안전장치
자동화에서 다음 작업은 바로 실행하지 않는 것이 좋습니다.
- 이메일 발송
- 파일 삭제
- 개인정보 포함 문서 업로드
- 외부 서비스 전송
- 결제나 예약
가능하면 AI가 초안을 만들고 사람이 확인한 뒤 실행하도록 설계합니다.
정리
50번 실습은 AI를 실제 업무에 적용하는 종합 예제입니다. 유튜브, 이메일, OCR, 문서 요약을 연결하면 반복 업무를 크게 줄일 수 있지만, 전송과 삭제 같은 작업에는 반드시 확인 단계를 두는 것이 좋습니다.
댓글남기기