바이브 코딩/Cursor AI

챗GPT API로 PDF 요약 프로그램 만들기

· 코딩마이데이

01 5개의 PDF 파일을 준비합니다.

 

02 우리 커서를 열고 빈 폴더를 하나 만든 다음, 요약할 PDF 파일을 한 폴더에 넣어줍니다. 다음으로 우리가 먼자 해야 하는 작업은 각 PDF 파일의 텍스트를 추출하는 일이겠죠? 커서에게 다음과 같이 부탁해봅니다.

현재 폴더에 있는 PDF 파일들의 텍스트를 추출하는 프로그램을 만들어줘.

 

03 그러면 커서는 파이썬으로 프로그램을 만들겠다고 하면서 한글 텍스트 추출에는 pdfplumber 패키지가 지원이 적합하다고 합니다. 제안을 수행해 그렇게 하라고 하겠습니다.

pdfplumber로 각 파일의 텍스트를 추출하는 프로그램을 만들어줘.

 

04 커서가 프로그램 생성과 함께 사용 방법도 안내해줍니다. 이번에는 커서에게 부탁하지 않고 직접 프로그램을 실행합니다. 아래쪽 터널에 실행할 명령어를 순서대로 복사해서 붙여넣고 Enter를 누릅니다.

 

05 커서가 알려주는 대로 순서대로 실행했더니 PDF 파일에서 텍스트가 추출되어 각 텍스트 파일로 저장되었습니다. 파일을 열어보면 내용이 잘 추출된 것을 확인할 수 있습니다. 하지만 내용을 보면 줄바꿈이 어색하거나 문단이 흐트려져 있어 이 상태로 보기엔 가독성이 떨어져 불편합니다.

 

06 먼저 오픈AI 플렛폼 사이트에 접속합니다. 로그인 계정은 챗GPT 계정과 동일하게 사용하면 됩니다.

오픈API 플랫폼

https://platform.openai.com/

 

OpenAI Platform

Explore developer resources, tutorials, API docs, and dynamic examples to get the most out of OpenAI's platform.

platform.openai.com

 

07 최초 가입했다면 오른쪽 위의 [Start Building]를 눌러 오픈API 플랫폼 사용을 위한 준비를 설정합니다. 소속과 기술 능통 정도에 대한 질문에 답을 선택한 다음 [Create organization]을 누릅니다.

그러면 'Make your first API call'이라는 화면 안내가 나옵니다. 여기서 그냥 [Continue]를 눌러 넘어갑니다. 그다음에 나오는 'Add some API credits'도 [I'll buy credits later]를 눌러 넘어갑니다.

 

08 준비를 완료했다면 오른쪽 계정 아이콘에서 [Your profile]을 누릅니다. 그런 다음 화면 왼쪽 메뉴에 있는 [Billing] 탭으로 이동해, 결제 수단을 등록하고 크레딧을 충전해야 합니다. 충전한 금액은 여기서 확인할 수 있으며, 이미 충전한 금액이 있다면 다음과 같이 보일 겁니다.

 

09 오픈 API를 처음 사용한다면 충전 금액이 $0.00으로 보일 겁니다. 먼저 크레딧을 충전하기 위해 [Add to credit balance]를 누릅니다. 최소 충전 금액은 5달러로 입력란에 5를 입력하고 결제 정보를 입력한 다음 [Continue]를 누릅니다. 카드 등록은 간단하므로 이 과정에서 생략하겠습니다.

 

10 크레딧이 충전되면 이제 API 키를 받을 차례입니다. 왼쪽 메뉴에서 {API Keys]를 누릅니다. 기존에 생성한 API 키가 있다면 다음과 같이 목록을 것이며, 처음 사용한다면 비어 있을 겁니다. [+Create new secret key]를 눌러 키를 생성하겠습니다.

 

11 생성된 API 키는 한 번만 표시되며 이후에는 다시 볼 수 없습니다. Create new secret key 화면에서 이름과 프로젝트를 설정한 다음 [Create secret key]를 누릅니다. 그러면 API 키가 표시되며, 이 값을 복사해서 안전한 곳에 보관합니다.

 

12 이제 다시 커서로 돌아가서 생성한 API 키를 붙여 넣은 다음 이 API 키를 사용해서 PDF의 내용을 적당히 요약하여 저장해달라고 합니다. 모델은 gpt-4o-mini를 사용하라고 하면서 이 작업에 적합한 모델인지도 알려 달라고 요청하겠습니다.

GPT API로 PDF의 내장을 요약해서 저장해줘. API 키는 sk-proj-rGcz-EGSOX*YA야, 그리고 모델은 gpt-4o-mini 모델을 사용하려고 하는데 적합한지도 알려줄래?

 

13 커서는 제시한 모델이 적합한 이유에 대해 알려준 다음 코드에 GPT API가 추가하도록 수정합니다. 코드 수정을 기다렸다가 [Keep All]을 눌러 변경사항을 반영합니다. 이때 커서가 수정해준 파일을 살펴보면 여러분이 가져왔던 GPT API키가 잘 입력되어 있을 것입니다.

 

14 커서가 안내한 방법을 따라서 코드를 실행합니다.

1. pip install -r requirements.txt

2. python summarize_pdfs.py