프로그래밍 언어/Python

월별 카드 지출 내역 분석 - 파이썬 패키지 준비하기

· 코딩마이데이

패키지(package)는 특정 기능을 구현한 모듈(module)을 모아 둔 폴더로, 패키지를 활용하면 미리 작성된 코드를 재사용할 수 있어 매우 유용합니다. 파이썬은 방대한 커뮤니티를 기반으로 다양한 패키지를 제공하며, 이 패키지들 외부 데이터를 손쉽게 불러오고 처리하는 기능을 제공합니다. 이러한 장점 덕분에 파이썬은 데이터 관리와 분석에 최적화된 프로그래밍 언어로 자리잡았습니다.

 

파이썬 패키지 준비하기

 

pathlib 패키지

현재 작업 폴더를 'ch_02'로 가정하고 하위 경로에 두 폴더 'input'과 'output'을 생성합니다.'input' 폴더는 앞으로 실습 프로젝트를 진행하며 불러올 액셀 파일을 저장하는 폴더로 사용하고, 'output' 폴더는 코드의 실행 결과를 저장하는 폴더로 사용합니다.

비주얼 스튜디오 코드에서 새로운 파일을 만들고 파일명을 'step_1.py'로 변경합니다. 다음 코드를 입력한 뒤, 대화형 창에서 실행합니다.

 

step_1.py

from pathlib import Path

WORK_DIR = Path(__file__).parent
IN_DIR, OUT_DIR = WORK_DIR / "input", WORK_DIR / "output"

if __name__ == "__main__":
    IN_DIR.mkdir(exist_ok=True)
    OUT_DIR.mkdir(exist_ok=True)

 

openpyxl 패키지

openpyxl 패키지는 파이썬에서 데이터를 액셀 파일로 저장하거나, 액셀 파일을 파이썬으로 불러올 때 사용합니다. 여기에서는 pandas 패키지를 사용해서 액셀 파일을 처리허는대, pandas 패키지가 바로 openpyxl 패키지를 활용하여 액셀 파일을 처리합니다.

비주얼 스튜디오 코드의 상단 메뉴에서 [터미널]-[새 터미널]을 클릭해 하단에 [터미널] 창을 엽니다. 그리고 터미널에 다음 명령어를 입력한 뒤 Enter 키를 눌러 openpyxl 패키지를 설치합니다.

$ pip install -U openpyxl

 

pandas 패키지

pandas 패키지는 데이터 분석 분야에서 거의 표준으로 사용되기 때문에 잘 배워 두면 다양한 실무 상황에서 황용할 수 있을 것입니다.

비주얼 스튜디오 코드에서 터미널을 열고, 다음의 명렁어를 입력해서 pandas 패키지를 설치합니다.

$ pip install -U pandas

 

seaborn 패키지

seaborn 패키지는 matplotlib 패키지 기반의 데이터 시각화 패키지로, 사용이 간편하고 다양한 테마를 제공하여 누구나 쉽게 세련된 시각화 결과물을 만들 수 있습니다.

비주얼 스튜디오 코드에서 터미널을 열고, 다음 명령어를 입력합니다. seaborn 패키지를 설치하면 pandas, matplotlib 등 seaborn이 의존하는 여러 패키지도 함께 설치됩니다.

$ pip install -U seaborn