프로그래밍 언어/Python

월별 카드 지출 내역 분석 - 카드 명세서 다운로드

· 코딩마이데이

모든 데이터는 자료실(https://github.com/himoon/gopython)에서 다운로드할 수 있습니다. 자료실에 장별 프로젝트의 소스 코드와 입력 파일, 출력 결과과 모두 저장되어 있으므로 전체 폴더를 다운로드하고, 장 번호에 맞는 파일을 확인합니다. 입력 파일은 'input' 폴더에 출력 결과는 'output' 폴더에서 확인할 수 있습니다.

 

앞으로는 파이썬에서 액셀 파일을 다루기 위해 셀에 저장된 데이터를 데이터프레임(dataframe)으로 변환하여 저장할 것입니다. 데이터프레임은 pandas 패키지의 자료구조 중 하나로, 행과 열로 구성된 객체입니다. 파이썬에서 데이터프레임은 리스트 또는 딕셔너리를 활용해 생성하는 것이 일반적입니다.

 

리스트를 활용하여 생성한 데이터프레임

import pandas as pd

data = [
	["2024-01-01 19:40", "애플스토어", "전자기기", 69800],
	["2024-01-02 09:55", "이다야 커피", "카페/음료", 6000],
	["2024-01-03 17:42", "매개박스", "영화", 11000],
]
df = pd.DataFrame(data, columns=["거래일시", "가맹점별", "분류", "사용금액"])

 

딕셔너리를 활용하여 생성한 데이터프레임

import pandas as pd

data = [
	"거래일시": ["2024-01-01 19:40", "2024-01-02 09:55", "2024-01-03 17:42"],
	"가맹점명": ["애플스토어", "이다야 커피", "매개박스"],
	"분류": ["전자기기", , "카페/음료", "영화"],
	"가격": [69800, 6000, 11000],
]
df = pd.DataFrame(data)

 

이 책에서 pandas 패키지의 함수 read_excel()를 사용해서 액셀 파일에 저장된 데이터를 데이터프레암으로 변환할 것입니다.