프로그래밍 언어/Python

아파트 매매 실거래가 데이터 수집

· 코딩마이데이

국토교통부 아파트 매매 실거래가 자료 API는 지역코드와 계약년월을 입력하면 해당 지역과 기간의 아파트 매매 신고 상세정보를 조회합니다.

Datagokr 객체의 함수 apt_trade()를 사용해서 서울특별시 강남구의 아파트 매매 실거래가 데이터를 불러오고, 필요한 열을 추출합니다. 비주얼 스튜디오 코드에서 새로운 파일을 생성하고 파일명을 'step_2_2.py'로 변경합니다. 다음과 같이 코드를 입력하고, 대화형 창에서 실행합니다. 2023년 12월에 거래된 서울특별시 강남구의 아파트 매매 거래 금액이 포함된 데이터프레임이 출력됩니다.

 

ch_11/step_2_2.py

from datakart import Datagokr
import pandas as pd
from step_2_1 import DATAGO_KEY # 03

datago = Datagokr(DATAGO_KEY) # Datagokr 객체 생성
resp = datago.apt_trade("11600", "202312") # 06
df_raw = pd.DataFrame(resp)
df_filter = df_raw.filter(["sggCd", "dealYear", "dealMonth", "dealingGbn", "umdNm", # 08
                           "aptNm", "excluUseAr", "dealAmount", "cdealDay"]) # 09
df_filter.columns = ["지역코드", "계약년도", "계약월", "거래유형", "법정동", # 10
                     "단지명", "전용면적", "거래금액", "해제사유발생일"] # 11
df_filter.head(3)  # 첫 3개 행 데이터 출력

 

03 소스 코드 'step_2_1.py'에서 공공데이터포털의 API 키를 불러옵니다.

06 함수 api_trade()에 서울특별시 강남구역의 지역코드와 계약년월을 전달합니다.

08~09 함수 filer()를 사용해 데이터프레임에서 필요한 열을 추출합니다.

10~11 데이터프레임의 columns에 리스트 타입으로 열 이름을 저장하여 헤더를 설정합니다.