목록

'python' 82건

  • 연관 키워드 경쟁 강도 분석 및 웹 앱 만들기
    프로그래밍 언어/Python · 댓글
    streamlit 패키지를 사용해서 지금까지 분석한 연관 키워드 경쟁 강도 분석 데이터를 웹 앱으로 만들어 봅시다.비주얼 스튜디오 코드에서 새로운 파일을 만들고, 파일명을 'step_3_1.py'로 저장하세요. 다음 코드를 입력한 후, 비주얼 스튜디오 코드에서 터미넣을 열고, 'streamlit run ch_08/step_3_1.py' 명령어로 웹 서버를 실행합니다.ch_08/step_3_1.pyimport pandas as pdimport streamlit as stfrom step_2_1 import rel_kwd_to_csv # 이전에 작성한 모듈을 불러옵니다.from step_2_2 import data_cleaningfrom step_2_3 import shop_cnt_to_csvfrom ste..
  • 연관 키워드 경쟁 강도 분석하기 - 키워드별 경쟁 강도 분석하기
    프로그래밍 언어/Python · 댓글 1
    키워드별 상품 개수 수집비주얼 스튜디오 코드에서 새로운 파일을 생성하고, 파일명을 'step_2_3.py'로 저장합니다. 다음 코드를 입력한 후, 대화형 창에서 실행하면, 'output' 폴더에 키워드별 상품 개수가 포함된 'step_2_3.csv' 파일이 생성됩니다. ch08/step_2_3.pyimport timefrom pathlib import Pathimport pandas as pdfrom tqdm import tqdm # 진행 표시줄 관리를 위한 tqdm 클래스from step_1_1 import OUT_DIR # 이전에 작성한 모듈을 불러옵니다.from step_1_2 import query_naver_shopfrom step_2_2 import OUT_2_2OUT_2_3 = OUT_DIR..
  • 연관 키워드 경쟁 강도 분석하기 - 데이터 정제하기
    프로그래밍 언어/Python · 댓글
    비주얼 스튜디오 코드에서 새로운 파일을 만들고, 파일명을 'step_2_2.py'로 지정합니다. 다음 코드를 입력하고, 대화형 창에서 실행하면, 'output' 폴더에 'step_2_2.csv' 파일을 생성됩니다. ch08/step_2_2.pyfrom pathlib import Pathimport pandas as pdfrom step_1_1 import OUT_DIR # 이전에 작성한 모듈을 불러옵니다.from step_2_1 import OUT_2_1OUT_2_2 = OUT_DIR / f"{Path(__file__).stem}.csv"def data_cleaning(): # 08 df_raw = pd.read_csv(OUT_2_1, dtype="string") # 09 f_pc_cnt = ..
  • 연관 키워드 경쟁 강도 분석하기 - 연관 키워드 수집하기
    프로그래밍 언어/Python · 댓글 1
    키워드 검색 강도는 어떤 상품의 수요와 공급을 비율로 표시한 것으로, 일반적으로 네이버쇼핑에 등록한 상품 개수(공급)를 네이버 검색 횟수(수요)로 나눠서 계산합니다. 연관 키워드 수집하기pandas 패키지의 데이터프레임을 활용하면 편리하게 처리할 수 있습니다. 비주얼 스튜디오 코드에서 새로운 파일을 만들고, 파일명을 'step_2_1.py'로 지정하세요. 다음 코드를 입력한 후, 대화형 창에서 실행합니다. 'output' 폴더에 '나이키'에 대한 연관 키워드 데이터를 저장한 CSV 파일이 생성됩니다.from pathlib import Pathimport pandas as pdfrom step_1_1 import OUT_DIR # 이전에 작성한 모듈을 불러옵니다.from step_1_3 import q..
  • 네이버 쇼핑 연관 키워드 검색하기 - 연관 키워드 검색하기
    프로그래밍 언어/Python · 댓글
    01 웹 브리우저에서 네이버 검색광고에 접속한 뒤, [신규가입] 버튼을 클릭하고 로그인하세요.네이버 검색광고https://ads.naver.com/ 네이버 광고주센터네이버 광고주센터 홈ads.naver.com 02 '네이버 통합 광고주센터 회원 가입'에 동의하고 '네이버 광고 계정 생성'에서 [개인 광고주] 탭을 클릭한 후 광고 계정 생성을 완료하세요. 03 다시 네이버 검색광고로 돌아가 오른쪽 상단의 [광고플랫폼] 버튼을 클릭합니다. 04 [도구] - [API 사용 관리] 메뉴를 클릭하고 이어서 [네이버 검색광고 API 서비스 신청] 버튼을 클릭한 뒤 서비스 약관에 동의합니다. 05 신청을 완료하면, 네이버 검색광고 API를 사용하기 위해 필요한 정보인 CUSTOMER_ID, 액세스 라이선스, 비밀키를..
  • 네이버쇼핑 연관 키워드 검색하기 - 네이버 쇼핑 검색하기
    프로그래밍 언어/Python · 댓글
    01 웹 브라우저에서 네이버 개발자 센터에 접속한 뒤, 상단의 [Application]-[내 애플리케이션] 메뉴를 클릭하고, 네이버 로그인 또는 회원가입하세요.네이버 개발자 센터https://developers.naver.com/main/ NAVER Developers네이버 오픈 API들을 활용해 개발자들이 다양한 애플리케이션을 개발할 수 있도록 API 가이드와 SDK를 제공합니다. 제공중인 오픈 API에는 네이버 로그인, 검색, 단축URL, 캡차를 비롯 기계번역, 음developers.naver.com 02 왼쪽 사이드바에서 [내 애플리케이션] 메뉴를 클릭한 뒤 오른쪽에 있는 [Application 등록] 버튼을 클릭합니다. 03 [애플리케이션 등록(API 이용신청)] 화면에서 다음과 같이 필요한 정보..
  • 네이버쇼핑 연관 키워드 검색하기 - 파이썬 패키지 준비하기
    프로그래밍 언어/Python · 댓글
    네이버는 다양한 API를 통해 전문가에 의해 검증된 서비스를 편리하게 사용할 수 있도록 하고, 자사 서비스의 접근성을 높이고 있습니다.네이버 서비스 API: 각종 네이버 검색(뉴스, 블로그, 쇼핑 등), 로그인, 데이터랩 등 기본 서비스네이버 검색광고 API: 키워드 도구, 광고 캠페인 관리 등 검색광고 특화 서비스네이버 클라우드 API: 지도, 번역, 문자 인식, 음성 인식, 음성 합성 등 최신 서비스pathlib 패키지pathlib 패키지를 사용하여 사용할 폴더를 만듭니다. 비주얼 스튜디오 코드에서 새로운 파일을 생성하고 파일명을 'step_1_1.py'로 저장합니다. 그리고 나서 다음과 같이 코드를 입력하고 대화형 창에서 실행합니다. 현재 작업 폴더의 하위 경로에 'output' 폴더가 생성됩니다..
  • 시가총액 데이터 시각화하기
    프로그래밍 언어/Python · 댓글
    plotly 패키지를 사용하여 상위 50% 종목에 대한 시가총액 데이터를 트리맵으로 시각화해봅시다. 비주얼 스튜디오 코드에서 새로운 파일을 만들고, 파일명을 'step_3_2.py'로 저장합니다. 다음 코드를 입력한 뒤 대화형 창에서 실행하면 'output' 폴더에 'step_3_2.png' 파일이 생성됩니다. 이 파일에는 상위 50%에 해당하는 21개 종목의 시가총액이 트리맵으로 시각화되어 있습니다. from pathlib import Pathimport pandas as pdimport plotly.express as px # 03from step_1_1 import OUT_DIR # 이전에 작성한 모듈을 불러옵니다.from step_3_1 import OUT_3_1df_raw = pd.read_c..
  • 시가총액 상위 종목 구하기
    프로그래밍 언어/Python · 댓글
    코스피 종목별 시가총액 누적 비율을 계산하여 전체 코스피 시장에서 시가총액 기준 상위 N%를 차지하는 종목을 추출하는 함수 top_kospi_company()를 작성하고, 상위 50%를 차지하는 종목을 추출합니다. 시가총액 누적 비율은 먼저 종목별 누적 합계를 계산하고, 이룰 전체 코스피 시가총액을 나누어 구할 수 있습니다.비주얼 스튜디오 코드에서 새로운 파일을 만들고, 파일명을 'step_3_1.py'로 지정합니다. 다음 코드를 입력한 뒤 대화형 창에서 실행합니다. 시가총액 기준 코스와 상위 50%를 차지하는 종목 리스트를 구할 수 있습니다.from pathlib import Pathimport pandas as pdfrom step_1_1 import OUT_DIR # 이전에 작성한 모듈을 불러옵니다..
  • 페이지 이동 자동화하기 - 전체 데이터 수집하기
    프로그래밍 언어/Python · 댓글
    비주얼 스튜디오 코드에서 새로운 파일을 만들고, 파일명을 'step_2_2.py'로 저장합니다. 다음 코드를 입력한 뒤 실행 버튼을 클릭하여 입력한 코드를 실행합니다. 첫 페이지부터 맨 뒤 페이지까지 이동하면서 전체 시가총액 데이터를 수집합니다. ch07/step_2_2.pyfrom pathlib import Pathimport pandas as pdfrom playwright.sync_api import Pagefrom step_1_1 import OUT_DIR # 이전에 작성한 모듈을 불러옵니다.from step_1_2 import run_playwrightfrom step_1_3 import goto_market_cap, parse_table_kospifrom step_1_4 import table..
  • 페이지 이동 자동화하기 - 총 페이지 개수 확인하기
    프로그래밍 언어/Python · 댓글 1
    URL은 인터넷 상에서 자원의 위치를 나타내는 주소로, 웹 페이지나 파일에 접근하기 위해 사용됩니다. 쿼리 스트링은 URL의 일부로, '?' 다음게 위치하여 웹 서버에 추가적인 정보를 전달하는 키-쌍의 집합입니다. 각 키-쌍은 '&'로 구분하고, 키와 값은 '='로 연결합니다. 예를 들어, "?page=2&sort=desc'sms page 키에 '2', sort 키에 'desc'를 전달하라는 의미입니다. 총 페이지 개수 확인하기코스피 시장에서 2,000개가 넘는 종목이 있습니다. 네이버페이 증권은 한 페이지에 50개의 종목을 표시하며, 전체 항목을 수집하려면 페이지를 변경하면서 데이터를 수집해야 합니다. 여기서는 총 페이지 개수를 확인하는 함수를 만들어 보겠습니다.크로미움 웹 브라우저를 사용하여 네이버페..
  • 종목별 시가총액 데이터 수집하기 - 데이터 정제하기
    프로그래밍 언어/Python · 댓글
    웹 환경에서 수집한 데이터는 정제가 필요합니다. 이런 작업에는 pandas 패키지를 사용하는 것이 적합합니다. 앞서 수집한 데이터는 header와 body가 키고, 각 키에 리스트 타입의 값이 짝지어진 딕셔너리 타입입니다. 딕셔너리를 pandas 패키지의 데이터프레임으로 변환하고 데이터프레임에서 불필요한 행과 열, 공백 문자를 삭제하겠습니다. 비주얼 스튜디오 코드에서 새로운 파일을 만들고, 파일 명을 'step_1_4.py'로 자정합니다. 다음 코드를 입력한 뒤 대화형 창에서 실행합니다. 앞서 수집한 데이터가 CSV 파일로 저장됩니다.import jsonfrom pathlib import Pathimport pandas as pdfrom step_1_1 import OUT_DIR # 이전에 작성한 모듈을..

연관 키워드 경쟁 강도 분석 및 웹 앱 만들기

streamlit 패키지를 사용해서 지금까지 분석한 연관 키워드 경쟁 강도 분석 데이터를 웹 앱으로 만들어 봅시다.비주얼 스튜디오 코드에서 새로운 파일을 만들고, 파일명을 'step_3_1.py'로 저장하세요. 다음 코드를 입력한 후, 비주얼 스튜디오 코드에서 터미넣을 열고, 'streamlit run ch_08/step_3_1.py' 명령어로 웹 서버를 실행합니다.ch_08/step_3_1.pyimport pandas as pdimport streamlit as stfrom step_2_1 import rel_kwd_to_csv # 이전에 작성한 모듈을 불러옵니다.from step_2_2 import data_cleaningfrom step_2_3 import shop_cnt_to_csvfrom ste..

연관 키워드 경쟁 강도 분석하기 - 키워드별 경쟁 강도 분석하기

키워드별 상품 개수 수집비주얼 스튜디오 코드에서 새로운 파일을 생성하고, 파일명을 'step_2_3.py'로 저장합니다. 다음 코드를 입력한 후, 대화형 창에서 실행하면, 'output' 폴더에 키워드별 상품 개수가 포함된 'step_2_3.csv' 파일이 생성됩니다. ch08/step_2_3.pyimport timefrom pathlib import Pathimport pandas as pdfrom tqdm import tqdm # 진행 표시줄 관리를 위한 tqdm 클래스from step_1_1 import OUT_DIR # 이전에 작성한 모듈을 불러옵니다.from step_1_2 import query_naver_shopfrom step_2_2 import OUT_2_2OUT_2_3 = OUT_DIR..

연관 키워드 경쟁 강도 분석하기 - 데이터 정제하기

비주얼 스튜디오 코드에서 새로운 파일을 만들고, 파일명을 'step_2_2.py'로 지정합니다. 다음 코드를 입력하고, 대화형 창에서 실행하면, 'output' 폴더에 'step_2_2.csv' 파일을 생성됩니다. ch08/step_2_2.pyfrom pathlib import Pathimport pandas as pdfrom step_1_1 import OUT_DIR # 이전에 작성한 모듈을 불러옵니다.from step_2_1 import OUT_2_1OUT_2_2 = OUT_DIR / f"{Path(__file__).stem}.csv"def data_cleaning(): # 08 df_raw = pd.read_csv(OUT_2_1, dtype="string") # 09 f_pc_cnt = ..

연관 키워드 경쟁 강도 분석하기 - 연관 키워드 수집하기

키워드 검색 강도는 어떤 상품의 수요와 공급을 비율로 표시한 것으로, 일반적으로 네이버쇼핑에 등록한 상품 개수(공급)를 네이버 검색 횟수(수요)로 나눠서 계산합니다. 연관 키워드 수집하기pandas 패키지의 데이터프레임을 활용하면 편리하게 처리할 수 있습니다. 비주얼 스튜디오 코드에서 새로운 파일을 만들고, 파일명을 'step_2_1.py'로 지정하세요. 다음 코드를 입력한 후, 대화형 창에서 실행합니다. 'output' 폴더에 '나이키'에 대한 연관 키워드 데이터를 저장한 CSV 파일이 생성됩니다.from pathlib import Pathimport pandas as pdfrom step_1_1 import OUT_DIR # 이전에 작성한 모듈을 불러옵니다.from step_1_3 import q..

네이버 쇼핑 연관 키워드 검색하기 - 연관 키워드 검색하기

01 웹 브리우저에서 네이버 검색광고에 접속한 뒤, [신규가입] 버튼을 클릭하고 로그인하세요.네이버 검색광고https://ads.naver.com/ 네이버 광고주센터네이버 광고주센터 홈ads.naver.com 02 '네이버 통합 광고주센터 회원 가입'에 동의하고 '네이버 광고 계정 생성'에서 [개인 광고주] 탭을 클릭한 후 광고 계정 생성을 완료하세요. 03 다시 네이버 검색광고로 돌아가 오른쪽 상단의 [광고플랫폼] 버튼을 클릭합니다. 04 [도구] - [API 사용 관리] 메뉴를 클릭하고 이어서 [네이버 검색광고 API 서비스 신청] 버튼을 클릭한 뒤 서비스 약관에 동의합니다. 05 신청을 완료하면, 네이버 검색광고 API를 사용하기 위해 필요한 정보인 CUSTOMER_ID, 액세스 라이선스, 비밀키를..

네이버쇼핑 연관 키워드 검색하기 - 네이버 쇼핑 검색하기

01 웹 브라우저에서 네이버 개발자 센터에 접속한 뒤, 상단의 [Application]-[내 애플리케이션] 메뉴를 클릭하고, 네이버 로그인 또는 회원가입하세요.네이버 개발자 센터https://developers.naver.com/main/ NAVER Developers네이버 오픈 API들을 활용해 개발자들이 다양한 애플리케이션을 개발할 수 있도록 API 가이드와 SDK를 제공합니다. 제공중인 오픈 API에는 네이버 로그인, 검색, 단축URL, 캡차를 비롯 기계번역, 음developers.naver.com 02 왼쪽 사이드바에서 [내 애플리케이션] 메뉴를 클릭한 뒤 오른쪽에 있는 [Application 등록] 버튼을 클릭합니다. 03 [애플리케이션 등록(API 이용신청)] 화면에서 다음과 같이 필요한 정보..

네이버쇼핑 연관 키워드 검색하기 - 파이썬 패키지 준비하기

네이버는 다양한 API를 통해 전문가에 의해 검증된 서비스를 편리하게 사용할 수 있도록 하고, 자사 서비스의 접근성을 높이고 있습니다.네이버 서비스 API: 각종 네이버 검색(뉴스, 블로그, 쇼핑 등), 로그인, 데이터랩 등 기본 서비스네이버 검색광고 API: 키워드 도구, 광고 캠페인 관리 등 검색광고 특화 서비스네이버 클라우드 API: 지도, 번역, 문자 인식, 음성 인식, 음성 합성 등 최신 서비스pathlib 패키지pathlib 패키지를 사용하여 사용할 폴더를 만듭니다. 비주얼 스튜디오 코드에서 새로운 파일을 생성하고 파일명을 'step_1_1.py'로 저장합니다. 그리고 나서 다음과 같이 코드를 입력하고 대화형 창에서 실행합니다. 현재 작업 폴더의 하위 경로에 'output' 폴더가 생성됩니다..

시가총액 데이터 시각화하기

plotly 패키지를 사용하여 상위 50% 종목에 대한 시가총액 데이터를 트리맵으로 시각화해봅시다. 비주얼 스튜디오 코드에서 새로운 파일을 만들고, 파일명을 'step_3_2.py'로 저장합니다. 다음 코드를 입력한 뒤 대화형 창에서 실행하면 'output' 폴더에 'step_3_2.png' 파일이 생성됩니다. 이 파일에는 상위 50%에 해당하는 21개 종목의 시가총액이 트리맵으로 시각화되어 있습니다. from pathlib import Pathimport pandas as pdimport plotly.express as px # 03from step_1_1 import OUT_DIR # 이전에 작성한 모듈을 불러옵니다.from step_3_1 import OUT_3_1df_raw = pd.read_c..

시가총액 상위 종목 구하기

코스피 종목별 시가총액 누적 비율을 계산하여 전체 코스피 시장에서 시가총액 기준 상위 N%를 차지하는 종목을 추출하는 함수 top_kospi_company()를 작성하고, 상위 50%를 차지하는 종목을 추출합니다. 시가총액 누적 비율은 먼저 종목별 누적 합계를 계산하고, 이룰 전체 코스피 시가총액을 나누어 구할 수 있습니다.비주얼 스튜디오 코드에서 새로운 파일을 만들고, 파일명을 'step_3_1.py'로 지정합니다. 다음 코드를 입력한 뒤 대화형 창에서 실행합니다. 시가총액 기준 코스와 상위 50%를 차지하는 종목 리스트를 구할 수 있습니다.from pathlib import Pathimport pandas as pdfrom step_1_1 import OUT_DIR # 이전에 작성한 모듈을 불러옵니다..

페이지 이동 자동화하기 - 전체 데이터 수집하기

비주얼 스튜디오 코드에서 새로운 파일을 만들고, 파일명을 'step_2_2.py'로 저장합니다. 다음 코드를 입력한 뒤 실행 버튼을 클릭하여 입력한 코드를 실행합니다. 첫 페이지부터 맨 뒤 페이지까지 이동하면서 전체 시가총액 데이터를 수집합니다. ch07/step_2_2.pyfrom pathlib import Pathimport pandas as pdfrom playwright.sync_api import Pagefrom step_1_1 import OUT_DIR # 이전에 작성한 모듈을 불러옵니다.from step_1_2 import run_playwrightfrom step_1_3 import goto_market_cap, parse_table_kospifrom step_1_4 import table..

페이지 이동 자동화하기 - 총 페이지 개수 확인하기

URL은 인터넷 상에서 자원의 위치를 나타내는 주소로, 웹 페이지나 파일에 접근하기 위해 사용됩니다. 쿼리 스트링은 URL의 일부로, '?' 다음게 위치하여 웹 서버에 추가적인 정보를 전달하는 키-쌍의 집합입니다. 각 키-쌍은 '&'로 구분하고, 키와 값은 '='로 연결합니다. 예를 들어, "?page=2&sort=desc'sms page 키에 '2', sort 키에 'desc'를 전달하라는 의미입니다. 총 페이지 개수 확인하기코스피 시장에서 2,000개가 넘는 종목이 있습니다. 네이버페이 증권은 한 페이지에 50개의 종목을 표시하며, 전체 항목을 수집하려면 페이지를 변경하면서 데이터를 수집해야 합니다. 여기서는 총 페이지 개수를 확인하는 함수를 만들어 보겠습니다.크로미움 웹 브라우저를 사용하여 네이버페..

종목별 시가총액 데이터 수집하기 - 데이터 정제하기

웹 환경에서 수집한 데이터는 정제가 필요합니다. 이런 작업에는 pandas 패키지를 사용하는 것이 적합합니다. 앞서 수집한 데이터는 header와 body가 키고, 각 키에 리스트 타입의 값이 짝지어진 딕셔너리 타입입니다. 딕셔너리를 pandas 패키지의 데이터프레임으로 변환하고 데이터프레임에서 불필요한 행과 열, 공백 문자를 삭제하겠습니다. 비주얼 스튜디오 코드에서 새로운 파일을 만들고, 파일 명을 'step_1_4.py'로 자정합니다. 다음 코드를 입력한 뒤 대화형 창에서 실행합니다. 앞서 수집한 데이터가 CSV 파일로 저장됩니다.import jsonfrom pathlib import Pathimport pandas as pdfrom step_1_1 import OUT_DIR # 이전에 작성한 모듈을..