본문 바로가기
NLP

크롤링 4

by 볼록티 2019. 11. 21.
728x90
반응형

이 장에서는 pandas 를 이용하여 크롤링을 합니다.

 

 

다음과 같은 어렵지 않은 코드로 웹페이지의 주식 정보를 가져오게 됩니다.

import pandas as pd

id_list = ['035420','066570']

for id_ in id_list:
    base_url = "http://finance.naver.com/item/main.nhn?code="
    target_url = base_url + id_
    
    data = pd.read_html(target_url, encoding='cp949')
   
    print(target_url)
    print(data[2])

-> id_list속에 숫자는 웹 주소 가장 뒤의 숫자입니다. 이부분을 고쳐서 원하는 웹페이지들을 설정할 수 있겠습니다.

 

728x90
반응형

'NLP' 카테고리의 다른 글

코사인 유사도를 활용한 유사 문서 검색  (0) 2019.11.22
뉴스 기사 분류  (0) 2019.11.22
크롤링 3  (0) 2019.11.21
크롤링 2  (0) 2019.11.21
크롤링 1  (0) 2019.11.21

댓글