본문 바로가기

키워드

[데이터 리뷰] 디지털산업혁신 플랫폼(2) - 유저 인터넷 키워드 정보 데이터 (쿠팡, 네이버 등) 데이터 리뷰 : 데이터 대신 읽어드립니다! #8 디지털산업혁신 플랫폼(2) - 유저 인터넷 키워드 정보 데이터 (쿠팡, 지마켓, 11번가, 옥션 등) 작년, 발병한 코로나19에 대해서 미리 이를 예측한 곳이 있었는데요, 스마트 체온계 기기를 판매하는 의료기기업체 '킨사 헬스'였습니다. 판매하는 스마트 체온계 기기는 인터넷과 연동되는 기기였는데요, 스마트 체온계로 발혈 환자가 급증한 지역을 실시간으로 찾았고, 그곳은 코로나 바이러스 확진 환자가 발생한 지역이었다고 합니다. 실제로도 킨사의 발열 환자 분포도는 우한 코로나 환자 발생지와 일치했다고 합니다. 이처럼 이 사건은 개개인이 이용한 인터넷 정보들이 모여 하나의 큰 흐름을 발견한 사례인데요, 그만큼 각 유저들의 인터넷 정보는 하나의 중요한 데이터가 될 .. 더보기
[웹크롤링] 네이버 - 원하는 검색어가 입력된 페이지 열기 네이버에서 원하는 검색어를 입력한 뒤, 해당 페이지를 크롤링하는 방법은 다양한데요, 그중에서도 주소에 대해 params 값을 설정해서 해당 페이지 html을 가져오는 방법에 대해서 살펴보도록 하겠습니다. (selenium을 사용하지 않고, requests를 사용한다는 가정하에 설명드립니다.) 우선, 전체적인 코드를 보여드리도록 하겠습니다. from bs4 import BeautifulSoup import requests url = "https://search.naver.com/search.naver?" params = { 'where' : 'nexearch', 'query' : '여행', 'fbm' : '0' } resp = requests.get(url,params) soup = BeautifulSou.. 더보기