20대 마무리

[#3] 크롤링 - 네이버 쇼핑 항목으로 데이터프레임 만들기 본문

PROJECT/오퍼상을 위한 네이버 데이터랩 크롤링

[#3] 크롤링 - 네이버 쇼핑 항목으로 데이터프레임 만들기

AndaCondaa 2022. 7. 4. 19:07

 이번에는 네이버 트렌드 분석을 통해 나온 제품을 네이버쇼핑에서 검색 후, 상품 가격을 크롤링 해보겠습니다.

 

 먼저 앞에서 Rank 리스트에 인기검색어 순위를 저장했는데, 거기서 인덱스 0 항목인 1위 항목을 keyword 변수에 담았습니다. 

 

 

 keyword 변수를 검색창에 입력하는 코드입니다.

 

이제 드디어 본격적인 크롤링을 해보겠습니다.

 

 네이버 쇼핑에서 검색한 품목들의 상품명과 가격의 태그값을 먼저 추출합니다.

 크롤링 코드입니다. 상품명과 가격에 해당하는 css 태그값을 입력해서 name과 price라는 이름으로 저장했습니다.

 하지만 이렇게 추출한 name과 price는 바로 사용하기 어렵습니다. 사용자가 직접 확인할 수 있는 형태인 문자와 숫자로 변환해야합니다.

 price의 경우, 계산이나 시각화를 위해서는 int형으로의 변환까지 추가로 필요합니다.

 

마지막으로 데이터의 갯수까지 확인해줍니다.

 

크롤링을 통해 모든 준비를 마치면, 데이터프레임을 만들준비가 모두 되었습니다.

크롤링한 내용을 데이터프레임으로 만든 모습입니다.

 

마지막으로 만든 데이터프레임을 공유할 수 있게, csv파일로 저장합니다. 저장할 때는 인코딩값을 지정해줘야 문자로 변환한 데이터가 깨지지않고 저장됩니다.

'PROJECT > 오퍼상을 위한 네이버 데이터랩 크롤링' 카테고리의 다른 글

[#5] Epilogue  (0) 2022.07.04
[#4] 데이터 시각화  (0) 2022.07.04
[#2] 크롤링 - 트렌드 확인  (0) 2022.06.29
[#1] 라이브러리 준비  (0) 2022.06.29
[#0] Prologue  (0) 2022.06.29