파이썬 웹 크롤링(Web Crawling) 강좌 : 2. Yes24 특정 키워드 책 검색 순위 출력하기Python/웹크롤링2023. 10. 21. 22:10
Table of Contents
반응형
Yes24에서 특정 키워드로 검색하여 얻은 결과에서 원하는 책의 검색 순위를 출력합니다.
2015. 04. 12 최초작성
…..
2021. 07. 09 상세 페이지 변경된 태그 반영
2022. 12. 18 동적 웹페이지로부터 웹 크롤링하기 위해 selenium 사용
2023. 5. 21
2023. 7. 9 교보문고에서 Yes24로 변경, 베스트셀러가 아닌 키워드 검색으로 변경
다음 예제 코드는 opencv 키워드로 검색하여 얻은 결과에서 '알짜배기 예제로 배우는 OpenCV' 책의 순위를 출력해줍니다.
from urllib.request import urlopen from bs4 import BeautifulSoup keyword = 'opencv' search_book_name = '알짜배기 예제로 배우는 OpenCV' html = urlopen(f'https://www.yes24.com/Product/Search?domain=ALL&query={keyword}') bsObject = BeautifulSoup(html, 'html.parser') books = bsObject.find_all('div', class_='info_row info_name') find_index = [] book_names = [] types = [] for i, book in enumerate(books): data = list(book.children) is_used=data[1].get_text() book_name=data[3].get_text() if search_book_name in book_name and '[중고도서]'!=is_used: find_index.append(i+1) book_names.append(book_name) types.append(is_used) for i,type,book in zip(find_index,types,book_names): print(i, type, book) |
포스트 작성시점에서 실행결과는 다음과 같습니다.
두권의 책이 7번째, 17번째에 출력되었다는 것을 보여줍니다.
7 [도서] 알짜배기 예제로 배우는 OpenCV
17 [eBook] 알짜배기 예제로 배우는 OpenCV
반응형
'Python > 웹크롤링' 카테고리의 다른 글
웹크롤링시 ConnectionResetError(104, 'Connection reset by peer') 해결방법 (0) | 2024.08.08 |
---|---|
웹크롤링 강좌 – 기상청의 단기예보 가져오기 (0) | 2023.10.22 |
파이썬 웹 크롤링(Web Crawling) 강좌 : 3. 네이버 베스트셀러 책이름, 저자, 가격 출력하기 (0) | 2023.10.21 |
파이썬 웹 크롤링(Web Crawling) 강좌 : 1. BeautifulSoup 간단 사용법 (0) | 2023.10.21 |
시간날때마다 틈틈이 이것저것 해보며 블로그에 글을 남깁니다.
블로그의 문서는 종종 최신 버전으로 업데이트됩니다.
여유 시간이 날때 진행하는 거라 언제 진행될지는 알 수 없습니다.
영화,책, 생각등을 올리는 블로그도 운영하고 있습니다.
https://freewriting2024.tistory.com
제가 쓴 책도 한번 검토해보세요 ^^
@webnautes :: 멈춤보단 천천히라도
그렇게 천천히 걸으면서도 그렇게 빨리 앞으로 나갈 수 있다는 건.
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!