Веб-создание на Python: BeautifulSoup не показывает все html-страницы

#python #web-scraping #amazon

#питон #соскабливание паутины #амазонка

Вопрос:

Я новичок в веб-скребке. Я пытался очистить разные страницы результатов Amazon soup.find('ul', {'class': 'a-pagination'}) и выбрать следующую страницу ('li', {'class': 'a-last'}) , но каждый раз я получаю максимум 2-3 страницы, даже если страниц 100, если мы проверяем вручную.

 fileURLs = open("out.txt","w") s = HTMLSession()  url = 'https://www.amazon.co.uk/product-reviews/B07H11WXL4/ref=acr_dp_hist_5?ie=UTF8amp;filterByStar=five_staramp;reviewerType=all_reviews#reviews-filter-bar'  def getdata(url):  r = s.get(url)  soup = BeautifulSoup(r.text, 'html.parser')  #sleep(10) return soup  def getURLs(soup):  page = soup.find('ul', {'class': 'a-pagination'})  if page:  if page.find('li', {'class': 'a-last'}):  url = 'http://www.amazon.co.uk'   str(page.find('li', {'class': 'a-last'}).find('a')['href'])  return url  else:  return  while True:  fileURLs.write(url   'n')  soup = getdata(url)  url = getURLs(soup)  if not url:  break

Пожалуйста, дайте мне знать, что я делаю не так. ТИА

Вопрос:

Вам также может понравиться

map.fire(«Пользовательское событие»); Как запустить пользовательское событие в листовке?

Как получить доступ к папке внешнего сервера из контейнера spring boot docker?

Не удалось преобразовать изображение SVG в холст 3.0.7