#python #python-2.7 #web-scraping #web-crawler #ipython
#python #python-2.7 #очистка веб-страниц #веб-сканер #ipython
Вопрос:
import requests
from bs4 import BeautifulSoup
My_Url = "http://questions.consumercomplaints.in/page/2"
Data = requests.get(My_Url)
Soup = BeautifulSoup(Data.content)
head_id = Soup.find_all({"div":"href"})
len(head_id)
for i in head_id:
print i.text
Из приведенного выше кода я удалил (отзывы / жалобы) с веб-страницы 2.
Как мне автоматически сканировать данные со всех страниц (http://questions.consumercomplaints.in/page/3 )
Ответ №1:
Почему бы не окружить вашу функцию циклом с диапазоном for?
import requests
from bs4 import BeautifulSoup
for i in range(3,11):
My_Url = "http://questions.consumercomplaints.in/page/" str(i)
Data = requests.get(My_Url)
Soup = BeautifulSoup(Data.content)
head_id = Soup.find_all({"div":"href"})
len(head_id)
for i in head_id:
print i.text
Посмотрите, как здесь работает функция диапазона.
Комментарии:
1. Я получаю сообщение об ошибке «не удается объединить объекты ‘str’ и ‘int'»
2. Просто нужно было ввести i в строку. Я обновил ответ.
3. Я могу проголосовать за ответ, проголосовав за тех, у кого репутация менее 15: (