Я хочу автоматически сканировать данные с 1 до 10 страниц с веб-сайта.Как я могу это сделать?

#python #python-2.7 #web-scraping #web-crawler #ipython

#python #python-2.7 #очистка веб-страниц #веб-сканер #ipython

Вопрос:

 import requests
from bs4 import BeautifulSoup
My_Url = "http://questions.consumercomplaints.in/page/2"
Data = requests.get(My_Url)
Soup = BeautifulSoup(Data.content)
head_id = Soup.find_all({"div":"href"})
len(head_id)
for i in head_id:
    print i.text

Из приведенного выше кода я удалил (отзывы / жалобы) с веб-страницы 2.
Как мне автоматически сканировать данные со всех страниц (http://questions.consumercomplaints.in/page/3 )

Ответ №1:

Почему бы не окружить вашу функцию циклом с диапазоном for?

 import requests
from bs4 import BeautifulSoup
for i in range(3,11):
    My_Url = "http://questions.consumercomplaints.in/page/"   str(i)
    Data = requests.get(My_Url)
    Soup = BeautifulSoup(Data.content)
    head_id = Soup.find_all({"div":"href"})
    len(head_id)
    for i in head_id:
        print i.text

Посмотрите, как здесь работает функция диапазона.

1. Я получаю сообщение об ошибке «не удается объединить объекты ‘str’ и ‘int'»

2. Просто нужно было ввести i в строку. Я обновил ответ.

3. Я могу проголосовать за ответ, проголосовав за тех, у кого репутация менее 15: (

Вопрос:

Ответ №1:

Комментарии:

Вам также может понравиться

kubernetes nginx перенаправляет вложенный путь к поддомену

Мой поток Python запускается, но ничего не делает

Как сделать sidenav с выпадающими элементами с помощью javafx?