#python #google-chrome #web
Вопрос:
Я пытаюсь извлечь несколько абзацев с новостного сайта, используя расширение для очистки веб-страниц, но оно захватывает только первый абзац.
Комментарии:
1. Пожалуйста, укажите код, с которым у вас возникли проблемы, или, в качестве альтернативы, имя расширения, чтобы можно было устранить неполадки. Без этой информации невозможно ответить на вопрос, спасибо!
2. извините, что отвечаю очень поздно… это имя расширения — Веб — скребок-Бесплатная очистка веб-страниц, предлагаемая: webscraper.io
3. Мы не поддерживаем расширения. Вы отметили вопрос с помощью Python, поэтому, если вы написали код на Python, покажите его
Ответ №1:
Базовая очистка веб-страниц работает на одной странице, не зная, какое расширение вы используете и как кодируется веб-сайт, который просматривается, а также расширение.
Предпочитаю Ссылку на библиотеку Python — beautifulsoup, Если библиотека ссылок Java — Jsoup
Базовый учебник по Python — https://www.youtube.com/watch?v=0_VZ7NpVw1Y
Бывают случаи, когда вам нужно обработать его с помощью Javascript, И, что более важно, в Chrome есть переменная localStorage размером 5 МБ, которую вы можете использовать для сеанса, хранения данных, добавления строк таблицы и т. Д.
Комментарии:
1. я использую веб — скребок Без скребка, предлагаемый: webscraper.io