#python #beautifulsoup
Вопрос:
вот пример кода:
from bs4 import BeautifulSoup
import requests
import lxml
with open('bdmain.html') as html_file:
soup = BeautifulSoup(html_file, 'lxml')
print(soup)
Путь кажется правильным, я не получаю никаких сообщений об ошибках, просто по какой-то причине вообще ничего не печатается
я соскабливаю с этого сайта: https://www.metrolyrics.com/bob-dylan-lyrics.html
Комментарии:
1. Можете ли вы также добавить свой html-файл
2. вы уже получили HTML-ответ и сохранили его в свой html-файл? в противном случае вы будете работать с пустым bdmain.html файл, значит, bs4 нечего было бы анализировать?
3. это весь код, который вы используете? вы импортируете модуль запросов, но не создаете запрос GET для извлечения содержимого веб-сайта, которое хотите сохранить в виде html-файла
4. @VaibhavVishal Это неверно.
soup
Переменная также доступна послеwith
блока.5. У вас в системе установлен анализатор LXML?
Ответ №1:
Вы могли бы попробовать это,
with open('bdmain.html') as html_file:
contents = html_file.read()
soup = BeautifulSoup(contents, 'lxml')
print(soup)
Этот сайт также может быть полезен: https://zetcode.com/python/beautifulsoup/
Комментарии:
1. все равно не повезло, это не проблема с кодом, должно быть, проблема с файлом или каталогом. тьфу. проблемы с нубом