Почему я не могу распечатать свой html — файл в beautifulsoup?

#python #beautifulsoup

Вопрос:

вот пример кода:

 from bs4 import BeautifulSoup
import requests
import lxml

with open('bdmain.html') as html_file:
     soup = BeautifulSoup(html_file, 'lxml')

print(soup)
 

Путь кажется правильным, я не получаю никаких сообщений об ошибках, просто по какой-то причине вообще ничего не печатается

я соскабливаю с этого сайта: https://www.metrolyrics.com/bob-dylan-lyrics.html

Комментарии:

1. Можете ли вы также добавить свой html-файл

2. вы уже получили HTML-ответ и сохранили его в свой html-файл? в противном случае вы будете работать с пустым bdmain.html файл, значит, bs4 нечего было бы анализировать?

3. это весь код, который вы используете? вы импортируете модуль запросов, но не создаете запрос GET для извлечения содержимого веб-сайта, которое хотите сохранить в виде html-файла

4. @VaibhavVishal Это неверно. soup Переменная также доступна после with блока.

5. У вас в системе установлен анализатор LXML?

Ответ №1:

Вы могли бы попробовать это,

 with open('bdmain.html') as html_file:
    contents = html_file.read()

    soup = BeautifulSoup(contents, 'lxml')

    print(soup)
 

Этот сайт также может быть полезен: https://zetcode.com/python/beautifulsoup/

Комментарии:

1. все равно не повезло, это не проблема с кодом, должно быть, проблема с файлом или каталогом. тьфу. проблемы с нубом