Почему я не могу распечатать свой html - файл в beautifulsoup?

#python #beautifulsoup

Вопрос:

вот пример кода:

 from bs4 import BeautifulSoup
import requests
import lxml

with open('bdmain.html') as html_file:
     soup = BeautifulSoup(html_file, 'lxml')

print(soup)

Путь кажется правильным, я не получаю никаких сообщений об ошибках, просто по какой-то причине вообще ничего не печатается

я соскабливаю с этого сайта: https://www.metrolyrics.com/bob-dylan-lyrics.html

1. Можете ли вы также добавить свой html-файл

2. вы уже получили HTML-ответ и сохранили его в свой html-файл? в противном случае вы будете работать с пустым bdmain.html файл, значит, bs4 нечего было бы анализировать?

3. это весь код, который вы используете? вы импортируете модуль запросов, но не создаете запрос GET для извлечения содержимого веб-сайта, которое хотите сохранить в виде html-файла

4. @VaibhavVishal Это неверно. soup Переменная также доступна после with блока.

5. У вас в системе установлен анализатор LXML?

Ответ №1:

Вы могли бы попробовать это,

 with open('bdmain.html') as html_file:
    contents = html_file.read()

    soup = BeautifulSoup(contents, 'lxml')

    print(soup)

Этот сайт также может быть полезен: https://zetcode.com/python/beautifulsoup/

Почему я не могу распечатать свой html — файл в beautifulsoup?

Вопрос:

Комментарии:

Ответ №1:

Комментарии:

Вопрос:

Комментарии:

Ответ №1:

Комментарии:

Вам также может понравиться

Не удается сопоставить единицу с нулем или одним отношением

Тема WordPress, у которой фон липкий, а содержимое подвижное

Как вычесть и разделить значения в скрипте bash, а также я хотел бы знать в виде процентов