Как успешно очистить веб-страницу для ссылок в заголовках, используя газету

#python

Вопрос:

Я пытаюсь очистить ссылки на заголовки на finviz.com использование библиотеки Python под названием newspaper. Я успешно очищаю ссылки на реальном веб-сайте, но когда я ищу конкретную компанию, она оказывается пустой.

Вот пример моего кода.

     import newspaper
    news_site = newspaper.build("https://finviz.com/")
    news_site.article_urls()

Приведенный выше код работает довольно хорошо и дал мне то, что я хочу, но когда я использую приведенный ниже код, он выводит пустой список вместо списка всех ссылок на заголовки.

     import newspaper
    news_site = newspaper.build("https://finviz.com/quote.ashx?t=GOOGL")
    news_site.article_urls()

Единственное отличие здесь в том, что я ищу новости, связанные с акциями GOOGL, и пытаюсь получить все эти ссылки.

Что я могу сделать по-другому, чтобы я мог получить список ссылок в заголовках по этой ссылке.

     https://finviz.com/quote.ashx?t=GOOGL

Пример кода тоже будет полезен, спасибо

Ответ №1:

Используйте этот фрагмент, он работает на моей машине

 import newspaper
news_site = newspaper.build("https://finviz.com/quote.ashx?t=GOOGL",memoize_articles=False, fetch_images=False)
news_site.article_urls()

Вопрос:

Ответ №1:

Комментарии:

Вам также может понравиться

Ошибка строки списка параметров, специфичных для AWS, и EC2 SecurityGroupIds

Как передать данные из класса фрагмента в действие

Как правильно отправить пользовательское сообщение на сервер после некоторого события в OMNET