python извлекает ссылки из RSS-канала

#python

#python

Вопрос:

Я использую URL-адрес, который http://www.sec.gov/Archives/edgar/monthly/xbrlrss-2012-02.xml и анализируем его с помощью feedparser-5.1.3 с помощью команды:

g = feedparser.parse('http://www.sec.gov/Archives/edgar/monthly/xbrlrss-2012-02.xml')

Если вы перейдете по этому URL-адресу, вы увидите, что в списке есть много zip-файлов на ссылку.

Моя цель — найти и извлечь все ссылки для zip-файлов.

Введя команду: g['feed'] в оболочке python я получаю канал.

Вебинар (слайд 8) предлагает некоторый код для этой цели, который я не могу использовать.

Выдержка, которую я поместил в этот пост:

 for item in feed.entries:
    print( item[ "summary" ], item[ "title" ], item[ "published" ] )
    try:
        # Identify ZIP file enclosure, if available
        enclosures = [ l for l in item[ "links" ] if l[ "rel" ] == "enclosure" ]
 

Как я могу это сделать?

Комментарии:

1. Измените имя с g на feed , и вы сможете использовать этот код.

2. Вы абсолютно правы! Это работает! Если вы укажете это в ответе, я немедленно отмечу его правильным.

3. Поэтому я добавляю комментарий в качестве ответа 🙂

Ответ №1:

Измените имя с g на feed , и вы сможете использовать этот код.