Выделение объекта очистки Beautifulsoup

#beautifulsoup

#прекрасный суп

Вопрос:

Я пытаюсь разобраться с помощью Beautifulsoup и новичок в этом, мне нужны строки таблицы, как вы видите, введите описание изображения здесь. Таблицы поступают из reactapp, а затем отображаются на веб-сайте. Мне нужно предложение, как это сделать. Я изо всех сил пытаюсь создать объект beautifulsoup и не знаю, какой фактический класс нужно использовать, чтобы получить доступ к строкам таблицы и их содержимому.

 webpage = urlopen(req).read()
soup = bs(webpage, "html.parser")
table=soup.find('table', {'class': 'equity'})
rows=list()
for row in table.findAll("tr"):
     rows.append(row)

Нужна ваша помощь, очень ценю, с трудом справляюсь с этим!

Ответ №1:

Вы можете захватить td элементы с помощью этого кода:

 webpage = urlopen(req).read()
soup = bs(webpage, "lxml")
table=soup.find('table', {'class': 'table'}).find('tr')
rows=list()
for row in table.findAll("td"):
     rows.append(row)

Я предпочел использовать lxml в качестве синтаксического анализатора, потому что у него есть некоторые преимущества, но вы можете продолжать использовать html.parser

Вы также можете использовать pandas , он создаст, это намного проще узнать из его документации (их много).

Вопрос:

Ответ №1:

Вам также может понравиться

Django, обновление базы данных, юг и sqliteman: подтверждение. На самом деле это не вопрос. Это лучше?

Как я могу подключить свои собственные данные TZ?

Как построить промежуточные слои при прогнозировании изображения с использованием Keras и TensorFlow