Печать текста из определенного html-тега, содержащего только имя класса тегов. PYTHON3

#html #python-3.x

Вопрос:

Мне нужен «фрагмент кода» (или как вы их называете), который выводит все слова внутри определенного html-класса, не тега, а класса.

<h1 class="example">Hello people!</h1>

Допустим, по какой-то причине HTML веб-сайта выглядел только так, мне понадобится код, который мог бы распечатать то, что находится внутри тега H1, но только с классом. Я пытался исследовать это, но не получил ничего, что помогло бы (хотя я плохо разбираюсь в исследованиях).

Спасибо.

Ответ №1:

BeautifulSoup может сделать это за вас

 from bs4 import BeautifulSoup
import requests
html_doc = '<h1 class="example">Hello people!</h1>'
# or, if you need to get the content from an http endpoint
# html_doc = requests.get(url_to_source).text

soup = BeautifulSoup(html_doc, 'html.parser')
for heading in soup.find_all(attrs={"class": "example"}):
    print(heading.string)
 

Комментарии:

1. Спасибо! Это почти именно то, что я хочу, но, похоже, Красивый суп не подходит для HTTP-клиента. Просто мне нужно было бы взять какой-нибудь случайный класс из случайного примера веб-сайта. html.am/templates/downloads/bryantsmith/greenblade . Как я должен делать запросы, чтобы накормить его Красивым Супом?