#html #python-3.x
Вопрос:
Мне нужен «фрагмент кода» (или как вы их называете), который выводит все слова внутри определенного html-класса, не тега, а класса.
<h1 class="example">Hello people!</h1>
Допустим, по какой-то причине HTML веб-сайта выглядел только так, мне понадобится код, который мог бы распечатать то, что находится внутри тега H1, но только с классом. Я пытался исследовать это, но не получил ничего, что помогло бы (хотя я плохо разбираюсь в исследованиях).
Спасибо.
Ответ №1:
BeautifulSoup может сделать это за вас
from bs4 import BeautifulSoup
import requests
html_doc = '<h1 class="example">Hello people!</h1>'
# or, if you need to get the content from an http endpoint
# html_doc = requests.get(url_to_source).text
soup = BeautifulSoup(html_doc, 'html.parser')
for heading in soup.find_all(attrs={"class": "example"}):
print(heading.string)
Комментарии:
1. Спасибо! Это почти именно то, что я хочу, но, похоже, Красивый суп не подходит для HTTP-клиента. Просто мне нужно было бы взять какой-нибудь случайный класс из случайного примера веб-сайта. html.am/templates/downloads/bryantsmith/greenblade . Как я должен делать запросы, чтобы накормить его Красивым Супом?