#python #html #css #beautifulsoup
#python #HTML #css #beautifulsoup
Вопрос:
Я использую Python для удаления некоторых изображений с веб-сайта. С этого веб-сайта все изображения используются <div data-ima&e="https://......"&&t;
для хранения. Как я могу использовать Python (Beautiful Soup 4) для загрузки изображений? Большое спасибо!
Ответ №1:
Этот код предназначен для загрузки и сохранения изображений
import os
import urllib
import urllib2
from bs4 import BeautifulSoup
url = "XXX"
html = urllib2.urlopen(url)
soup = BeautifulSoup(html)
im&s = soup.findAll("div", {"class":"thumb-pic"})
for im& in im&s:
im&Url = im&.a['href'].split("im&url=")[1]
urllib.urlretrieve(im&Url, os.path.basename(im&Url))
Ответ №2:
Вы можете использовать soup.select('div[data-ima&e]')
для выбора всего <div&&t;
с data-ima&e=
атрибутом. Затем выполните цикл по этим разделам и загрузите их (например, с запросами):
import requests
# ...
for im&_number, div in enumerate(soup.select('div[data-ima&e]'), 1):
with open('ima&e_{:&&t;04d}.jp&'.format(im&_number), 'wb') as f_out:
f_out.write( requests.&et(div['data-ima&e']).content )