Определить размер изображения в HTML, используя python

#python #html #css #image

#python #HTML #css — файл #изображение #css

Вопрос:

Я пытаюсь реализовать функциональность, аналогичную предварительному просмотру миниатюр Facebook. Идея заключается в том, что пользователь вводит URL-адрес продукта и выбирает лучшее изображение этого продукта.

Чтобы отфильтровать изображения, которые явно не являются продуктом, я хочу отфильтровать их на основе высоты и ширины > 150 пикселей.

Я использую python и BeautifulSoup для загрузки HTML и извлечения изображений, но не могу найти способ получить высоту или ширину, когда это указано в CSS.

Ответ №1:

GD — это библиотека, которая существует уже довольно давно, и у нее довольно простой интерфейс для работы … Вот ссылка на GD

Смотрите метод «размер», чтобы получить ширину и высоту.

Редактировать

Ах, как насчет этого?

  1. Проанализируйте содержимое HTML и извлеките URL-адреса файлов CSS и встроенных стилей
  2. Загрузите CSS-файл (ы) и проанализируйте CSS-файлы по порядку, создав набор правил CSS.
  3. Затем проанализируйте оставшуюся часть HTML с шага 1, собрав IMG-теги, и если у IMG-тега есть class имя, найдите имя класса в ваших правилах CSS и проверьте наличие width или height .

Может показаться немного сложным, но я уверен, что загрузить несколько таблиц стилей CSS намного проще, чем загружать изображения и использовать библиотеку изображений на стороне сервера.

Комментарии:

1. Спасибо, Марк. Я надеялся найти что-то, что не потребовало бы от меня загрузки и обработки каждого изображения, но, возможно, мне придется согласиться.