Получить атрибут кодировки мета-элемента в (X) HTML-документе с помощью xpath

#python #xpath #lxml

#python #xpath #lxml

Вопрос:

Я делаю некоторые веб-очистки материала с Python. Но, как вы знаете, некоторые веб-страницы имеют разные кодировки. Мне нужно установить кодировку этих веб-страниц. Короче говоря, для lxml, что такое шаблон xpath?

Спасибо.

Комментарии:

1. Вы спрашиваете, как получить значение content атрибута meta элемента?

2. ДА. Это то, что я ищу.

Ответ №1:

Это:

 /html/head/meta[@http-equiv='Content-Type']/@content
  

HTML5:

 /html/head/meta/@charset