UFT-8 Python LXML HTMl - ProgramBox

ProgramBox

UFT-8 Python LXML HTMl

Post author:admin
Запись опубликована:5 января, 2022
Post category:Вопросы по программированию

#python #html #python-3.x #parsing #lxml

Вопрос:

 from lxml import html import requests   for i in range(1,2):  page = requests.get('https://www.test.com/Company/{}'.format(i))  tree = html.fromstring(page.content)  if tree.xpath('//td[@class="error-text"]/text()', encoding="UTF-8"):  print("Yes")  else:  company = tree.xpath('//div[@id="CompanyNameBox"]/text()')  print(company)  print("Not")

Это мой код , в котором я анализирую данные с веб-сайта , когда я анализирую company , вывод

 ['áx83x90áx83x9aáx83x92áx83x9dáx83xa0áx83x98áx83x97áx83x9báx83x98']

оригинальный вывод должен быть ალგორითმი , это грузинский текст.

Комментарии:

1. Похоже, вы упускаете encoding аргумент в одном из своих звонков xpath .

2. xpath() Метод не принимает encoding параметр. Это отвлекающий маневр.

Метки: UFT-8 Python LXML HTMl