#python #html #python-3.x #parsing #lxml
Вопрос:
from lxml import html import requests for i in range(1,2): page = requests.get('https://www.test.com/Company/{}'.format(i)) tree = html.fromstring(page.content) if tree.xpath('//td[@class="error-text"]/text()', encoding="UTF-8"): print("Yes") else: company = tree.xpath('//div[@id="CompanyNameBox"]/text()') print(company) print("Not")
Это мой код , в котором я анализирую данные с веб-сайта , когда я анализирую company
, вывод
['áx83x90áx83x9aáx83x92áx83x9dáx83xa0áx83x98áx83x97áx83x9báx83x98']
оригинальный вывод должен быть ალგორითმი
, это грузинский текст.
Комментарии:
1. Похоже, вы упускаете
encoding
аргумент в одном из своих звонковxpath
.2.
xpath()
Метод не принимаетencoding
параметр. Это отвлекающий маневр.