#python #xpath #web-crawler #lxml
Вопрос:
p[0] — это дерево lxml.etree._Элемент. Когда я использую [2:] на p[0], он становится списком, поэтому я не могу снова использовать XPath. Итак, как я могу удалить 2 передних элемента в p[0], не превращая их в список?
root = etree.HTML(res.text) p = root.xpath('//div[@id="J"]/p') p = p[0][2:].xpath('string(.)')
Ошибка атрибута: объект «список» не имеет атрибута «xpath»
Комментарии:
1. Вы хотите получить текст из абзацев (начиная с третьего), все из которых являются детьми
div[@id="J"]
?2. Я хочу добраться от третьего до конца, поэтому я использую [2:]
3. Можете ли вы отредактировать вопрос и показать, как
p
он выглядит?4. p-это просто [p[0]], а p[0] — это дерево lxml.etree. _Элемент.