выбор значений атрибутов из lxml

#python #python-2.7 #attributes #lxml

#python #python-2.7 #атрибуты #lxml

Вопрос:

Я хочу использовать выражение xpath для получения значения атрибута.

Я ожидал, что сработает следующее

 from lxml import etree

for customer in etree.parse('file.xml').getroot().findall('BOB'):
    print customer.find('./@NAME')
  

но это выдает ошибку :

 Traceback (most recent call last):
  File "bob.py", line 22, in <module>
    print customer.find('./@ID')
  File "lxml.etree.pyx", line 1409, in lxml.etree._Element.find (src/lxml/lxml.etree.c:39972)
  File "/usr/local/lib/python2.7/dist-packages/lxml/_elementpath.py", line 272, in find
    it = iterfind(elem, path, namespaces)
  File "/usr/local/lib/python2.7/dist-packages/lxml/_elementpath.py", line 262, in iterfind
    selector = _build_path_iterator(path, namespaces)
  File "/usr/local/lib/python2.7/dist-packages/lxml/_elementpath.py", line 246, in _build_path_iterator
    selector.append(ops[token[0]](_next, token))
KeyError: '@'
  

Ошибаюсь ли я, ожидая, что это сработает?

Ответ №1:

find и findall реализуйте только подмножество XPath. Их наличие предназначено для обеспечения совместимости с другими реализациями ElementTree (такими как ElementTree и cElementTree ).

xpath Метод, напротив, обеспечивает полный доступ к XPath 1.0:

 print customer.xpath('./@NAME')[0]
  

Однако вместо этого вы могли бы использовать get :

 print customer.get('NAME')
  

или attrib :

 print customer.attrib['NAME']
  

Комментарии:

1. Правильно, но если вы хотите «официально» предпочтительный способ: используйте customer.get('NAME') (см. docs.python.org/library /… )

2. таким образом, нет прямого способа получить значение!

Ответ №2:

В качестве возможного полезного дополнения, это способ получения значения атрибута в случае, если элемент имеет более одного, и это единственное отличие по отношению к другому элементу. Например, учитывая следующее file.xml:

 <?xml version ="1.0" encoding="UTF-8"?>
    <level1>
      <level2 first_att='att1' second_att='foo'>8</level2>
      <level2 first_att='att2' second_att='bar'>8</level2>
    </level1>
  

Можно получить доступ к атрибуту ‘bar’ с помощью:

 import lxml.etree as etree
tree = etree.parse("test_file.xml")
print tree.xpath("//level1/level2[@first_att='att2']/@second_att")[0]