#python #xml #python-3.x #xml-parsing #httprequest
#python #xml #python-3.x #xml-синтаксический анализ #httprequest
Вопрос:
Это мой XML-ответ на http
запрос
<?xml version="1.0" encoding="UTF-8"?>
<Dataset name="aggregations/g/ds083.2/2/TP"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns="http://xml.opendap.org/ns/DAP2"
xsi:schemaLocation="http://xml.opendap.org/ns/DAP2
http://xml.opendap.org/dap/dap2.xsd" >
<Attribute name="NC_GLOBAL" type="Container">
<Attribute name="Originating_or_generating_Center" type="String">
<value>US National Weather Service, National Centres for Environmental Prediction (NCEP)</value>
</Attribute>
<Attribute name="Originating_or_generating_Subcenter" type="String">
<value>0</value>
</Attribute>
<Attribute name="GRIB_table_version" type="String">
<value>2,1</value>
</Attribute>
<Attribute name="Type_of_generating_process" type="String">
<value>Forecast</value>
</Attribute>
<Attribute name="Analysis_or_forecast_generating_process_identifier_defined_by_originating_centre" type="String">
<value>Analysis from GDAS (Global Data Assimilation System)</value>
</Attribute>
<Attribute name="file_format" type="String">
<value>GRIB-2</value>
</Attribute>
<Attribute name="Conventions" type="String">
<value>CF-1.6</value>
</Attribute>
<Attribute name="history" type="String">
<value>Read using CDM IOSP GribCollection v3</value>
</Attribute>
<Attribute name="featureType" type="String">
<value>GRID</value>
</Attribute>
<Attribute name="_CoordSysBuilder" type="String">
<value>ucar.nc2.dataset.conv.CF1Convention</value>
</Attribute>
</Attribute>
<Array name="time1">
<Attribute name="units" type="String">
<value>Hour since 2007-12-06T12:00:00Z</value>
</Attribute>
<Attribute name="standard_name" type="String">
<value>time</value>
</Attribute>
<Attribute name="long_name" type="String">
<value>GRIB forecast or observation time</value>
</Attribute>
<Attribute name="calendar" type="String">
<value>proleptic_gregorian</value>
</Attribute>
<Attribute name="_CoordinateAxisType" type="String">
<value>Time</value>
</Attribute>
<Float64/>
<dimension name="time1" size="10380"/>
</Array>
</Dataset>
Я пытаюсь проанализировать это содержимое XML с помощью Python 3.5
from xml.etree import ElementTree
response = requests.get("http://rda.ucar.edu/thredds/dodsC/aggregations/g/ds083.2/2/TP.ddx?time1")
tree = ElementTree.fromstring(response.content)
attr = tree.find("Attribute")
print(attr)
Когда я печатаю это, я получаю None
. Что я делаю не так? Я также хочу получить доступ к тегу «Array», но он также возвращается None
.
Комментарии:
1. Я вижу, что сам ваш ответ таков: «<Ответ [404]>» . Вы уверены, что сервер возвращает правильный xml?
2. @kmario23 — это так. XML, который я опубликовал, является результатом выполнения этого запроса.
3. в URL-адресе запроса была опечатка. Я только что нашел его и исправил.
4. @kmario23 — круто ! Это была ошибка с моей стороны! Вы, конечно, правильно указали правильный URL.
Ответ №1:
Как указано в документе, из-за xmlns="http://xml.opendap.org/ns/DAP2"
атрибута корневого тега Dataset все имена тегов, которые вы ищете, должны иметь префикс {http://xml.opendap.org/ns/DAP2}
.
# should find something
tree.find("{http://xml.opendap.org/ns/DAP2}Attribute")
Чтение этого раздела документа ElementTree также покажет вам, как сделать что-то более читаемым с помощью словаря пространств имен.
Ответ №2:
XML-документ использует пространства имен, поэтому вам необходимо поддерживать это в своем коде. В etree
документации есть объяснение и пример кода.
В принципе, вы можете сделать это:
import requests
from xml.etree import ElementTree
response = requests.get('http://rda.ucar.edu/thredds/dodsC/aggregations/g/ds083.2/2/TP.ddx?time1')
tree = ElementTree.fromstring(response.content)
attr = tree.find("{http://xml.opendap.org/ns/DAP2}Attribute")
>>> print(attr)
<Element '{http://xml.opendap.org/ns/DAP2}Attribute' at 0x7f147a292458>
# or declare the namespace like this
ns = {'dap2': 'http://xml.opendap.org/ns/DAP2'}
attr = tree.find("dap2:Attribute", ns)
>>> print(attr)
<Element '{http://xml.opendap.org/ns/DAP2}Attribute' at 0x7f147a292458>