Анализ XML с помощью Minidom на Python

DOM (объектная модель документа) — это кросс-языковой API от W3C, т. е. консорциума World Wide Web для доступа и изменения XML — документов. Python позволяет анализировать XML-файлы с помощью xml.dom.minidom, который является минимальной реализацией интерфейса DOM. Это проще, чем полный DOM API, и его следует рассматривать как меньший.

Шаги для анализа XML следующие:

Импортируйте модуль

import xml.dom.minidom

Допустим, ваши XML-файлы будут содержать следующие данные:

Используйте функцию синтаксического анализа для загрузки и анализа XML-файла. В приведенном ниже случае в документах хранится результат функции синтаксического анализа

docs = xml.dom.minidom.parse("test.xml")

Давайте напечатаем имя дочернего тега и имя узла XML — файла.

import xml.dom.minidom

docs = xml.dom.minidom.parse("test.xml")

print(docs.nodeName)
print(docs.firstChild.tagName)

Выход:

#document info

Теперь, чтобы получить информацию из имени тега, вам нужно вызвать стандартную функцию dom getElementsByTagName и Атрибут getAttribute для получения необходимых атрибутов.

import xml.dom.minidom


docs = xml.dom.minidom.parse("test.xml")

print(docs.nodeName)
print(docs.firstChild.tagName)

skills = docs.getElementsByTagName("skills")

print("%d skills" % skills.length)
for i in skills:
	print(i.getAttribute("name"))

Выход:

#document
info
4 skills
Machine learning
Deep learning
Python
Bootstrap

Шаги для анализа XML следующие:

Выход:

Выход:

Вам также может понравиться

Регулярные выражения в Python – Набор 2 (Поиск, сопоставление и Поиск всех)

Графический интерфейс Python – tkinter

__init__ in Python

init in Python