Разница в XML с Unicode с использованием python

#python #xml #unicode #diff #difflib

#python #xml #Юникод #разница #диффлиб

Вопрос:

Я пытаюсь создать веб-инструмент, который может визуализировать различия между двумя XML-файлами. difflib неплохо получалось создавать html с различиями, но затем в XML-файлах появился текст в юникоде, и результирующий html теперь содержит буквы в html-кодировке.

Есть ли какой-либо другой подход к этой проблеме?

Комментарии:

1. Что не так с юникодом в вашем XML и кодированными символами html в вашем HTML? Почему это блокирует вас?

Ответ №1:

я предполагаю, что вас беспокоят «символьные объекты html», а не их числовые аналоги. вы можете повторно отобразить их, например, с помощью вашего любимого cli-инструмента, поддерживающего регулярные выражения (например, sed) и таблицы из unicode e-workers или ссылки. числовая кодировка объектов может использоваться как в html, так и в XML-файлах.

с наилучшими пожеланиями, Карстен