#python #xml #unicode #diff #difflib
#python #xml #Юникод #разница #диффлиб
Вопрос:
Я пытаюсь создать веб-инструмент, который может визуализировать различия между двумя XML-файлами. difflib
неплохо получалось создавать html с различиями, но затем в XML-файлах появился текст в юникоде, и результирующий html теперь содержит буквы в html-кодировке.
Есть ли какой-либо другой подход к этой проблеме?
Комментарии:
1. Что не так с юникодом в вашем XML и кодированными символами html в вашем HTML? Почему это блокирует вас?
Ответ №1:
я предполагаю, что вас беспокоят «символьные объекты html», а не их числовые аналоги. вы можете повторно отобразить их, например, с помощью вашего любимого cli-инструмента, поддерживающего регулярные выражения (например, sed) и таблицы из unicode e-workers или ссылки. числовая кодировка объектов может использоваться как в html, так и в XML-файлах.
с наилучшими пожеланиями, Карстен