#c #xml #html-entities #tinyxml
#c #xml #html-объекты #tinyxml
Вопрос:
Я использую TinyXML для анализа некоторого XML, который содержит некоторые HTML-объекты, встроенные в текстовые узлы. Я понимаю, что TinyXML — это всего лишь анализатор XML, поэтому я не ожидаю и даже не хочу, чтобы TinyXML что-либо делал с объектами. На самом деле я хочу, чтобы он оставил их в покое.
Если у меня есть такой XML:
...
<blah>amp;uuml;</blah>
...
Вызывая Value() в экземпляре TiXmlText, я получаю:
"uuml;"
Таким образом, TinyXML, кажется, всегда удаляет амперсанд. Есть ли какой-нибудь способ заставить его оставить это в покое, чтобы оно вышло без изменений?
Ценю любые идеи..
Ответ №1:
Если вы посмотрите на документацию TinyXML, вы увидите, что он распознает только пятисимвольные объекты ( amp;uuml;
не является одним из них), плюс синтаксис кодовой точки Unicode amp;#xA0;
или amp;#160;
.
Комментарии:
1. Я вижу, что моя проблема в том, что это разрушает объекты, которые оно не понимает (удаляя амперсанд). Я хочу, чтобы он просто проходил через объекты, которые он не понимает.
2. Я подозреваю, что это ошибка, и вам, вероятно, придется обсудить это с автором. На главной веб-странице TinyXML есть ссылка на электронную почту.