TinyXML и сохранение HTML-объектов

#c #xml #html-entities #tinyxml

#c #xml #html-объекты #tinyxml

Вопрос:

Я использую TinyXML для анализа некоторого XML, который содержит некоторые HTML-объекты, встроенные в текстовые узлы. Я понимаю, что TinyXML — это всего лишь анализатор XML, поэтому я не ожидаю и даже не хочу, чтобы TinyXML что-либо делал с объектами. На самом деле я хочу, чтобы он оставил их в покое.

Если у меня есть такой XML:

 ...
<blah>amp;uuml;</blah>
...
  

Вызывая Value() в экземпляре TiXmlText, я получаю:

 "uuml;"
  

Таким образом, TinyXML, кажется, всегда удаляет амперсанд. Есть ли какой-нибудь способ заставить его оставить это в покое, чтобы оно вышло без изменений?

Ценю любые идеи..

Ответ №1:

Если вы посмотрите на документацию TinyXML, вы увидите, что он распознает только пятисимвольные объекты ( amp;uuml; не является одним из них), плюс синтаксис кодовой точки Unicode amp;#xA0; или amp;#160; .

Комментарии:

1. Я вижу, что моя проблема в том, что это разрушает объекты, которые оно не понимает (удаляя амперсанд). Я хочу, чтобы он просто проходил через объекты, которые он не понимает.

2. Я подозреваю, что это ошибка, и вам, вероятно, придется обсудить это с автором. На главной веб-странице TinyXML есть ссылка на электронную почту.