Синтаксический анализ XHTML с использованием SAX для изменения только PCDATA

#java #parsing #xhtml #sax #tag-soup

#java #синтаксический анализ #xhtml #sax #tag-soup

Вопрос:

Я ищу пример использования синтаксического анализатора Sax для анализа строки XHTML и изменения каждого отдельного вхождения строки (s1) на (s2), если s1 находится в атрибутах PCDATA not. Может кто-нибудь пролить свет на это….

Спасибо!

Ответ №1:

Вы бы просто реализовали

 characters(char[] ch, int start, int length) 
  

метод ContentHandler и найдите s1 и замените на s2.

Конечно, это предполагает, что ваш обработчик содержимого выводит xml в некоторый поток.

Судя по вашему описанию, на самом деле вы, вероятно, хотите использовать XMLFilter для изменения потока xml на месте.