Android SAXParser прерывается из-за символа, подобного апострофу

#java #android

#java #Android

Вопрос:

У меня проблема с SAXParser в Android.

В RSS-ленте, которую я пытаюсь проанализировать, есть символ ’ (это не стандартный апостроф, а тот, который наклонен, противоположен обратному значку) в разделе CDATA, независимо от этого я получаю ошибку синтаксического анализатора:

В строке 212, столбец 26: неправильно сформированный (недопустимый токен)

Ответ №1:

Конечно, может быть ошибка в библиотеке, но сначала проверьте, позволяет ли кодировка XML содержать этот символ в незашифрованном виде (т. Е. Я бы ожидал, что он будет многобайтовым для UTF-8). Возможно, анализатор прав.

PS Этот символ? Это не должно быть обычным текстом.

Комментарии:

1. Да, это тот, я согласен, что обычно это не допускается, но в CDATA это должно быть.

2. Убедитесь, что оба xml-файла записаны в формате UTF-8 и что вы открываете файл с помощью программы чтения в кодировке UTF-8.