Ошибка синтаксического анализа в XML: неверно сформированный (недопустимый токен)

#python #xml #xml-parsing #parse-error

#python #xml #xml-синтаксический анализ #ошибка синтаксического анализа

Вопрос:

Когда я выполнял предварительную обработку корейского корпуса, я получил эту ошибку синтаксического анализа.

Файл»/ ~/ ~/anaconda3/lib/python3.8/xml/etree/ElementTree.py «, строка 1320, в XML parser.feed(текст)

Файл «», строка неизвестна Ошибка синтаксического анализа: неправильно сформированный (недопустимый токен): строка 1, столбец 30

Я думаю, мне нужно что-то сделать с именем файла .. но я понятия не имею. Я очень спешу. Кто-нибудь может мне помочь, пожалуйста?

Комментарии:

1. Файл «<string>», строка неизвестна Ошибка синтаксического анализа: неправильно сформированный (недопустимый токен): строка 1, столбец 30 — это целая строка

2. Правильно сформированный XML-файл имеет только один корневой тег. Когда xml имеет массив тегов в корне, он неправильно сформирован. Многие xml (особенно каналы с сервера) неправильно сформированы. Для чтения файлов, которые неправильно сформированы, вам необходимо использовать XmlReader следующим образом: Настройки XmlReaderSettings = новые настройки XmlReaderSettings(); настройки. ConformanceLevel = ConformanceLevel. Фрагмент; XmlReader reader = XmlReader. Создать («имя файла», настройки);