#python #html
Вопрос:
У меня есть HTML-страница, на которой есть такие операторы, как <,>,amp;,=,===,»,‘<,> а также будет некоторое нежелательное пространство до и после этих операторов. Я хочу проанализировать эти символы/операторы и ненужное пространство . есть некоторые библиотеки, такие как
cgi parse, beautifulsoup ,html parser
для достижения этих целей, но использование этой библиотеки ограничено только операторами<,>,amp;. эти операторы используются в функциях и других сущностях для выполнения некоторых задач, которые являются частью файла iHTML
ниже приведена одна из ошибок, когда я пытаюсь использовать любую из вышеперечисленных библиотек для достижения этих
Сообщение синтаксического анализатора: Неожиданный символ » (код 32) в содержимом после ‘
Как я могу выполнить синтаксический анализ для других символов/операторов с помощью python
Ниже приведены некоторые примеры из HTML-файла
1. function toArray(iter) { if (iter === null) { return null; } 2. let i = 0; i < filterItems.length; i