Как найти слова из списка слов в коде HTML / JS, хранящемся в файле .txt, с помощью программы на python?

#python #encryption

#python #шифрование

Вопрос:

Итак, я создаю программу на python для поиска определенных слов, которые могут быть скрыты в исходном коде веб-страницы. До сих пор, когда я запускаю свою программу в исходном коде, возникает эта ошибка

 a = f1.read()
  File "C:Program Files (x86)Python38-32libencodingscp1252.py", line 23, in decode
    return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 53198: character maps to <undefined>
 

Вот моя программа на python:

 with open("G:/EncredX/sourcecode.txt") as f1:
    a = f1.read()
    print(a)
if("word" in a):
    print("word")
 

Ответ №1:

Эта ошибка возникает, если файл использует другую кодировку, в то время как открытая кодировка по умолчанию будет зависеть от платформы. Используйте:

 with open("G:/EncredX/sourcecode.txt", encoding="latin1") as f1:
 

или

 with open("G:/EncredX/sourcecode.txt", encoding="utf8") as f1: