En dash / Em dash нарушает форматирование текстового файла при попытке чтения в cmd Короткое тире короткое тире

#python #formatting #windows-10

#python #форматирование #windows-10

Вопрос:

Я пытаюсь управлять текстовым файлом, который использует короткое тире, но cmd считывает его как – . Тире также имеют неправильное форматирование и отображаются в виде — Самое смешное, что если я использую оба символа внутри скрипта (.пы файл) и связать его с print командой, все отображается правильно. В интерпретаторе тоже никаких проблем вообще нет. Есть ли какой-либо способ заставить его распознавать эти символы перед импортом файла? Спасибо!

Ответ №1:

Мне больше не нужна помощь в этом, поскольку я смог разобраться самостоятельно, но я оставляю это здесь, поскольку это может помочь другим в будущем.

Проблема заключалась в том, что py открывал файл как ANSI, в то время как из-за специальных символов файл должен был быть открыт как UTF-8. ………. короткое замыкание……….. короткое тире. Таким образом, добавление encoding='utf-8' при вызове open функции решило проблему.