#json #pandas #python-2.7 #encoding
#json #pandas #python-2.7 #кодирование
Вопрос:
Я пытаюсь прочитать файл json, но я извлекаю ошибку ValueError: недопустимый октет в последовательности UTF-8 при декодировании ‘string’
Я использую следующий код для его чтения:
df1 = pd.read_json('input/201704_Usage_Bicimad.json', lines=True)
Файл Json может быть удален из:
https://opendata.emtmadrid.es/Datos-estaticos/Datos-generales -(1) просто нажмите на «Datos de uso de Abril de 2017», чтобы загрузить его
Я пробовал изменять соответствующие форматы:
df1 = pd.read_json('input/201704_Usage_Bicimad.json', lines=True, encoding="iso-8859-1")
df1 = pd.read_json('input/201704_Usage_Bicimad.json', lines=True, encoding="latin-1")
df1 = pd.read_json('input/201704_Usage_Bicimad.json', lines=True, encoding="utf-8-sig")
Во всех случаях извлекается одна и та же ошибка
Не представляю, как действовать дальше, как определить правильный формат кодировки или как идентифицировать символ, который вызывает у меня проблемы
Обновление: После получения некоторых комментариев я протестировал в Python 3, и это работает. Дело в том, что мне нужно, чтобы он работал на Python 2.7
Комментарии:
1. Я не могу воспроизвести вашу ошибку. У меня файл читается нормально с помощью
python 3.6.5
иpandas 0.24.2
2. Я использую Python 2.7
3. Какой формат кодировки вы используете?
4. Просто значение по умолчанию — utf8 — считывается с
pd.read_json('input/201704_Usage_Bicimad.json', lines=True)
5. пробовал с python 2.7?