#python-3.x
#python-3.x
Вопрос:
Я пытаюсь прочитать большой файл .xpt в python. Я попытался использовать библиотеку xport, но получаю следующую ошибку
with open('C:/Users/matth/OneDrive/Documents/Data Science/TrCount/LLCP2019.XPT', 'rb') as f:
library = xport.v56.load(f)
Ошибка значения: имена полей не могут начинаться с подчеркивания: ‘_STATE’
Оказывается, многие имена полей начинаются с символа подчеркивания. Очевидные (для меня) решения, такие как замена символов подчеркивания пробелами, пробелами или случайной буквой, приводят только к другой ошибке
--> 793 raise ValueError('Neither zero nor NaN: %r' % ibm)
794
795 # IBM-format exponent is base 16, so the mantissa can have up to 3
ValueError: Neither zero nor NaN: b'(x00x00x00x00x00x00x00'
Я не уверен, почему это происходит. Сам файл огромен. Исходный файл находится здесь
Ответ №1:
Я перепробовал кучу разных пакетов и библиотек на python и R и, наконец, получил пакет haven в R для работы.