Не удается прочитать файл xport в python с помощью xport

#python-3.x

#python-3.x

Вопрос:

Я пытаюсь прочитать большой файл .xpt в python. Я попытался использовать библиотеку xport, но получаю следующую ошибку

 with open('C:/Users/matth/OneDrive/Documents/Data Science/TrCount/LLCP2019.XPT', 'rb') as f:
    library = xport.v56.load(f)
  

Ошибка значения: имена полей не могут начинаться с подчеркивания: ‘_STATE’

Оказывается, многие имена полей начинаются с символа подчеркивания. Очевидные (для меня) решения, такие как замена символов подчеркивания пробелами, пробелами или случайной буквой, приводят только к другой ошибке

 --> 793             raise ValueError('Neither zero nor NaN: %r' % ibm)
    794 
    795     # IBM-format exponent is base 16, so the mantissa can have up to 3

ValueError: Neither zero nor NaN: b'(x00x00x00x00x00x00x00'
  

Я не уверен, почему это происходит. Сам файл огромен. Исходный файл находится здесь

Ответ №1:

Я перепробовал кучу разных пакетов и библиотек на python и R и, наконец, получил пакет haven в R для работы.