Ошибка чтения в файле feather в pyarrow — ArrowInvalid: нераспознанный тип сжатия: LZ4

#python #pyarrow #feather

#python #pyarrow #перо

Вопрос:

Я пытаюсь прочитать файл feather в Python, используя pyarrow примерно так:

 import pyarrow.feather as feather
feather.read_feather("../data/my_file.feather")
 

Однако, когда я запускаю это, я получаю следующее сообщение об ошибке:

 ArrowInvalid: Unrecognized compression type: LZ4
 

Согласно документации здесь, LZ4 поддерживается для версии 2. Я также попытался использовать feather пакет для чтения его в R, но там он сообщает мне, что файл не является файлом feather. Есть идеи, почему это происходит? Указывает ли это на то, что сам файл поврежден?

Я использую Python 3.8 и последнюю версию pyarrow (2.0.0).

Спасибо!

Комментарии:

1. Сжатие LZ4 действительно должно поддерживаться. Как вы создали файл Feather? Не могли бы вы поделиться воспроизводимым примером?

2. Спасибо за ответ, @joris. Я не создавал файл, но вы можете загрузить файл здесь ( yt_metadata_helper.feather ).

3. Спасибо за эту ссылку! Я немного исследовал, и это ошибка в pyarrow. Чтение с помощью pyarrow 1.0.0 все равно должно работать, и, надеюсь, мы сможем исправить это вовремя для предстоящего выпуска pyarrow 3.0.0. Я сообщил об этом как issues.apache.org/jira/browse/ARROW-11163