#python #pyarrow #feather
#python #pyarrow #перо
Вопрос:
Я пытаюсь прочитать файл feather в Python, используя pyarrow
примерно так:
import pyarrow.feather as feather
feather.read_feather("../data/my_file.feather")
Однако, когда я запускаю это, я получаю следующее сообщение об ошибке:
ArrowInvalid: Unrecognized compression type: LZ4
Согласно документации здесь, LZ4 поддерживается для версии 2. Я также попытался использовать feather
пакет для чтения его в R, но там он сообщает мне, что файл не является файлом feather. Есть идеи, почему это происходит? Указывает ли это на то, что сам файл поврежден?
Я использую Python 3.8 и последнюю версию pyarrow (2.0.0).
Спасибо!
Комментарии:
1. Сжатие LZ4 действительно должно поддерживаться. Как вы создали файл Feather? Не могли бы вы поделиться воспроизводимым примером?
2. Спасибо за ответ, @joris. Я не создавал файл, но вы можете загрузить файл здесь (
yt_metadata_helper.feather
).3. Спасибо за эту ссылку! Я немного исследовал, и это ошибка в pyarrow. Чтение с помощью pyarrow 1.0.0 все равно должно работать, и, надеюсь, мы сможем исправить это вовремя для предстоящего выпуска pyarrow 3.0.0. Я сообщил об этом как issues.apache.org/jira/browse/ARROW-11163