Impala / Hive предоставляет разделенные файлы parquet в виде таблицы
#hive #impala #hive #impala Вопрос: Я использовал df.to_parquet(path="...", partition_cols="period") для записи фрейма данных в файлы parquet на HDFS (Cloudera CDH). Это работает нормально, создается структура вложенных папок ( period=YYYYMMDD ),…