Улей: есть ли способ заранее предсказать размер хранимой таблицы паркета?

#hadoop #hive #parquet

Вопрос:

Я хочу создать таблицу улья.

  • Я знаю, что буду хранить таблицу в паркетном формате.
  • Я знаю имена столбцов и средний размер данных внутри каждого типа полей.
  • Я знаю количество строк.

Как я могу предсказать размер таблицы HDFS на основе этой информации? Мне просто нужна приблизительная оценка.