Вставка стола с пряжкой для улья занимает больше времени

#hive #insert #bigdata #partitioning #cdp

#улей #вставлять #bigdata #разделение #cdp

Вопрос:

У меня есть таблица с более чем 14 миллиардами записей(скажем, Table_A). Теперь я создал таблицу с ячейками(Table_A_bkt) с более чем 100 сегментами, сгруппированными по столбцу идентификатора. Всякий раз, когда я пытался вставить записи в эту таблицу, это занимало больше времени, и время выполнения задания истекало.

Каково идеальное решение для выбора количества ведер для таблицы? Кроме того, каков оптимизированный способ вставки записей в таблицу с огромными наборами данных?