Производительность постагрегаций в Apache Druid

#druid

Вопрос:

Каковы компромиссы в производительности, которые я должен учитывать при использовании постагрегирования, в отличие от определения показателей в спецификации приема, когда включено накопление?

Ответ №1:

Я думаю, все зависит от набора результатов.

Когда вы делаете это во время приема пищи, потребуется только некоторое время, когда данные будут загружены в ваш кластер друидов. Выбор данных-это всего лишь вопрос извлечения данных из сегментов.

Последующая агрегация будет проходить по результату вашего запроса, а затем «повторно обрабатывать» результат. Так что это будет иметь некоторые накладные расходы. Хотя трудно сказать, насколько сильно.

Когда вам нужно увеличить скорость или вы хотите уменьшить процессор, я бы рекомендовал вносить изменения во время приема пищи. Однако недостатком является то, что это занимает дополнительное место на диске, так как вы сохраняете результат своих вычислений в новом столбце.

Если дисковое пространство является проблемой, я думаю, вам лучше использовать постагрегаты.