#greenplum
Вопрос:
Я запускаю запрос из таблицы, в которой более 2 миллиардов записей:
select count(*) from table
Мой кластер GreenPlum состоит из 24 сегментов, и из плана запроса я мог видеть, что:
- этот запрос занимает почти 10 минут (я думаю, что это немного долго).
- есть движение за сбор(24:1).
- последняя операция агрегирования занимает более девяти минут.
Мне нужно ответить на два вопроса:
- в документации говорится: «движение сбора-это когда сегменты отправляют строки ведущему».
Итакcount(*)
, действительно ли агрегация работает на главном узле? (или «главный узел» здесь-это всего лишь один из сегментов) - Если да, то может ли главный узел быть узким местом в этой ситуации?