#postgresql #citus
#postgresql #citus
Вопрос:
У меня есть запрос, подобный этому:
select
coalesce(s.import_date, r.import_date) as import_date,
coalesce(s.bedrooms, r.bedrooms) as bedrooms,
coalesce(s.ptype, r.ptype) as property_type,
s.s_price,
s.s_transactions,
....
r.r_rent,
....
from
(
select
sc.import_date,
sc.bedrooms,
sc.ptype,
percentile_cont(array[0.25,0.5,0.75,0.9]) within group (order by sc.asking_price) filter(where sc.price > 0) as s_price,
sum(1) filter(where sc.sold_price > 0) as s_transactions,
......
from prices sc
where sc.ptype = 'F' and sc.bedrooms = 2 and st_Intersects('010300002.....'::geometry,sc.geom)
and sc.import_date between '2012-01-01' and '2019-01-01'
group by sc.import_date, sc.bedrooms, sc.property_type
) s
full join
(
select
rc.import_date,
rc.bedrooms,
rc.ptype,
percentile_cont(array[0.25,0.5,0.75,0.9]) within group (order by rc.rent) filter(where rc.rent > 0) as r_rent,
.....
from rents rc
where rc.ptype = 'F' and rc.bedrooms = 2 and st_Intersects('010300002....'::geometry,rc.geom)
and rc.import_date between '2012-01-01' and '2019-01-01'
group by rc.import_date, rc.bedrooms, rc.property_type
) r
on r.import_date = s.import_date;
Когда я запускаю его с моими распределенными таблицами в Citus / Postgres-11, я получаю:
ERROR: unsupported aggregate function percentile_cont
Есть ли какой-либо способ обойти это ограничение?
Ответ №1:
AFAIK, для этого нет простого обходного пути.
Вы всегда можете перенести все данные в координатор и вычислить процентили там. Однако не рекомендуется делать это в одном запросе.
SELECT percentile_cont(array[0.25,0.5,0.75,0.9]) within group (order by r.order_col)
FROM
(
SELECT order_col, ...
FROM rents
WHERE ...
) r
GROUP BY ...
Этот запрос извлечет все данные, возвращенные внутренним подзапросом координатору, и вычислит процентили в координаторе.
Комментарии:
1. да, я использую алгоритм для усреднения параллельного продолжения, распараллеленного с другим расширением postgres, и