#sql #hadoop #apache-pig
#sql #hadoop #apache-pig
Вопрос:
Я работаю с Pig в Hadoop, и мне нужно преобразовать следующий SQL-код в PigLatin:
SELECT lo_discount, COUNT(lo_extendedprice)
FROM lineorder
GROUP BY lo_discount;
После загрузки lineorder
таблицы это то, что у меня есть до сих пор, но, к сожалению, это не работает:
data = FOREACH lineorder GENERATE lo_discount, lo_extendedprice;
dataG = GROUP data BY lo_discount;
ans0 = FOREACH dataG GENERATE dataG.lo_discount, COUNT(dataG.lo_extendedprice);
Кто-нибудь может мне помочь, как это сделать? Спасибо!
Ответ №1:
Измените последнее состояние pig на
ans0 = FOREACH dataG GENERATE group, COUNT(data);