#hadoop #apache-pig
#hadoop #apache-pig
Вопрос:
Я делаю внешние соединения для отдельных столбцов в Pig следующим образом
result = JOIN A by id LEFT OUTER, B by id;
Как мне объединить два столбца, что-то вроде —
WHERE A.id=B.id AND A.name=B.name
Что такое эквивалент pig? Я не смог найти ни одного примера в руководствах pig…любая помощь?
Ответ №1:
Приведенный выше ответ на самом деле является ВНУТРЕННИМ соединением, правильный оператор pig должен быть:
join a by (id, name) LEFT OUTER, b by (id, name)
Ответ №2:
Сам отвечаю на вопрос —
join a by (id, name), b by (id, name)
http://ofps.oreilly.com/titles/9781449302641/advanced_pig_latin.html
Комментарии:
1. Вы забыли ОСТАВИТЬ ВНЕШНИЙ