Как выполнить внешнее соединение в двух столбцах на латинице Pig

#hadoop #apache-pig

#hadoop #apache-pig

Вопрос:

Я делаю внешние соединения для отдельных столбцов в Pig следующим образом

 result = JOIN A by id LEFT OUTER, B by id;
  

Как мне объединить два столбца, что-то вроде —

 WHERE A.id=B.id AND A.name=B.name
  

Что такое эквивалент pig? Я не смог найти ни одного примера в руководствах pig…любая помощь?

Ответ №1:

Приведенный выше ответ на самом деле является ВНУТРЕННИМ соединением, правильный оператор pig должен быть:

  join a by (id, name) LEFT OUTER, b by (id, name) 
  

Ответ №2:

Сам отвечаю на вопрос —

 join a by (id, name), b by (id, name) 
  

http://ofps.oreilly.com/titles/9781449302641/advanced_pig_latin.html

Комментарии:

1. Вы забыли ОСТАВИТЬ ВНЕШНИЙ