как выполнить запрос riak mapred с несколькими функциями карты

#mapreduce #riak

#mapreduce #riak

Вопрос:

Я хочу выполнить запрос mapreduce на erlang, который содержит две фазы отображения, так что функция Map2 принимает результат функции Map1 в качестве входных данных. Возможно ли это и если, каким должно быть возвращаемое значение каждой фазы карты

  • Для получения более подробной информации:

Я запустил тестовый запрос mapred, используя две простые функции map, каждая из которых возвращает входной объект (в списке). но при выполнении запроса я получаю ошибку несоответствия

 Map1 = fun(O,_,_) -> [O] end.
Map2 = fun(O, _,_) -> [O] end.


C:mapred_bucket(<<"b7bc1418-198d-44a3-8835-8aa9cb416d5b">>, [{map, {qfun, Map1}, none, false}, {map, {qfun, Map2}, none, true}]).

{{badmatch,{r_object,<<"b7bc1418-198d-44a3-8835-8aa9cb416d5b">>,
                     <<255,230,193,167,254,7,246,64,154,190,36,236,32,232,189,
                       169,161,124,23,86>>,
                     [{r_content,{dict,2,16,16,8,80,48,
                                       {[],[],[],[],[],[],[],[],[],[],[],...},
                                       {{[],[],[],[],[],[],[],[],[],...}}},
                                 <<"12d33872-4c92-4da5-9d16-5036a8059253">>}],
                     [{<<5,215,86,61>>,{1,63487018636}}],
                     {dict,1,16,16,8,80,48,
                           {[],[],[],[],[],[],[],[],[],[],[],[],...},
                           {{[],[],[],[],[],[],[],[],[],[],...}}},
                     undefined}},
 [{riak_kv_map_phase,build_input,2},
  {riak_kv_map_phase,'-handle_input/3-lc$^0/1-0-',2},
  {riak_kv_map_phase,handle_input,3},
  {luke_phase,executing,2},
  {gen_fsm,handle_msg,7},
  {proc_lib,init_p_do_apply,3}]}
 

Я использую riak_search-0.14.2

Erlang R14B03 (erts-5.8.4)

Спасибо!

Ответ №1:

Я не уверен, какова сигнатура метода Map в Erlang, поскольку я делал map / reduce только в Javascript, но я постараюсь помочь.

Чтобы связать фазы map в цепочку, только последняя функция map должна возвращать список объектов в Riak. Каждая другая функция отображения над ним должна возвращать кортеж, содержащий имя корзины и ключ переданного значения.

В Javascript я выполнил это следующим образом:

 function map_function(value, keydata, arg) {
    //filtering stuff here
    if(arg.last) {
      data["key"] = value.key;
      return [data];
    }
    else {
      return [[value.bucket, value.key]];
    }
    //this is in the case the filter returns true; if the filter returns false, return an empty tuple
  }
 

Надеюсь, это поможет.

Ответ №2:

Вы должны вернуть {Bucket, Key} или {{Bucket, Key}, KeyData} из первой функции карты.
Вот так:

 Map1 = fun(O,_,_) -> [{riak_object:bucket(O), riak_object:key(O)}] end.
Map2 = fun(O, _,_) -> [O] end.


C:mapred_bucket(<<"b7bc1418-198d-44a3-8835-8aa9cb416d5b">>, [{map, {qfun, Map1}, none, false}, {map, {qfun, Map2}, none, true}]).