#mapreduce #riak
#mapreduce #riak
Вопрос:
Я хочу выполнить запрос mapreduce на erlang, который содержит две фазы отображения, так что функция Map2 принимает результат функции Map1 в качестве входных данных. Возможно ли это и если, каким должно быть возвращаемое значение каждой фазы карты
- Для получения более подробной информации:
Я запустил тестовый запрос mapred, используя две простые функции map, каждая из которых возвращает входной объект (в списке). но при выполнении запроса я получаю ошибку несоответствия
Map1 = fun(O,_,_) -> [O] end.
Map2 = fun(O, _,_) -> [O] end.
C:mapred_bucket(<<"b7bc1418-198d-44a3-8835-8aa9cb416d5b">>, [{map, {qfun, Map1}, none, false}, {map, {qfun, Map2}, none, true}]).
{{badmatch,{r_object,<<"b7bc1418-198d-44a3-8835-8aa9cb416d5b">>,
<<255,230,193,167,254,7,246,64,154,190,36,236,32,232,189,
169,161,124,23,86>>,
[{r_content,{dict,2,16,16,8,80,48,
{[],[],[],[],[],[],[],[],[],[],[],...},
{{[],[],[],[],[],[],[],[],[],...}}},
<<"12d33872-4c92-4da5-9d16-5036a8059253">>}],
[{<<5,215,86,61>>,{1,63487018636}}],
{dict,1,16,16,8,80,48,
{[],[],[],[],[],[],[],[],[],[],[],[],...},
{{[],[],[],[],[],[],[],[],[],[],...}}},
undefined}},
[{riak_kv_map_phase,build_input,2},
{riak_kv_map_phase,'-handle_input/3-lc$^0/1-0-',2},
{riak_kv_map_phase,handle_input,3},
{luke_phase,executing,2},
{gen_fsm,handle_msg,7},
{proc_lib,init_p_do_apply,3}]}
Я использую riak_search-0.14.2
Erlang R14B03 (erts-5.8.4)
Спасибо!
Ответ №1:
Я не уверен, какова сигнатура метода Map в Erlang, поскольку я делал map / reduce только в Javascript, но я постараюсь помочь.
Чтобы связать фазы map в цепочку, только последняя функция map должна возвращать список объектов в Riak. Каждая другая функция отображения над ним должна возвращать кортеж, содержащий имя корзины и ключ переданного значения.
В Javascript я выполнил это следующим образом:
function map_function(value, keydata, arg) {
//filtering stuff here
if(arg.last) {
data["key"] = value.key;
return [data];
}
else {
return [[value.bucket, value.key]];
}
//this is in the case the filter returns true; if the filter returns false, return an empty tuple
}
Надеюсь, это поможет.
Ответ №2:
Вы должны вернуть {Bucket, Key} или {{Bucket, Key}, KeyData} из первой функции карты.
Вот так:
Map1 = fun(O,_,_) -> [{riak_object:bucket(O), riak_object:key(O)}] end.
Map2 = fun(O, _,_) -> [O] end.
C:mapred_bucket(<<"b7bc1418-198d-44a3-8835-8aa9cb416d5b">>, [{map, {qfun, Map1}, none, false}, {map, {qfun, Map2}, none, true}]).