#java #hadoop #mapreduce #reduce #mrunit
#java #hadoop #mapreduce #уменьшить #mrunit
Вопрос:
Мой модульный тест редуктора выдает "Mismatch in value class"
исключение после перехода на MapReduce 2:
Mismatch in value class: expected: class org.apache.hadoop.io.IntWritable actual: class com.company.MyWritable
Само сообщение об ошибке мне понятно, но я не понимаю, почему MRUnit получает временный класс с возможностью записи вместо IntWritable.
Реализация редуктора:
public static class TestCountReduce extends
Reducer<Text, MyWritable, Text, IntWritable> {
public void reduce(Text key, Iterator<MyWritable> values,
Context context) throws IOException, InterruptedException {
...
context.write(key, new IntWritable(s.size()));
}
}
Настройка теста:
public void setUp() throws IOException {
Mapper<Object, Text, Text, MyWritable> mapper = new MyMapper();
Reducer<Text, MyWritable, Text, IntWritable> reducer = new MyReducer();
mapDriver = new MapDriver<Object, Text, Text, MyWritable>();
mapDriver.setMapper(mapper);
reduceDriver = new ReduceDriver<Text, MyWritable, Text, IntWritable>();
reduceDriver.setReducer(reducer);
}
И, наконец, тестовый пример:
@Test
public void testReducer() throws IOException {
List<MyWritable> values = new ArrayList<MyWritable>();
values.add(new MyWritable("1"));
values.add(new MyWritable("1"));
reduceDriver.withInput(new Text("testkey"), values);
reduceDriver.withOutput(new Text("testkey"), new IntWritable(1));
reduceDriver.runTest();
}
Ответ №1:
Пожалуйста, проверьте сигнатуру метода reduce в вашей реализации reducer
Это должно быть
public void reduce(Text key, Iterable<MyWritable> values, Context context) throws IOException, InterruptedException {
вместо
public void reduce(Text key, Iterator<MyWritable> values, Context context) throws IOException, InterruptedException {