Тест редуктора MRUnit: несоответствие в классе значений

#java #hadoop #mapreduce #reduce #mrunit

#java #hadoop #mapreduce #уменьшить #mrunit

Вопрос:

Мой модульный тест редуктора выдает "Mismatch in value class" исключение после перехода на MapReduce 2:

Mismatch in value class: expected: class org.apache.hadoop.io.IntWritable actual: class com.company.MyWritable

Само сообщение об ошибке мне понятно, но я не понимаю, почему MRUnit получает временный класс с возможностью записи вместо IntWritable.

Реализация редуктора:

 public static class TestCountReduce extends
        Reducer<Text, MyWritable, Text, IntWritable> {

    public void reduce(Text key, Iterator<MyWritable> values,
            Context context) throws IOException, InterruptedException {

        ...
        context.write(key, new IntWritable(s.size()));
    }
}
  

Настройка теста:

 public void setUp() throws IOException {
    Mapper<Object, Text, Text, MyWritable> mapper = new MyMapper();
    Reducer<Text, MyWritable, Text, IntWritable> reducer = new MyReducer();

    mapDriver = new MapDriver<Object, Text, Text, MyWritable>();
    mapDriver.setMapper(mapper);

    reduceDriver = new ReduceDriver<Text, MyWritable, Text, IntWritable>();
    reduceDriver.setReducer(reducer);
}
  

И, наконец, тестовый пример:

 @Test
public void testReducer() throws IOException {
    List<MyWritable> values = new ArrayList<MyWritable>();
    values.add(new MyWritable("1"));
    values.add(new MyWritable("1"));
    reduceDriver.withInput(new Text("testkey"), values);
    reduceDriver.withOutput(new Text("testkey"), new IntWritable(1));
    reduceDriver.runTest();
}
  

Ответ №1:

Пожалуйста, проверьте сигнатуру метода reduce в вашей реализации reducer

Это должно быть

 public void reduce(Text key, Iterable<MyWritable> values, Context context) throws IOException, InterruptedException {
  

вместо

 public void reduce(Text key, Iterator<MyWritable> values, Context context) throws IOException, InterruptedException {