#java #hdfs #bigdata #parquet #parquet-mr
Вопрос:
Я должен работать над двумя программами для сокращения карт над файлом паркета
1)Идентифицировать несколько записей из файла паркета на основе некоторых условий и сохранить их номер строки или некоторую уникальную идентификацию в месте
2)Второму mapreduce нужно будет прочитать эти уникальные номера и пропустить эти записи из файла паркета
Есть ли какой-либо механизм, я могу создать запись, однозначно отличимую от номера строки из паркета