Как однозначно идентифицировать паркетную пластинку, такую как rownum

#java #hdfs #bigdata #parquet #parquet-mr

Вопрос:

Я должен работать над двумя программами для сокращения карт над файлом паркета
1)Идентифицировать несколько записей из файла паркета на основе некоторых условий и сохранить их номер строки или некоторую уникальную идентификацию в месте
2)Второму mapreduce нужно будет прочитать эти уникальные номера и пропустить эти записи из файла паркета

Есть ли какой-либо механизм, я могу создать запись, однозначно отличимую от номера строки из паркета