NiFi: использование файла HDFS в качестве подстановки

#apache-nifi

#apache-nifi

Вопрос:

Мне нужно использовать файл HDFS в качестве поиска в задании NiFi. Этот файл HDFS содержит два поля id, name и мне нужно передать идентификаторы через мой поток и получить имя из файла HDFS. Мой файл HDFS в формате parquet snappy. Не могли бы вы, пожалуйста, сообщить мне, могу ли я достичь этого с помощью процессора поиска или я должен следовать другому подходу.

Любой пример рабочего процесса был бы действительно полезен.

Заранее всем спасибо.

Кумар

Ответ №1:

HDFS в качестве подстановки может быть действительно неэффективным, вероятно, поэтому у нас нет службы контроллера для этого. Где вы получаете файлы, по которым хотите выполнить поиск? Может быть, вместо этого вы можете получить файлы HDFS с помощью NiFi и выполнить «обратный поиск», где вы обогащаете файл HDFS полями из того, с чем вы пытаетесь выполнить поиск?

Сказав это, у NiFi есть службы поиска по базе данных, поэтому альтернативой является помещение ваших файлов HDFS в HBase и выполнение поиска таким образом.