Пример Hadoop 'grep'

#hadoop #mapreduce

Вопрос:

В примере Hadoop ‘grep’ (который поставляется с пакетом Hadoop), каков параметр group.Можете ли вы привести мне пример для этого.

Ответ №1:

Отказ от ответственности: я не запускал этот пример и вытаскиваю ответ, просто посмотрев наhttp://wiki.apache.org/hadoop/Grep

Вызов командной строки: bin/hadoop org.apache.hadoop.examples.Grep <indir> <outdir> <regex> [<group>] и вы хотите знать о <group> .

Я подозреваю, что это группировка в регулярном выражении. (случайная ссылка — http://www.exampledepot.com/egs/java.util.regex/Group.html)

Как указано в ссылке на Hadoop Grep

Команда работает иначе, чем вызов Unix grep: она отображает не полную строку соответствия, а только соответствующую строку

Что я извлекаю из этого, так это то, что если вы укажете <group> значение (число), оно выведет только значение для этой группы.

Для примера (извлекается из ссылки группы)

ввод: aba
регулярное выражение: (a(b)*)
группа 0: aba
группа 1: a
группа 2: b

Если значение для <group> равно 1 , то результат будет a . Группа 0 — это полное совпадение, а не исходная строка, в данном случае это просто совпадение.

hth