#hadoop #mapreduce
#hadoop #mapreduce
Вопрос:
В примере Hadoop ‘grep’ (который поставляется с пакетом Hadoop), каков параметр group.Можете ли вы привести мне пример для этого.
Комментарии:
1. Вам повезет больше, если вы сможете добавить больше информации (или, по крайней мере, включить ссылку)
Ответ №1:
Отказ от ответственности: я не запускал этот пример и вытаскиваю ответ, просто посмотрев наhttp://wiki.apache.org/hadoop/Grep
Вызов командной строки: bin/hadoop org.apache.hadoop.examples.Grep <indir> <outdir> <regex> [<group>]
и вы хотите знать о <group>
.
Я подозреваю, что это группировка в регулярном выражении. (случайная ссылка — http://www.exampledepot.com/egs/java.util.regex/Group.html)
Как указано в ссылке на Hadoop Grep
Команда работает иначе, чем вызов Unix grep: она отображает не полную строку соответствия, а только соответствующую строку
Что я извлекаю из этого, так это то, что если вы укажете <group>
значение (число), оно выведет только значение для этой группы.
Для примера (извлекается из ссылки группы)
ввод: aba
регулярное выражение: (a(b)*)
группа 0: aba
группа 1: a
группа 2: b
Если значение для <group>
равно 1
, то результат будет a
. Группа 0 — это полное совпадение, а не исходная строка, в данном случае это просто совпадение.
hth