Lucidworks Hadoop Solr — разделение текста на абзацы

#hadoop #solr #lucidworks #bigdata

#hadoop #solr #lucidworks #bigdata

Вопрос:

Я использую этот проект:https://github.com/lucidworks/hadoop-solr и я пытаюсь разделить некоторый текст на абзацы и искать в них слова. Но в качестве возврата я беру строку, в которой находится слово. Возможно ли сделать что-то подобное?

Я использую это :

 hadoop jar solr-hadoop-job-2.2.5.jar com.lucidworks.hadoop.ingest.IngestJob 
-Dlww.commit.on.close=true 
-Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.regex="(?sm)^.*?.s*$"  
-Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.groups_to_fields=0=match1_ss
-cls com.lucidworks.hadoop.ingest.RegexIngestMapper -c test2 -i /usr/local/hadoop/input
-s http://127.0.1.1:8983/solr -of com.lucidworks.hadoop.io.LWMapRedOutputFormat