Как настроить Tika 0.9 с Solr 3.1

#solr #apache-tika #solr-cell

#solr #apache-tika #solr-ячейка

Вопрос:

можете ли вы дать мне инструкции по настройке Tika 0.9 с Solr 3.1

 <requestHandler name="/update/extract" 
                  startup="lazy"
                  class="solr.extraction.ExtractingRequestHandler" >
    <lst name="defaults">
      <!-- All the main content goes into "text"... if you need to return
           the extracted text or do highlighting, use a stored field. -->
      <str name="fmap.content">text</str>
      <str name="lowernames">true</str>
      <str name="uprefix">ignored_</str>

      <!-- capture link hrefs but ignore div attributes -->
      <str name="captureAttr">true</str>
      <str name="fmap.a">links</str>
      <str name="fmap.div">ignored_</str>
    </lst>
  </requestHandler>
  

Этот я использую в solrconfig.xml для настройки
Пожалуйста, помогите мне в этом

Спасибо,

Ответ №1:

Предполагая, что у вас установлена Tika (и зависимости) в solr, это должно быть все, что вам нужно сделать.

Вы читали вики-страницу ExtractingRequestHandler? В нем содержится довольно много информации, и, к удобству, также есть несколько рецептов с использованием curl, которые позволят вам проверить, что все это работает должным образом.

Комментарии:

1. Я очень новичок в Tika и Solr итак, как установить зависимости Tika

2. Попробуйте сначала использовать пример solr, подробности смотрите на странице wiki.

3. можете ли вы дать мне пошаговую инструкцию по настройке