Solr WordDelimiterFilterFactory и длина слов менее 3

#solr #solr4

#solr #solr4

Вопрос:

У меня есть текстовое поле, проблема в том, что solr удаляет такие слова, как pc, tv, в процессе поиска, потому что их длина меньше 3, как я могу заставить solr выполнять поиск по таким коротким поисковым запросам?

 <analyzer type="index">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="0"/>
        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
        <filter class="solr.LowerCaseFilterFactory"/>
      </analyzer>
      <analyzer type="query">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.StopFilterFactory"
                ignoreCase="true"
                words="stopwords.txt"
                enablePositionIncrements="true"
                />
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="0"/>
       <filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
  

Спасибо!

Комментарии:

1. Что именно показывает страница анализа в интерфейсе администратора для поля?

2. Вы случайно нигде в схеме не используете реберные N-граммы или N-граммы? можете ли вы опубликовать весь свой schema.xml

3. также можете ли вы опубликовать свой stopwords.txt ?