#solr #solr4
#solr #solr4
Вопрос:
У меня есть текстовое поле, проблема в том, что solr удаляет такие слова, как pc, tv, в процессе поиска, потому что их длина меньше 3, как я могу заставить solr выполнять поиск по таким коротким поисковым запросам?
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="0"/>
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.StopFilterFactory"
ignoreCase="true"
words="stopwords.txt"
enablePositionIncrements="true"
/>
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="0"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
Спасибо!
Комментарии:
1. Что именно показывает страница анализа в интерфейсе администратора для поля?
2. Вы случайно нигде в схеме не используете реберные N-граммы или N-граммы? можете ли вы опубликовать весь свой schema.xml
3. также можете ли вы опубликовать свой stopwords.txt ?