#solr
Вопрос:
Я выполнил один запрос solr с q=titlekeywordAbstract:organic
помощью . Система включает в себя результаты с организацией/Организацией, которая также не содержит органических. Как я могу решить эту проблему?
1.запрос solr
http://localhost:8983/solr/articlecore/select/?q=(titleKeywordsAbs:organic) amp;stopwords=trueamp;defType=edismaxamp;rows=15amp;start=0amp;facet.mincount=1amp;q.op=ANDamp;hl=trueamp;hl.fragsize=200amp;hl.fl=title_fz,keywords_fzamp;hl.simple.post=</mark >amp;hl.simple.pre=<mark >amp;wt=json
2.определение поля
<field indexed="true" name="titleKeywordsAbs" multiValued="true" stored="false" type="text_general_singular_plural"/>
3.тип поля
<fieldType class="solr.TextField" name="text_general_singular_plural" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" format="wordset"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>
<filter class="solr.PorterStemFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" format="wordset"/>
<filter class="solr.SynonymFilterFactory" expand="true" ignoreCase="true" synonyms="synonyms.txt"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>
<filter class="solr.PorterStemFilterFactory"/>
</analyzer>
</fieldType>
Комментарии:
1. Вы выполнили запрос в режиме отладки
debug=true
? Это поможет вам понять, как анализируется запрос, и я бы поспорил, что установленный вами фильтр вывода отвечает за такое поведение.2. Пожалуйста, добавьте соответствующие документы, в которых показано, что включено, что, по вашему мнению, не должно быть включено — имейте в виду, что заимствование может иногда создавать форму основы / основы, о которой вы не подумали, между, казалось бы, несвязанными словами (т. Е. Они не связаны по значению, а не по основанию). Также нет необходимости
()
в одном термине, как в вашем запросе. Вы можете использоватьAnalysis
страницу в разделе Администратор Solr для проверки запроса на соответствие индексированному тексту для поля, чтобы узнать, почему было сгенерировано попадание (иdebug=all
, как уже упоминалось, расскажет вам, почему документ был включен, показав, какие поля совпали.3. 1. Это один из образцов документа. Это произошло только из — за присутствия абстрактных организаций.
4. Аннотация : С помощью полуструктурированных интервью анализируется опыт четырнадцати студентов, занятых в студенческих профессиях в бразильском штате Минас-Жерайс в 2016 году, с целью выяснить, насколько образовательный аспект этого движения повлиял на их политические траектории. Несмотря на то, что в политических организациях было мало эффективных мероприятий
5. 2.Результат отладки отладка»: { «rawquerystring»: «Таблицы ключевых слов:органические», «строка запроса»: «Таблицы ключевых слов:органические», «запрос на синтаксический анализ»: » ( Таблицы ключевых слов:орган)», «Синтаксический анализ»: » ( таблицы ключевых слов:орган)», «объяснение»: { «11246875»: «n2.686988 = вес(Ключевые слова:орган в 428804) [Схожесть схем], результат:n 2,686988 = оценка(freq=6,0), произведение:n 2,8750582 = idf, вычисляется как журнал(1 (N — n 0,5) / (n 0,5)) из:n 4115089 = n, количество документов, содержащих терминn 72945949 = N,