Solr возвращает нежелательные результаты

#solr

Вопрос:

Я выполнил один запрос solr с q=titlekeywordAbstract:organic помощью . Система включает в себя результаты с организацией/Организацией, которая также не содержит органических. Как я могу решить эту проблему?

1.запрос solr

 http://localhost:8983/solr/articlecore/select/?q=(titleKeywordsAbs:organic) amp;stopwords=trueamp;defType=edismaxamp;rows=15amp;start=0amp;facet.mincount=1amp;q.op=ANDamp;hl=trueamp;hl.fragsize=200amp;hl.fl=title_fz,keywords_fzamp;hl.simple.post=</mark >amp;hl.simple.pre=<mark >amp;wt=json
 

2.определение поля

 <field indexed="true" name="titleKeywordsAbs" multiValued="true" stored="false" type="text_general_singular_plural"/>
 

3.тип поля

 <fieldType class="solr.TextField" name="text_general_singular_plural" positionIncrementGap="100">
    <analyzer type="index">
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" format="wordset"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>
        <filter class="solr.PorterStemFilterFactory"/>
    </analyzer>
    <analyzer type="query">
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" format="wordset"/>
        <filter class="solr.SynonymFilterFactory" expand="true" ignoreCase="true" synonyms="synonyms.txt"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>
        <filter class="solr.PorterStemFilterFactory"/>
    </analyzer>
</fieldType>
 

Комментарии:

1. Вы выполнили запрос в режиме отладки debug=true ? Это поможет вам понять, как анализируется запрос, и я бы поспорил, что установленный вами фильтр вывода отвечает за такое поведение.

2. Пожалуйста, добавьте соответствующие документы, в которых показано, что включено, что, по вашему мнению, не должно быть включено — имейте в виду, что заимствование может иногда создавать форму основы / основы, о которой вы не подумали, между, казалось бы, несвязанными словами (т. Е. Они не связаны по значению, а не по основанию). Также нет необходимости () в одном термине, как в вашем запросе. Вы можете использовать Analysis страницу в разделе Администратор Solr для проверки запроса на соответствие индексированному тексту для поля, чтобы узнать, почему было сгенерировано попадание (и debug=all , как уже упоминалось, расскажет вам, почему документ был включен, показав, какие поля совпали.

3. 1. Это один из образцов документа. Это произошло только из — за присутствия абстрактных организаций.

4. Аннотация : С помощью полуструктурированных интервью анализируется опыт четырнадцати студентов, занятых в студенческих профессиях в бразильском штате Минас-Жерайс в 2016 году, с целью выяснить, насколько образовательный аспект этого движения повлиял на их политические траектории. Несмотря на то, что в политических организациях было мало эффективных мероприятий

5. 2.Результат отладки отладка»: { «rawquerystring»: «Таблицы ключевых слов:органические», «строка запроса»: «Таблицы ключевых слов:органические», «запрос на синтаксический анализ»: » ( Таблицы ключевых слов:орган)», «Синтаксический анализ»: » ( таблицы ключевых слов:орган)», «объяснение»: { «11246875»: «n2.686988 = вес(Ключевые слова:орган в 428804) [Схожесть схем], результат:n 2,686988 = оценка(freq=6,0), произведение:n 2,8750582 = idf, вычисляется как журнал(1 (N — n 0,5) / (n 0,5)) из:n 4115089 = n, количество документов, содержащих терминn 72945949 = N,