#elasticsearch #tf-idf #fuzzy-search
Вопрос:
Учитывая следующий запрос «DELL PRECISION M4600 FGNDX», я хотел бы:
- сначала сопоставьте точные совпадения. Т. е.: те, которые содержат все термины. Правильный порядок не требуется
- это позволило бы отступить, если будут затронуты более конкретные условия, например, M4600 и FGNDX. Чем больше, тем лучше
- не допускал бы слишком широких терминов, таких как ТОЧНОСТЬ DELL.
Я занимался нечеткими запросами, но не совсем уверен, что это то, что мне нужно. Может быть, «Должен»-запрос был бы лучше? Т. е.: обозначая, что чем больше попаданий, тем лучше?
Однако при использовании запроса should я заранее не знаю, какие термины я считаю важными и, следовательно,необходимыми(M4600, FGNDX), а какие нет (DELL,ТОЧНОСТЬ).
Вместо этого это может зависеть от некоторых tf/idf cutoff
для этих полей. Можно ли как-то это уточнить?
Если это лает не на то дерево, и есть лучшие способы справиться с этим, я весь внимание.