Elasticsearch как выполнить нечеткий поиск по номерам партнеров по бренду (или выполнить динамическое отключение tf/idf)?

#elasticsearch #tf-idf #fuzzy-search

Вопрос:

Учитывая следующий запрос «DELL PRECISION M4600 FGNDX», я хотел бы:

  • сначала сопоставьте точные совпадения. Т. е.: те, которые содержат все термины. Правильный порядок не требуется
  • это позволило бы отступить, если будут затронуты более конкретные условия, например, M4600 и FGNDX. Чем больше, тем лучше
  • не допускал бы слишком широких терминов, таких как ТОЧНОСТЬ DELL.

Я занимался нечеткими запросами, но не совсем уверен, что это то, что мне нужно. Может быть, «Должен»-запрос был бы лучше? Т. е.: обозначая, что чем больше попаданий, тем лучше?

Однако при использовании запроса should я заранее не знаю, какие термины я считаю важными и, следовательно,необходимыми(M4600, FGNDX), а какие нет (DELL,ТОЧНОСТЬ).

Вместо этого это может зависеть от некоторых tf/idf cutoff для этих полей. Можно ли как-то это уточнить?

Если это лает не на то дерево, и есть лучшие способы справиться с этим, я весь внимание.