ElasticSearch лучший подход для поиска похожего документа

#elasticsearch #search

#elasticsearch #Поиск

Вопрос:

У меня есть набор документов, каждый из которых можно описать как список уникальных слов (функций) e.g. [12, 45, 56, 78, ...] . Количество функций составляет около 1 тыс. Функции, содержащиеся в документе, могут отображаться в другом документе. Я хочу вернуть наиболее похожие документы. Какой подход был бы наиболее эффективным?

Ответ №1:

Вы можете прямо попробовать этот тип запроса и посмотреть, насколько хорошо он работает для вас. Просто разработайте свой, так сказать, справочный документ с наивысшим общим коэффициентом, чтобы получить большинство результатов.

PS Если ваши термины («функции») каким-то образом изменяются, также имеет смысл посмотреть на нечеткие запросы.

Комментарии:

1. Я действительно думал об этом, но в документации я прочитал, что существует переменная max_query_terms, значение которой не превышает 25. Учитывая, что функций около 1000, не будет ли это в конечном итоге очень медленным?