Повторный просмотр документов в эластичном

#elasticsearch #search-engine #reinforcement-learning

Вопрос:

Я работаю над проектом, в котором у каждого пользователя есть набор документов, и он хочет получить лучшие из них с помощью запроса.

У меня уже есть алгоритм, который сортирует мои документы по запросу пользователя. Поскольку я использую семантическое понимание в своем запросе, я отношусь к нему довольно осторожно и хочу быть более агрессивным в отношении лучших результатов.

Поэтому моя идея состояла в том, чтобы использовать алгоритм подкрепления, который принимает запрос пользователя и уже отсортированные документы, а затем выполняет повторную проверку этих документов. Затем я буду использовать реакции пользователей на результаты, чтобы разработать функцию вознаграждения (все еще находящуюся в стадии исследования).

Один из моих коллег выдвинул еще одну идею, которая заключалась в использовании api оценки ранжирования elastic. Проблема, судя по тому, что я читал, заключается в том, что каждый запрос помогает улучшить один и тот же запрос для следующего пользователя. Но мы полностью разделили пользовательскую среду, и я почувствовал, что это лучше подходит для поисковой системы с одинаковым пространством документов (например, Google или Википедия).

Единственный вопрос, на который мне нужно было бы ответить, — хорошо ли я понял API оценки ранжирования и правда ли, что один запрос помогает только одному и тому же запросу, или есть другой способ использовать его для моих целей (семантическое повторное ранжирование)?

И если у вас есть дополнительные знания, является ли моя идея использовать обучение с подкреплением хорошей или мне следует использовать что-то другое?