#data-science #cosine-similarity #fuzzy-search #tfidfvectorizer #exact-match
Вопрос:
Я попытался найти косинусное сходство с помощью метода awesome_cossim_topn() из двух разных файлов. Эта функция дает косинусное сходство 1 для предложений, таких как [«Привет, мир»] и [«Мир, привет»]. Но я хочу, чтобы точные подобные данные были похожи только на 1 косинусное сходство. Есть ли для этого какие-нибудь средства ?