#string #text #similarity
#строка #текст #сходство
Вопрос:
Я провожу исследование, включающее задачу, в которой участников просят точно воссоздать твит дословно. Существует ли функция R, которая позволит мне количественно определить сходство между ответами участников и исходным «ссылочным» твитом?
Я пробовал работать с jaccard_similarity
функцией в textreuse
пакете, но, похоже, это в основном для оценки расстояния между двумя маркированными строками (наборами, пакетами). Я хотел бы сравнить строковые ответы всех моих участников с одной ссылочной строкой. Как, если вообще, я могу сделать что-то подобное?
Для дополнительного контекста я думаю о чем-то подобном, но для сравнения сотен отдельных ответов одновременно с одной ссылочной строкой.