Существует ли функция R, которая может количественно определить сходство между столбцом строковых ответов и «ссылочным сообщением»?

#string #text #similarity

#строка #текст #сходство

Вопрос:

Я провожу исследование, включающее задачу, в которой участников просят точно воссоздать твит дословно. Существует ли функция R, которая позволит мне количественно определить сходство между ответами участников и исходным «ссылочным» твитом?

Я пробовал работать с jaccard_similarity функцией в textreuse пакете, но, похоже, это в основном для оценки расстояния между двумя маркированными строками (наборами, пакетами). Я хотел бы сравнить строковые ответы всех моих участников с одной ссылочной строкой. Как, если вообще, я могу сделать что-то подобное?

Для дополнительного контекста я думаю о чем-то подобном, но для сравнения сотен отдельных ответов одновременно с одной ссылочной строкой.