#haskell #dictionary #plagiarism-detection
#haskell #словарь #обнаружение плагиата
Вопрос:
Я просматривал этот детектор плагиата и пытался написать программу на Haskell, которая будет считывать файл и заменять некоторые из его слов синонимами. Есть ли какой-либо словарь, доступный для этой цели в Haskell?
Кроме того, если у вас есть какие-либо данные относительно алгоритма или любые другие данные, относящиеся к этой проблеме, например, как избежать изменения контекста утверждения путем замены слова его синонимами, пожалуйста, опубликуйте это.
Ответ №1:
есть ли какой-либо словарь, доступный для этой цели в Haskell?
Я бы предположил, что то, что вы ищете, — это обычный текстовый файл, что-то вроде этого:
word1: word1synonym1, word1synonym2, ...
word2: word2synonym1, ...
...
В этом случае это не будет зависеть от Haskell. Я не знаю ни о каких бесплатных тезаурусах текстовых файлов, подобных этому, хотя я полагаю, что если вы покопаетесь в LibreOffice, вы, вероятно, найдете его.
как избежать изменения контекста оператора путем замены слова его синонимами
Это очень сложно для компьютера, afaik. Я бы посоветовал не тратить много усилий на этот аспект.
любой ввод относительно алгоритма
Вы можете найти концепцию расстояния редактирования полезной для этой проблемы. См. Примерное сопоставление строк и алгоритм Вагнера-Фишера.