Замена слова синонимами в Haskell

#haskell #dictionary #plagiarism-detection

#haskell #словарь #обнаружение плагиата

Вопрос:

Я просматривал этот детектор плагиата и пытался написать программу на Haskell, которая будет считывать файл и заменять некоторые из его слов синонимами. Есть ли какой-либо словарь, доступный для этой цели в Haskell?

Кроме того, если у вас есть какие-либо данные относительно алгоритма или любые другие данные, относящиеся к этой проблеме, например, как избежать изменения контекста утверждения путем замены слова его синонимами, пожалуйста, опубликуйте это.

Ответ №1:

есть ли какой-либо словарь, доступный для этой цели в Haskell?

Я бы предположил, что то, что вы ищете, — это обычный текстовый файл, что-то вроде этого:

 word1: word1synonym1, word1synonym2, ...
word2: word2synonym1, ...
...
  

В этом случае это не будет зависеть от Haskell. Я не знаю ни о каких бесплатных тезаурусах текстовых файлов, подобных этому, хотя я полагаю, что если вы покопаетесь в LibreOffice, вы, вероятно, найдете его.

как избежать изменения контекста оператора путем замены слова его синонимами

Это очень сложно для компьютера, afaik. Я бы посоветовал не тратить много усилий на этот аспект.

любой ввод относительно алгоритма

Вы можете найти концепцию расстояния редактирования полезной для этой проблемы. См. Примерное сопоставление строк и алгоритм Вагнера-Фишера.