Как автоматически исправлять слова с помощью R?

#r #text #text-mining #spell-checking #autocorrect

#r #текст #интеллектуальный анализ текста #проверка орфографии #автозамена

Вопрос:

Я работаю с интеллектуальным анализом текста, и перед обработкой данных мне нужно исправить слова (на английском языке), которые хранятся в файле .CSV.

Я получил то, что хотел, используя python и библиотеку TextBlob. Сначала я запускаю исходный файл, TextBlob автоматически исправляет все неправильные слова из файла, и на выходе создается файл с исправленными словами.

Вы можете проверить код python здесь:

     import nltk
    import string
    import re
    from textblob import TextBlob

    with open(file.csv', 'r') as inFile, open('fileOutput.csv', 'w') as outFile:
        for line in inFile: 
                print (TextBlob(line).lower().correct().strip(), file=outFile) #this function turns all words into lowercase and corrects incorrect words

    print(inFile)
  

Пожалуйста, не мог бы кто-нибудь подсказать мне какой-нибудь пакет на R, который делает что-то подобное? Я не нашел никаких пакетов, способных автоматически исправлять слова с помощью R.

Комментарии:

1. я надеюсь, что эта ссылка поможет вам: — r-bloggers.com/automatic-cleaning-of-messy-text-data

2. возможно, это поможет вам: sumsar.net/blog/2014/12 /…