#r #text #text-mining #spell-checking #autocorrect
#r #текст #интеллектуальный анализ текста #проверка орфографии #автозамена
Вопрос:
Я работаю с интеллектуальным анализом текста, и перед обработкой данных мне нужно исправить слова (на английском языке), которые хранятся в файле .CSV.
Я получил то, что хотел, используя python и библиотеку TextBlob. Сначала я запускаю исходный файл, TextBlob автоматически исправляет все неправильные слова из файла, и на выходе создается файл с исправленными словами.
Вы можете проверить код python здесь:
import nltk
import string
import re
from textblob import TextBlob
with open(file.csv', 'r') as inFile, open('fileOutput.csv', 'w') as outFile:
for line in inFile:
print (TextBlob(line).lower().correct().strip(), file=outFile) #this function turns all words into lowercase and corrects incorrect words
print(inFile)
Пожалуйста, не мог бы кто-нибудь подсказать мне какой-нибудь пакет на R, который делает что-то подобное? Я не нашел никаких пакетов, способных автоматически исправлять слова с помощью R.
Комментарии:
1. я надеюсь, что эта ссылка поможет вам: — r-bloggers.com/automatic-cleaning-of-messy-text-data
2. возможно, это поможет вам: sumsar.net/blog/2014/12 /…