Python: использование TextBlob NLTK для чтения текстового файла и определения языка

#python #text-files #textblob #language-detection

#python #текстовые файлы #textblob #обнаружение языка

Вопрос:

Я новичок в Python и программировании, поэтому, пожалуйста, потерпите меня.

Я установил плагин TextBlob в свою среду IDE, и он работает как шарм при определении языка строки. Смотрите приведенный ниже код и выходные данные внизу.

Что мне нужно сделать, так это определить язык текстового файла, а не только строку, которую я ввел. Поэтому, по сути, мне нужно заменить строки текста текстовыми файлами любых языков и добавить код для открытия / чтения файлов и заставить TextBlob делать свое дело.

Есть идеи?

 from textblob import TextBlob

text1 = TextBlob('I looked for Mary and Samantha at the bus station')
a = text1.detect_language()
print(a)

text2 = TextBlob('Appliquer un nom , une dénomination , un mot , une phrase à une personne , à une chose')
b = text2.detect_language()
print(b)

text3 = TextBlob('Escribe un ejemplo para mostrar el significado de la palabra de vocabulario.')
c = text3.detect_language()
print(c)


>>> %Run 'NLP TextBlob.py'
en
fr
es
>>>
 

Ответ №1:

Понял это на случай, если кто-нибудь спросит об этом в будущем. Довольно просто в конце и обеспечивает тот же результат, что и раньше, но мои строки расположены в текстовых файлах, а не напечатаны.

 from textblob import TextBlob

with open('1.txt', 'r') as text1:
    content = text1.read()
blob = TextBlob(content)

a = blob.detect_language()
print(a)

with open('2.txt', 'r') as text2:
    content = text2.read()
blob = TextBlob(content)

b = blob.detect_language()
print(b)

with open('3.txt', 'r') as text3:
    content = text3.read()
blob = TextBlob(content)

c = blob.detect_language()
print(c)