Как напечатать язык, к которому относится это слово?

#python #nltk

Вопрос:

Я хочу, чтобы напечатать язык в соответствии, разбив предложение на слова

 from nltk.tokenize import word_tokenize 
from langdetect import detect
text = "I like you"
for word in word_tokenize(text):
    try:
        language = detect(word)
        print(word " the detected " language)
    except:
        print("Error")

Вывод для английского языка выглядит следующим образом :

 I the detected id
like the detected et
you the detected sw

1. Трудно угадать язык по одному слову.

2. langdetect может определять язык на основе предложения, так зачем же вы перебираете каждое слово? Просто попробуй detect(text)

3. Короткий текст или отдельные слова могут сбить детектор с толку. Попробуйте более длинный текст; например detect("I Like You So Much, You'll Know It") , который определяет «en».

Ответ №1:

Выполните эти команды в интерпретаторе командной строки Python:

 >>> import nltk
>>> nltk.download("punkt")

и тогда ваша программа должна работать правильно

Как напечатать язык, к которому относится это слово?

Вопрос:

Комментарии:

Ответ №1:

Комментарии:

Вопрос:

Комментарии:

Ответ №1:

Комментарии:

Вам также может понравиться

Google Calendar Python API: Создать событие с указанными начальным и конечным часовыми поясами

Настроенное приложение React на узле — Как копировать файлы?

Как мне включить изображения в мой java-апплет на веб-сайте?