Ошибка имени: имя «sent_tokenize» не определено

#python #nltk

Вопрос:

В настоящее время я использую google colab для чтения txt-файла и разбиения его на предложения с помощью nltk.

 import nltk
nltk.download('punkt')
with open ('demo.txt','r') as file:
  content = file.read()
  print(content)
sentences = tokenize.sent_tokenize(content)
print(sentences)
 

Когда я нажимаю «Выполнить»,

[nltk_data] Загрузка пакета punkt в /root/nltk_data… [nltk_data] Пакет punkt уже обновлен!
————————————————————————— NameError обратная трассировка (самый недавний призыв последнего) в () 1 импорт в nltk 2 в nltk.скачать(‘пункт’) —-> 3 токенизатор= sent_tokenize() 4 предложения = маркировки.sent_tokenize(контент) 5 Печать(предложения) NameError: имя ‘sent_tokenize’ не определен

Возникает эта ошибка. Кстати, я уже установил nltk.

Ответ №1:

импорт sent_tokenize

 import nltk
from nltk.tokenize import sent_tokenize
nltk.download('punkt')
with open ('demo.txt','r') as file:
   content = file.read()
   print(content)
sentences = sent_tokenize(content)
print(sentences
 

Комментарии:

1. Все равно не работает. В нем говорится: Отслеживание импорта (последний последний вызов) <ipython-input-25-ce5f133c0bdc> в <ipython-input-25-ce5f133c0bdc><модуль> () — — — — <модуль>> 1 из nltk.маркировать импорт маркировать 2 предложения = маркировать.sent_tokenize(содержимое) 3 печать(предложения) ImportError: не удается импортировать имя «tokenize» из «nltk.tokenize» (/usr/local/lib/python3.7/dist-packages/nltk/tokenize/__init__.py)