Проблема с преобразованием данных перед прогностической моделью — название «статьи» не определено

#python #pandas #naivebayes

#python #pandas #наивные высказывания

Вопрос:

Я использую свою наивную байесовскую модель для классификации текста как релевантного или нет. Я загружаю набор данных, содержащий текст для сканирования, но когда я пытаюсь преобразовать данные (маркировать и лемметизировать), я получаю прикрепленную ошибку — название статьи не определено.

Это код:

 dff['text'] = dff['text'].str.lower()
dff = dff.drop_duplicates('text')

start_time = time.time()

X = dff.text
X_test_vect = tf_vectorizer.transform(X)
y_pred = nb.predict(X_test_vect)
y_pred_prob = nb.predict_proba(X_test_vect)[:, 1]
y_pred

print("--- %s seconds ---" % (time.time() - start_time))
 

К сожалению, я не могу поделиться прогностической моделью, и я не думаю, что самим данным было бы полезно поделиться.

введите описание изображения здесь

Ответ №1:

Сообщение об ошибке сделало это очень ясным. Вы не определили articles

Взгляните на переменный переход к функции,

 def __call__(self,articlegs):
 

Вы передали articlegs переменную и попытались использовать articles внутри функции, вызвавшей проблему. сохранение имени переменной таким же образом исправит ситуацию. Вы можете попробовать ниже,

 def __call__(self,articles):
 

Комментарии:

1. Спасибо! прошу прощения, я не слишком знаком с процессом — переменная, которую я передаю, — это dff.text — в моем наборе данных нет переменной articlegs. Откуда это взялось?