#python #pandas #naivebayes
#python #pandas #наивные высказывания
Вопрос:
Я использую свою наивную байесовскую модель для классификации текста как релевантного или нет. Я загружаю набор данных, содержащий текст для сканирования, но когда я пытаюсь преобразовать данные (маркировать и лемметизировать), я получаю прикрепленную ошибку — название статьи не определено.
Это код:
dff['text'] = dff['text'].str.lower()
dff = dff.drop_duplicates('text')
start_time = time.time()
X = dff.text
X_test_vect = tf_vectorizer.transform(X)
y_pred = nb.predict(X_test_vect)
y_pred_prob = nb.predict_proba(X_test_vect)[:, 1]
y_pred
print("--- %s seconds ---" % (time.time() - start_time))
К сожалению, я не могу поделиться прогностической моделью, и я не думаю, что самим данным было бы полезно поделиться.
Ответ №1:
Сообщение об ошибке сделало это очень ясным. Вы не определили articles
Взгляните на переменный переход к функции,
def __call__(self,articlegs):
Вы передали articlegs
переменную и попытались использовать articles
внутри функции, вызвавшей проблему. сохранение имени переменной таким же образом исправит ситуацию. Вы можете попробовать ниже,
def __call__(self,articles):
Комментарии:
1. Спасибо! прошу прощения, я не слишком знаком с процессом — переменная, которую я передаю, — это dff.text — в моем наборе данных нет переменной articlegs. Откуда это взялось?