#python
#python
Вопрос:
Я работаю над обработкой естественного языка. У меня есть фрейм данных со столбцом rev (Rev), который содержит обзоры фильмов. Я могу удалить все стоп-слова, но из каждой строки не могу удалить первое стоп-слово, если оно существует.
«Это очень хорошая история» мой код удаляет is или любые стоп-слова после этого, но «это» не удаляется. Я выполнил токенизацию, а затем удалил стоп-слова, где я ошибаюсь?
t_df[‘Rev’] = t_df[‘Rev’].apply(лямбда x: [элемент для элемента в x, если элемент не в стоп-словах])
Комментарии:
1. я подозреваю, что самая внутренняя и распространенная ошибка, ошибка off by one или «гобой». проверьте, начинается ли ваш индекс с 0 или 1.