#python #python-3.x #pandas #mongodb #numpy
Вопрос:
Я хочу выполнить предварительную обработку НЛП для твитов, однако я не смог выполнить часть удаления @, строчных букв и набора слов. Я получаю следующую ошибку :
from textblob import TextBlob import re def clean_data(review): return ' '.join(re.sub("(@[A-Za-z0-9] )|([^0-9A-Za-z t])|(w ://S )", " ", review).split()) def analize_data(review): analysis = TextBlob(clean_data(review)) if analysis.sentiment.polarity gt; 0: return 1 elif analysis.sentiment.polarity == 0: return 0 else: return -1 df = np.array([ analize_data(review) for review in df['full_text'] ]) display(df.head(20))
Комментарии:
1. Не могли бы вы предоставить полный стек ошибок?
2. здравствуйте, код ошибки : df[‘SA’] = np.array([ анализ_данных(обзор) для просмотра в тексте[‘полнотекстовый’] ]) отображение(text.head(20))
3. lt;ipython-вход-51-c469ba1bd5adgt; в lt;ipython-вход-51-c469ba1bd5adgt;lt;модульgt; () — — — lt;модульgt;gt; 1 df = np.массив([ анализ_данных(обзор) для просмотра в df[‘полнотекстовый’] ]) 2 дисплей(df.головка(20)) 3 кадра /usr/lib/python3.7/re.py в sub(шаблон, repl, строка, количество, флаги) 192 вызываемый объект, он передал объект соответствия и должен вернуть 193 строку замены для использования.»» » —lt;модульgt;gt;gt; 194 возвращает _компиляцию(шаблон, флаги).sub(repl, строка, количество) 195 196 деф subn(шаблон, repl, строка, количество=0, флаги=0): Ошибка типа: ожидаемая строка или байт-подобный объект