#python-3.x #pandas #python-2.7 #tweets
#python-3.x #панды #python-2.7 #твиты
Вопрос:
Прочитал csv-файл в pandas. Попытка извлечь хэштеги из другого столбца, используя столбец сущностей, как показано ниже. Было бы полезно, если бы я мог получить помощь в устранении ошибки.Ссылка на набор данных приведена ниже
df = pd.read_csv('tw_climate_.csv' df['entities'].map(lambda x:[i['text'] for i in x['hashtags']])
Но он показывает следующую ошибку
TypeError Traceback (most recent call last) lt;ipython-input-4-dbbb34b804cegt; in lt;modulegt; ----gt; 1 df['entities'].map(lambda x:[i['text'] for i in x['hashtags']]) ~anaconda3libsite-packagespandascoreseries.py in map(self, arg, na_action) 3907 dtype: object 3908 """ -gt; 3909 new_values = super()._map_values(arg, na_action=na_action) 3910 return self._constructor(new_values, index=self.index).__finalize__( 3911 self, method="map" ~anaconda3libsite-packagespandascorebase.py in _map_values(self, mapper, na_action) 935 936 # mapper is a function --gt; 937 new_values = map_f(values, mapper) 938 939 return new_values pandas_libslib.pyx in pandas._libs.lib.map_infer() lt;ipython-input-4-dbbb34b804cegt; in lt;lambdagt;(x) ----gt; 1 df['entities'].map(lambda x:[i['text'] for i in x['hashtags']]) TypeError: string indices must be integers
Ссылка на набор данных ниже:
https://ln5.sync.com/dl/73f6cf090/y4harjr9-p8q483tt-gzyi4srg-6rgi8kd7
Комментарии:
1.
x
(Элементdf['entities']
) — это строка. Вы должны использоватьjson.loads
его для анализа перед обработкой.2. @DYZ Я в этом новичок. Можете ли вы, пожалуйста, помочь мне с точки зрения кодирования, что делать, чтобы извлечь хэштеги из сущностей
3. Привет, каков результат
df.head().to_dict()
?