Извлечение хэштегов из текстов твитов

#python-3.x #pandas #python-2.7 #tweets

#python-3.x #панды #python-2.7 #твиты

Вопрос:

Прочитал csv-файл в pandas. Попытка извлечь хэштеги из другого столбца, используя столбец сущностей, как показано ниже. Было бы полезно, если бы я мог получить помощь в устранении ошибки.Ссылка на набор данных приведена ниже

 df = pd.read_csv('tw_climate_.csv'  df['entities'].map(lambda x:[i['text'] for i in x['hashtags']])  

Но он показывает следующую ошибку

 TypeError Traceback (most recent call last) lt;ipython-input-4-dbbb34b804cegt; in lt;modulegt; ----gt; 1 df['entities'].map(lambda x:[i['text'] for i in x['hashtags']])  ~anaconda3libsite-packagespandascoreseries.py in map(self, arg, na_action)  3907 dtype: object  3908 """ -gt; 3909 new_values = super()._map_values(arg, na_action=na_action)  3910 return self._constructor(new_values, index=self.index).__finalize__(  3911 self, method="map"  ~anaconda3libsite-packagespandascorebase.py in _map_values(self, mapper, na_action)  935   936 # mapper is a function --gt; 937 new_values = map_f(values, mapper)  938   939 return new_values  pandas_libslib.pyx in pandas._libs.lib.map_infer()  lt;ipython-input-4-dbbb34b804cegt; in lt;lambdagt;(x) ----gt; 1 df['entities'].map(lambda x:[i['text'] for i in x['hashtags']])  TypeError: string indices must be integers  

Ссылка на набор данных ниже:

 https://ln5.sync.com/dl/73f6cf090/y4harjr9-p8q483tt-gzyi4srg-6rgi8kd7  

Комментарии:

1. x (Элемент df['entities'] ) — это строка. Вы должны использовать json.loads его для анализа перед обработкой.

2. @DYZ Я в этом новичок. Можете ли вы, пожалуйста, помочь мне с точки зрения кодирования, что делать, чтобы извлечь хэштеги из сущностей

3. Привет, каков результат df.head().to_dict() ?