Добавление повторяющихся данных в одну запись

#python #dataframe #series

#python #фрейм данных #Серии

Вопрос:

У меня есть мультииндекс для моих данных для района, года и месяца, за которые были зарегистрированы убийства. Я пытаюсь организовать свой фрейм данных таким образом, чтобы для строк существовал мультииндекс, представляющий собой район и год, а затем данные столбца в виде месяцев.

Моя проблема в том, что, как это устроено в настоящее время, в столбце месяца есть повторяющиеся значения по мере записи отдельных убийств. Так, например, в данной области в 2008 году может быть 3 записи за март, поскольку здесь произошли три отдельных убийства.Изображение моего фрейма данных

Чего я хочу добиться, так это наличия многоиндексного фрейма данных с районом и годом в качестве индексов и месяцами в качестве заголовков столбцов и соответствующими значениями в качестве значений. Как я могу суммировать значения столбца значений, чтобы общее значение за данный месяц составляло все убийства, совершенные в этом месяце, например, в сентябре 2016 года, как мне получить одну запись за сентябрь со значением 2?

Ответ №1:

Попробуйте groupby:

 df['value'].groupby(['borough', 'year', 'month']).sum()