#python #dataframe #series
#python #фрейм данных #Серии
Вопрос:
У меня есть мультииндекс для моих данных для района, года и месяца, за которые были зарегистрированы убийства. Я пытаюсь организовать свой фрейм данных таким образом, чтобы для строк существовал мультииндекс, представляющий собой район и год, а затем данные столбца в виде месяцев.
Моя проблема в том, что, как это устроено в настоящее время, в столбце месяца есть повторяющиеся значения по мере записи отдельных убийств. Так, например, в данной области в 2008 году может быть 3 записи за март, поскольку здесь произошли три отдельных убийства.
Чего я хочу добиться, так это наличия многоиндексного фрейма данных с районом и годом в качестве индексов и месяцами в качестве заголовков столбцов и соответствующими значениями в качестве значений. Как я могу суммировать значения столбца значений, чтобы общее значение за данный месяц составляло все убийства, совершенные в этом месяце, например, в сентябре 2016 года, как мне получить одну запись за сентябрь со значением 2?
Ответ №1:
Попробуйте groupby:
df['value'].groupby(['borough', 'year', 'month']).sum()