панды группируются, игнорируя группировку дат

#python #pandas #dataframe

Вопрос:

быстрый вопрос о панд группби.

Строки имеют следующий формат

ID Дата col1 col2 col3
60630b503ff132001be0ba85 2021-03-30T11:28:16.153 Z инт инт инт

Я преобразую метку времени в дату:

 df['date'] = df['date'].astype('datetime64[ns]')
 

Затем пытаюсь сгруппироваться по идентификатору и дню даты. Это, по сути, временные метки «входа», поэтому одно и то же id может содержать несколько строк (в день), а затем суммировать все дополнительные столбцы (int).

 gdf = df.groupby([df['date'].dt.day, 'id'], as_index=False).sum()
 

Кажется, это работает, но столбец даты удаляется, несмотря на as_index установленный флаг false , в то время id как это не так. Есть ли какой-либо способ обойти это, чтобы оба столбца отображались в каждой строке?

Любая помощь будет очень признательна 🙂

Комментарии:

1. почему бы вам не создать новый столбец с df['date'].dt.day помощью, а затем выполнить группировку по этому столбцу?

2. @IanWright Ну, я чувствую себя глупо. Это сработало. Спасибо.