панды группируются, игнорируя группировку дат

#python #pandas #dataframe

Вопрос:

быстрый вопрос о панд группби.

Строки имеют следующий формат

ID	Дата	col1	col2	col3
60630b503ff132001be0ba85	2021-03-30T11:28:16.153 Z	инт	инт	инт

Я преобразую метку времени в дату:

 df['date'] = df['date'].astype('datetime64[ns]')

Затем пытаюсь сгруппироваться по идентификатору и дню даты. Это, по сути, временные метки «входа», поэтому одно и то же id может содержать несколько строк (в день), а затем суммировать все дополнительные столбцы (int).

 gdf = df.groupby([df['date'].dt.day, 'id'], as_index=False).sum()

Кажется, это работает, но столбец даты удаляется, несмотря на as_index установленный флаг false , в то время id как это не так. Есть ли какой-либо способ обойти это, чтобы оба столбца отображались в каждой строке?

Любая помощь будет очень признательна 🙂

1. почему бы вам не создать новый столбец с df['date'].dt.day помощью, а затем выполнить группировку по этому столбцу?

2. @IanWright Ну, я чувствую себя глупо. Это сработало. Спасибо.

Вопрос:

Комментарии:

Вам также может понравиться

React — renderToString как применить стили к строке

UINavigationController и UIWebView

Возникли проблемы с выбором с использованием месяца / часа