#python #pandas #dataframe
Вопрос:
быстрый вопрос о панд группби.
Строки имеют следующий формат
ID | Дата | col1 | col2 | col3 |
---|---|---|---|---|
60630b503ff132001be0ba85 | 2021-03-30T11:28:16.153 Z | инт | инт | инт |
Я преобразую метку времени в дату:
df['date'] = df['date'].astype('datetime64[ns]')
Затем пытаюсь сгруппироваться по идентификатору и дню даты. Это, по сути, временные метки «входа», поэтому одно и то же id
может содержать несколько строк (в день), а затем суммировать все дополнительные столбцы (int).
gdf = df.groupby([df['date'].dt.day, 'id'], as_index=False).sum()
Кажется, это работает, но столбец даты удаляется, несмотря на as_index
установленный флаг false
, в то время id
как это не так. Есть ли какой-либо способ обойти это, чтобы оба столбца отображались в каждой строке?
Любая помощь будет очень признательна 🙂
Комментарии:
1. почему бы вам не создать новый столбец с
df['date'].dt.day
помощью, а затем выполнить группировку по этому столбцу?2. @IanWright Ну, я чувствую себя глупо. Это сработало. Спасибо.