Как группировать по нескольким столбцам и использовать только дату и время в панд

#python #pandas #data-science

Вопрос:

У меня есть фрейм данных, подобный этому

ИДЕНТИФИКАТОР ЯЧЕЙКИ Вечеринка ЛОК Дата и время
10631 3009787 bwp 2021-10-01 8:20:30
10631 3009787 bwp 2021-10-01 8:40:50
50987 2275172 bwp 2021-10-02 7:50:20
50987 2275172 bwp 2021-10-02 7:23:16

Мне нужен выходной фрейм данных, содержащий сгруппированные данные .Используйте идентификатор ячейки, Дату вечеринки и Только Часть Даты и времени в группе :

Вывод в этом формате : https://i.stack.imgur.com/XFaDS.png

Идентификатор ЯЧЕЙКИ —>Вечеринка —>> Дата и время

Комментарии:

1. Date amp; Time В настоящее время в вашей колонке указана только дата. В чем проблема? Не могли бы вы предоставить более репрезентативный образец фрейма данных?

2. группы должны содержать только часть даты и времени

Ответ №1:

Вот, пожалуйста:

 # df["Date amp; Time"] = pd.to_datetime(df["Date amp; Time"])  # If not already datetime
df.set_index(["CELL ID", "Party", df["Date amp; Time"].dt.date])
 

Выход:

                              LOC         Date amp; Time
CELL ID Party   Date amp; Time
10631   3009787 2021-10-01   bwp 2021-10-01 08:20:30
                2021-10-01   bwp 2021-10-01 08:40:50
50987   2275172 2021-10-02   bwp 2021-10-02 07:50:20
                2021-10-02   bwp 2021-10-02 07:23:16
 

Комментарии:

1. Теперь, как мы можем объединить эти группы в один фрейм данных

2. Подождите, если это то, что вы хотите сделать, то почему бы просто не удалить значения времени вообще и удалить дубликаты?

3. Мне нужен фрейм данных, содержащий все эти группы

4. Вам нужно будет предоставить желаемый результат, потому что уже не ясно, о чем вы просите.

5. @ZulqarnainSabir смотри мою правку