#python #pandas
Вопрос:
У меня есть csv-файл с create_date(дата-время),operid(int),rquid(int). В результате я хотел получить сводную таблицу, подобную этой:
create_date count(rquid)
2021-05-24
(operid)
2 100
3 200
2021-05-22
(operid)
2 101
3 202
Я написал код, и все в порядке, без одного — это поле даты и времени «create_date» (нужна только дата).После этого я попытался преобразовать ‘create_date’ в дату, я вернул NaN. Код ниже:
df = pd.read_csv(fdata)
df = df.assign(form_date=pd.to_datetime(df['create_date']).dt.date)
pvt = pd.pivot_table(df,index=['form_date','operid'],values=['rquid'],aggfunc='count',dropna=False)
print(pvt)
Результат:
form_date count(rquid)
2021-05-24
(operid)
2 NaN
3 Nan
2021-05-22
(operid)
2 NaN
3 NaN
Если я использую index=[‘create_date’,’operid’] — это работает. Если я использую index=[‘form_date’] — это тоже работает!, но [‘form_date’,’operid’] — не работает.
Комментарии:
1. Пожалуйста, добавьте образец вашего csv-файла к вопросу, чтобы мы могли воспроизвести проблему.