#python #pandas #datetime #data-science
Вопрос:
У меня есть фрейм данных под названием данные, который включает в себя «Дату начала», «Дату окончания», «Страну», «Количество» и «Выбросы».
Я хочу создать новый фрейм данных, в котором я получаю результаты за день между «Датой начала» и «датой окончания», однако для каждой строки я хочу агрегировать данные для «Количества» и «Выбросов», разделив их на количество дней между диапазоном.
Я попытался сделать следующее для одной из колонок, чтобы посмотреть, какой результат я получу:
list = []
for idx, row in data.iterrows():
list.append(pd.DataFrame(data['Emissions'], columns=['Emissions'],
index=pd.date_range(start=row['StartDate'], end=row['EndDate'],
name='Date')))
Результаты были следующими. Он не может собирать данные о выбросах:
Комментарии:
1. вероятно, есть лучший способ, но, по крайней мере, чтобы исправить ваш код, я считаю, что здесь должна быть строка вместо данных:
pd.DataFrame(row['Emissions'], ...
2. Если вам нужна помощь, пожалуйста, укажите не менее 3 строк ваших данных, а также можете ли вы указать, сколько строк у вас в ваших реальных данных?