Повторная выборка данных с помощью метода ‘mean’

#python #pandas

#python #панды

Вопрос:

Я хочу выполнить повторную выборку 15-минутных данных до 60-минутных данных с помощью функции pandas .resample с помощью метода ‘mean’, но по умолчанию этот метод принимает среднее значение значений 9:00, 9:15, 9:30 и 9:45 для 9:Временная метка 00 утра (в качестве примера). Есть ли способ вместо этого использовать среднее значение значений 8:15, 8:30, 8:45 и 9:00 для метки времени 9:00?

Входные данные:

 Generated On                CB_P
2019-01-01 08:15:00 00:00   0.187
2019-01-01 08:30:00 00:00   0.228
2019-01-01 08:45:00 00:00   0.242
2019-01-01 09:00:00 00:00   0.8270
2019-01-01 09:15:00 00:00   1.083
2019-01-01 09:30:00 00:00   3.022
2019-01-01 09:45:00 00:00   1.511
2019-01-01 10:00:00 00:00   1.568
2019-01-01 10:15:00 00:00   6.365
2019-01-01 10:30:00 00:00   8.23
2019-01-01 10:45:00 00:00   9.3
2019-01-01 11:00:00 00:00   14.311
2019-01-01 11:15:00 00:00   13.045
2019-01-01 11:30:00 00:00   11.05
2019-01-01 11:45:00 00:00   11.257
2019-01-01 12:00:00 00:00   13.367
2019-01-01 12:15:00 00:00   11.895
2019-01-01 12:30:00 00:00   9.245
2019-01-01 12:45:00 00:00   7.254
2019-01-01 13:00:00 00:00   15.773
2019-01-01 13:15:00 00:00   14.280
2019-01-01 13:30:00 00:00   17.258
2019-01-01 13:45:00 00:00   7.792
2019-01-01 14:00:00 00:00   6.893
2019-01-01 14:15:00 00:00   4.693
2019-01-01 14:30:00 00:00   4.271
2019-01-01 14:45:00 00:00   1.524
2019-01-01 15:00:00 00:00   1.495
2019-01-01 15:15:00 00:00   1.03
2019-01-01 15:30:00 00:00   0.364
2019-01-01 15:45:00 00:00   0.045
  

Ожидаемый результат:

 Generated On                CB_P
2019-01-01 09:00:00 00:00   0.371
2019-01-01 10:00:00 00:00   1.796
2019-01-01 11:00:00 00:00   9.5515
2019-01-01 12:00:00 00:00   12.180
2019-01-01 13:00:00 00:00   11.04
2019-01-01 14:00:00 00:00   11.556
2019-01-01 15:00:00 00:00   2.996
  

Комментарии:

1. mean Метод чего ?

2. Мой плохой, я отредактировал сообщение.

3. Это ваши ожидаемые выходные данные? У вас есть входные данные?

Ответ №1:

Значения смещения могут использоваться для повторной выборки. Пожалуйста, обратитесь к этому.

 df['Generated On'] = pd.to_datetime(df['Generated On'])
df.set_index('Generated On', inplace=True)
df2 = df.resample('1H', offset=15).mean()
df2.index = df2.index.strftime('%Y-%m-%d %H:%M:%S')
df2  
                    CB_P
Generated On    
2019-01-01 08:00:00 0.371000
2019-01-01 09:00:00 1.796000
2019-01-01 10:00:00 9.551500
2019-01-01 11:00:00 12.179750
2019-01-01 12:00:00 11.041750
2019-01-01 13:00:00 11.555750
2019-01-01 14:00:00 2.995750
2019-01-01 15:00:00 0.479667
  

Комментарии:

1. Спасибо за этот ответ. Это дало мне желаемый результат, но есть ли способ затем удалить смещение из индекса, потому что результирующий фрейм данных теперь не работает с остальной частью моего кода.