#python #pandas #group-by #time-series
#питон #панды #группа-по #временные ряды
Вопрос:
У меня есть набор данных временных рядов с двумя столбцами — время и значение. Примеры данных:
ts = pd.Series(np.random.randint(0, 500, size = (500)), index=pd.date_range("2000", freq="H", periods=500)) df = pd.DataFrame({'date_time':ts.index, 'values':ts.values})
Я хочу:
- Создайте пустой список значений
- Добавьте значение дня 1 часа 1 в список
- Сравните значение в день2, каждый час с соответствующим днем и часом на предыдущей неделе (например, понедельник 1 час дня сегодня и понедельник 1 час дня на прошлой неделе)
- Если значения совпадают, обновите список текущим значением, иначе остановите и отметьте значение
- Если значения одинаковы в 4, перейдите в тот же день, в тот же час на следующей неделе и повторите 3 и 4.
Я, честно говоря, не знаю, с чего начать. Я попытался сгруппироваться по неделям и сравнить значения, но это не имеет смысла, основываясь на приведенном выше алгоритме.
Помогите, пожалуйста