пропущенные значения временных рядов tsfresh

#python #time-series #tsfresh

#python #временные ряды #tsfresh

Вопрос:

Меня смущает формат ввода tsfresh. Могу ли я предоставить фрейм данных с пропущенными значениями для разных идентификаторов? Например, временные ряды 1 {t0: 1, t2: 4, t5: 1} и временные ряды 2 {t1: 5, t2: 2} . Должен ли я заполнить пропущенные значения (t1, t3 и т. Д.) 0? заранее спасибо

Комментарии:

1. Пробовали ли вы экспериментально разные стратегии, чтобы увидеть, есть ли измеримая разница для некоторых функций?

Ответ №1:

tsfresh не «заботится» о временных записях ваших данных. Большинству его функциональных калькуляторов не обязательно иметь фиксированные временные интервалы (например, среднее значение временных рядов остается неизменным, независимо от того, о каких временных метках мы говорим). Так что да, технически возможно иметь разное время для разных идентификаторов.

При этом некоторые калькуляторы функций полагаются на временную метку и имеют надлежащие временные интервалы (например, преобразование Фурье). Однако существует много разных способов заполнения этих пропущенных значений, которые требуют большого знания предметной области. Вот tsfresh почему не делает этого «автоматически». Однако многие библиотеки (например, pandas) предоставляют для этого множество возможностей, например, с использованием методов передискретизации.