#r
Вопрос:
Я скачал этот набор данных, и когда я строю его, он явно нестационарный
df <- read.csv('https://raw.githubusercontent.com/ourcodingclub/CC-time-series/master/monthly_milk.csv')
plot(df,type="l")
Но когда я применяю Расширенный тест Дики-Фуллера, я получаю значение р 0,01, что означает, что есть основания отвергнуть нулевое значение, что ряд нестационарен. Я озадачен тем, почему это происходит. Это потому, что уровень доверия в основном слишком высок, или происходит что-то еще?
adf.test(df[,2])
#> Augmented Dickey-Fuller Test
#>
#> data: df[, 2]
#> Dickey-Fuller = -9.9714, Lag order = 5, p-value = 0.01
#> alternative hypothesis: stationary
Спасибо Ник Рэй
Ответ №1:
Имейте в виду, что тест УАПД включает в себя постоянную тенденцию. Как только вы свернете тренд своей серии, она действительно будет выглядеть неподвижной. Попробуйте сделать следующее
df$index <- seq(1,168,1)
lm(milk_prod_per_cow_kg ~index,data=df)
coef <- summary(lm(milk_prod_per_cow_kg ~index,data=df))$coefficients[2,1]
df$detrended <- df$milk_prod_per_cow_kg-df$index*coef
plot(df$detrended,type="l")
Как вы можете видеть, ряд всегда возвращается к чему-то близкому к исходному значению после нескольких наблюдений. УАПД проверяет, являются ли большие скачки в серии постоянными, т. е. влияют на все последующие значения в серии после снятия тренда серии. В этом случае скачки явно временные.
У меня недостаточно репутации, чтобы публиковать изображения, но вот ссылка imgur на серию, которая нестационарна даже после того, как вы ее изменили: https://i.imgur.com/gc5FEtX.png
На основе свободно доступных данных Фреда.
Комментарии:
1. Ах да, я действительно задавался этим вопросом — если вы возьмете первые различия временных рядов в моем посте, вы получите стационарный ряд, спасибо
2. Боюсь, что это неверно. Если ряд является стационарным только после того, как вы возьмете первое различие, то это различие является стационарным , и тест ADF может дать вам большое значение p. Низкое значение p, которое вы получили, связано с тем, что ряд кажется стационарным по тренду . Существует большая разница между разницей и стационарностью тренда, например, гораздо проще делать прогнозы относительно стационарных процессов тренда.