Результаты расширенного теста Дики-Фуллера

#r

Вопрос:

Я скачал этот набор данных, и когда я строю его, он явно нестационарный

 df <- read.csv('https://raw.githubusercontent.com/ourcodingclub/CC-time-series/master/monthly_milk.csv')
plot(df,type="l")
 

Но когда я применяю Расширенный тест Дики-Фуллера, я получаю значение р 0,01, что означает, что есть основания отвергнуть нулевое значение, что ряд нестационарен. Я озадачен тем, почему это происходит. Это потому, что уровень доверия в основном слишком высок, или происходит что-то еще?

 adf.test(df[,2])

#> Augmented Dickey-Fuller Test
#> 
#> data:  df[, 2]
#> Dickey-Fuller = -9.9714, Lag order = 5, p-value = 0.01
#> alternative hypothesis: stationary
 

Спасибо Ник Рэй

Ответ №1:

Имейте в виду, что тест УАПД включает в себя постоянную тенденцию. Как только вы свернете тренд своей серии, она действительно будет выглядеть неподвижной. Попробуйте сделать следующее

 df$index <- seq(1,168,1)
lm(milk_prod_per_cow_kg ~index,data=df)
coef <- summary(lm(milk_prod_per_cow_kg ~index,data=df))$coefficients[2,1]
df$detrended <- df$milk_prod_per_cow_kg-df$index*coef
plot(df$detrended,type="l")
 

Как вы можете видеть, ряд всегда возвращается к чему-то близкому к исходному значению после нескольких наблюдений. УАПД проверяет, являются ли большие скачки в серии постоянными, т. е. влияют на все последующие значения в серии после снятия тренда серии. В этом случае скачки явно временные.

У меня недостаточно репутации, чтобы публиковать изображения, но вот ссылка imgur на серию, которая нестационарна даже после того, как вы ее изменили: https://i.imgur.com/gc5FEtX.png

На основе свободно доступных данных Фреда.

Комментарии:

1. Ах да, я действительно задавался этим вопросом — если вы возьмете первые различия временных рядов в моем посте, вы получите стационарный ряд, спасибо

2. Боюсь, что это неверно. Если ряд является стационарным только после того, как вы возьмете первое различие, то это различие является стационарным , и тест ADF может дать вам большое значение p. Низкое значение p, которое вы получили, связано с тем, что ряд кажется стационарным по тренду . Существует большая разница между разницей и стационарностью тренда, например, гораздо проще делать прогнозы относительно стационарных процессов тренда.