Какая может быть хорошая модель прогнозирования для использования?

#r #graph #statistics #regression #prediction

#r #График #Статистика #регрессия #прогнозирование

Вопрос:

Вот данные: Дата указана в месяцах, в моем примере их 24 (24 месяца или 2 года)

l <- data.frame(date = c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24))
k <- data.frame(cost = c(25,20,18,15,5,0,0,0,10,15,30,40,45,34,26,20,10,7,4,4,15,34,57,62))
m <- cbind(l,k)
ggplot(m, aes(m$date,m$cost)) geom_line()

Вывод графика:
введите описание изображения здесь

Что такое хорошая модель прогнозирования? Я думаю, что могу использовать полиномиальную регрессию, если я подмножу все максимальные значения и подмножу все минимальные значения. смотрите изображение ниже для лучшего понимания. (Красный для max, синий для min, линии были созданы с использованием paint для объяснения точки)

введите описание изображения здесь

Другой способ, я не знаю, как он называется, но я думаю, что они используют его для прогнозирования погоды, не уверен, как будет выглядеть формула для получения синей линии ниже. (Посмотрите на график ниже для лучшего понимания)

Какая была бы подходящая формула, чтобы получить синюю линию для прогнозирования точек, выделенных красным?? введите описание изображения здесь

Комментарии:

1. Похоже на данные временных рядов. Если у вас больше данных, используйте одну из моделей, которая проверяет тренд / сезонность (проверьте forecast пакет). Это ежедневно / ежемесячно / ежегодно?

2. Никогда не использовал пакет прогнозов, я думал, что могу использовать формулу регрессии, чтобы предсказать это. но мои данные большие, ежемесячные. Я хочу спрогнозировать стоимость акции с 1990 по 2019 год. эта акция, над которой я работаю, имеет данные, аналогичные этому примеру.

3. Это регрессия с префиксом auto

4. Допустим, я хочу спрогнозировать стоимость на 27-й и 30-й месяц, как бы я получил значения? Например, в summary(lm()) Я получаю значения перехвата и другие значения, которые могут помочь мне рассчитать точки

5. Регрессия не является правильным инструментом для этого. Ваши данные — это данные временных рядов (поскольку они ежемесячные). Вам следует изучить авторегрессию. Попробуйте поискать что-то вроде «введение в прогнозирование временных рядов с помощью R». Это должно помочь вам приступить к решению вашей проблемы!

Ответ №1:

Вот пример того, почему регрессия не подходит для прогнозирования с использованием этих данных. Модель «y = x * амплитуда * sin (pi * (x — center) / width) ^ 2 смещение», и хотя регрессия, по-видимому, хорошо подходит для некоторых значений большего набора данных x, я также вижу, что меньшие значения x подходят крайне плохо. Эта модель не очень хорошо соответствует данным во всех точках данных или областях данных и кажется мне бесполезной для целей прогнозирования, потому что экстраполяция вне данных настолько плоха.

bad_model

Комментарии:

1. Согласен. Кроме того, из-за временной природы значений x и очевидной сезонности, метод авторегрессии, включающий сезонную декомпозицию и / или прогнозирование, оказался бы гораздо более плодотворным, чем попытка подгонки полиномиальной или синусо-косинусной функции с использованием регрессии.