Интерпретация противоречивых результатов регрессии

#regression #linear-regression

#регрессия #линейная регрессия

Вопрос:

У меня есть небольшой вопрос относительно интерпретации коэффициентов регрессии. Допустим, например, у меня есть данные, которые охватывают трехнедельный период времени, и что у меня есть простые линейные уравнения следующим образом:

y ~ x

Допустим, я запускаю регрессию за этот трехнедельный период времени таким образом, что для коэффициента x я нахожу, что он равен 0.0032 за весь период.

Теперь, допустим, я хочу разделить период и вместо этого запускать регрессию по неделям, чтобы за неделю 1 для x я получал коэффициент 0.00977 , за неделю 2 я получаю 0.02877 , а за неделю 3 я получаю 0.00318 .

Я немного смущен этим, на неделе 1 меньше данных по сравнению с неделей 2 и неделей 3, но на неделе 2 и 3 объем данных практически одинаков, поэтому я не уверен, почему результаты регрессии за неделю 3 очень похожи на общие результаты регрессии за весь период. Кто-нибудь может предоставить какие-либо идеи о том, почему это может быть так? Естественно, поскольку я не предоставил никаких данных, было бы невозможно, чтобы кто-нибудь назвал мне точную причину, но я в основном ищу некоторые идеи о том, почему я получаю эти результаты, и, возможно, есть ли способ измерить или объяснить это явление. Заранее спасибо.

Комментарии:

1. Я предлагаю визуальный осмотр и сравнение диаграмм рассеяния для каждого набора данных регрессии.

2. Да, это то, что я понял, я надеялся, что может быть альтернативный метод, поскольку мои данные немного сложно отобразить значимым образом. Спасибо!

3. Просто идея: вы могли бы добавить индикаторы недели (каждая неделя получает собственный перехват) для контроля ненаблюдаемых изменений по неделям. Скажем, y = x w1 w2. Вы также можете разрешить отдельные наклоны в неделю, y = x w1x w1 w2x w2. Это позволяет проверить, отличаются ли оцененные коэффициенты за неделю. Таким образом, вы можете получить представление о том, что такое DGP. Детализация линейных моделей, подобных этой, иногда помогает понять структуру данных и увидеть, являются ли оценки надежными.