#r #plm #generalized-method-of-moments
#r #plm #обобщенный метод моментов
Вопрос:
Я работаю над набором данных панели с N = 30 странами и T = 15 годами. Я использую R
и plm
пакет для своего анализа. Основываясь на исследованиях Бланделла-Бонда (1998) и Арельяно-Бовера (1995), я решил использовать модель System-GMM onestep, только с отдельными эффектами. Однако я немного запутался в том, как использовать pgmm
функцию, для которой требуется многосоставная формула для указания модели с IVs и с результатом теста Саргана-Хансена, который я получаю. Чтобы было более понятно, вот несколько примеров кода, которые я пробовал, результаты оценок и sargan
теста. В моей модели я рассматриваю зависимую переменную с запаздыванием и экзогенный регрессор. Чтобы не делать мой пост слишком длинным, я просто сообщаю код модели и основные результаты настолько аккуратно, насколько могу:
sy_gmm1 <- pgmm(log(GWPcap) ~ lag(log(GWPcap)) log(GDPcap)|lag(log(GWPcap),2:15) log(GDPcap), data = europanel,
index = c("country","year"), model = "onestep", effect = "individual", transformation = "ld")
sy_gmm2 <- pgmm(log(GWPcap) ~ lag(log(GWPcap)) log(GDPcap)|lag(log(GWPcap),2:15) | log(GDPcap), data = europanel,
index = c("country","year"), model = "onestep", effect = "individual", transformation = "ld")
sy_gmm3 <- pgmm(log(GWPcap) ~ lag(log(GWPcap)) log(GDPcap) | lag(log(GWPcap),2) log(GDPcap), data = europanel,
index = c("country","year"), model = "onestep", effect = "individual", transformation = "ld")
sy_gmm4 <- pgmm(log(GWPcap) ~ lag(log(GWPcap)) log(GDPcap)|lag(log(GWPcap),2) | log(GDPcap), data = europanel,
index = c("country","year"), model = "onestep", effect = "individual", transformation = "ld")
sy_gmm5 <- pgmm(log(GWPcap) ~ lag(log(GWPcap)) log(GDPcap) | lag(log(GWPcap),2) lag(log(GDPcap),1:2), data = europanel,
index = c("country","year"), model = "onestep", effect = "individual", transformation = "ld")
sy_gmm6 <- pgmm(log(GWPcap) ~ lag(log(GWPcap)) log(GDPcap)|lag(log(GWPcap),2) | lag(log(GDPcap),1:2), data = europanel,
index = c("country","year"), model = "onestep", effect = "individual", transformation = "ld")
# Coefficients and p-values of estimates
Estimate p.value Model
lag(log(GWPcap)) 0.90340911 1.525370e-86 1
log(GDPcap) 0.06214275 1.965823e-02 1
lag(log(GWPcap)) 0.97250426 0.000000e 00 2
log(GDPcap) 0.02222075 1.383774e-01 2
lag(log(GWPcap)) 0.81905400 2.615214e-47 3
log(GDPcap) 0.10822697 8.291284e-04 3
lag(log(GWPcap)) 0.82343976 4.873484e-16 4
log(GDPcap) 0.11164469 7.294118e-02 4
lag(log(GWPcap)) 0.84762245 2.754039e-87 5
log(GDPcap) 0.09281759 1.636567e-04 5
lag(log(GWPcap)) 0.86280993 3.843798e-104 6
log(GDPcap) 0.08809634 3.325890e-04 6
# Sargan test
stat df p.value
sargan1 30.00000 128 1.0000000
sargan2 30.00000 104 1.0000000
sargan3 30.00000 50 0.9888352
sargan4 29.64127 26 0.2827384
sargan5 30.00000 63 0.9998660
sargan6 30.00000 28 0.3632178
Как вы можете видеть в моделях 2, 4 и 6, я поместил экзогенный регрессор log(GDPcap)
в третью часть формулы, отделив его от зависимых инструментов с запаздыванием . Я не знаю, правильно ли это задавать формулу, поскольку в документации R указано, что она необходима для «обычных инструментов». Что это значит?
Учитывая это сомнение, я хотел провести эксперимент в модели 6, используя lag(log(GDPcap))
и результаты, которые я получил в оценках, log(GDPcap)
значительны, и в тесте Sargan они кажутся явно хорошими.
Кроме того, я заметил разные результаты, которые я получил с помощью теста Саргана, в частности, в отношении степеней свободы, которые очень связаны с количеством инструментов, которые я использую, и значением p. Из того, что я прочитал, использование слишком большого количества инструментов может быть палкой о двух концах, особенно учитывая размер моей выборки, и тест Саргана-Хансена может пострадать, давая слишком высокое значение p. Итак, мой вопрос в том, какая из этих шести моделей была написана правильно и как я должен интерпретировать полученные результаты, как в оценках (в некоторых моделях экзогенный регрессор незначителен), так и в тесте?
Я надеюсь, что я был ясен, и что кто-то может разрешить мои сомнения. Заранее спасибо.
Комментарии:
1. перекрестный пост: stats.stackexchange.com/questions/491992 /…
2. Извините за двойной пост. Я понял, что, возможно, лучше спросить о перекрестной проверке, потому что это скорее статистический вопрос, чем о коде. Для кода мне просто нужно было выяснить, как настроить формулу. При необходимости я удаляю сообщение здесь и оставляю только сообщение в CV. Спасибо.