Регрессионная модель для анализа данных в нескольких странах и за несколько лет (парадокс Симпсонов в множественной регрессии)?

#r #statistics #regression #linear-regression

#r #Статистика #регрессия #линейная регрессия

Вопрос:

Допустим, у меня есть эти данные за 1990-2020 годы для 20 разных стран:

(переменные просто составлены)

Зависимая переменная Приток прямых иностранных инвестиций (FDII)

Независимые переменные: уровень бедности (PR) Государственные субсидии (GS) Налоговые ставки (TS)

У меня было упражнение в классе, и продемонстрированный метод состоял в том, чтобы просто создать модель множественной регрессии (т. Е. в R будет lm (FDII ~ PR GS TS)), но, однако, похоже, что этот метод упустит взаимосвязи между переменными внутри каждой страны. Что, если взаимосвязь между переменными отрицательная / положительная на уровне страны, но меняется на противоположную, когда страны объединяются?

Комментарии:

1. То, о чем вы говорите, известно как взаимодействия , вы указываете их как искусство formula , к которому переходите lm . Простой ответ — измените все значения to * в вашей формуле, см. Раздел «Подробности lm «, в котором частично говорится: «Модели для lm указаны символически. Типичная модель имеет форму response ~ terms, где response — это (числовой) вектор ответа, а terms — это серия терминов, которая задает линейный предиктор для ответа. Спецификация first* second указывает на пересечение первого и второго. Это то же самое, что первый второй первый: второй «.