выбор переменных для наиболее подходящей модели с использованием GAM в R?

#r #variables #selection #gam #mgcv

#r #переменные #выбор #gam #mgcv

Вопрос:

Я также новичок в R, и я пытаюсь использовать mgcv для моделирования взаимосвязи между обилием рыбы и 11 факторами окружающей среды в качестве 11 объясняющих переменных.

y ~ s(x1) s (x2) … s (x11)

Я пробовал использовать слишком много моделей (из 1 переменной; 2 переменных …. 11 моделей переменных), затем использовал AIC для выбора наиболее подходящей модели. Однако я не смог запустить все модели одновременно.

Не могли бы вы помочь мне в этом вопросе. Было бы очень приятно, если бы вы могли поделиться кодами для этого. Спасибо,

NVN

Ответ №1:

Это не очень хороший способ сделать вывод, хотя может быть нормально, если вы заинтересованы только в прогнозировании.

Вместо этого рассмотрите возможность добавления select = TRUE в модель (это аргумент для gam() etc. Этот аргумент добавляет дополнительный штраф к нулевому пространству базиса (идеально гладкие части), что позволяет вам выполнять выбор модели, поскольку линейные члены в каждом сглаживании также уменьшаются до нуля (немного похоже на лассо) и, следовательно, также могут быть выбраны из модели.