Можно ли принудительно ввести определенную переменную в bestglm?

#r #logistic-regression #glm

Вопрос:

Мой набор данных содержит в общей сложности 13 переменных, и это тот glm, который у меня есть в настоящее время.

 result2 = bestglm(training_set,IC = "AIC", family = binomial, method = "exhaustive")  

Хотя это работает нормально и дает мне лучшую модель с использованием критерия AIC, созданная модель не включает переменную 1 (var1), которая мне нужна для моей модели.

Можно ли включить var1 в приведенный выше код таким образом, чтобы он возвращал лучшую модель с включенным в нее v1?

Спасибо.

Комментарии:

1. Это кажется странным желанием, но без дополнительной информации о деталях трудно сказать. Возможно , вы могли бы найти, какая переменная, включенная в модель, лучше всего коррелирует с var1 ней, и удалить ее из своего фрейма данных перед повторным запуском, или просто отметить переменные, используемые в модели, созданной на bestglm основе, и запустить стандарт glm с этими переменными плюс var1 . Документы, похоже, не предлагают простого способа настаивать на сохранении произвольной переменной.

2. Большое спасибо!

Ответ №1:

Вы можете посмотреть result2$BestModels и посмотреть, включает ли какая-либо из топовых моделей нужную вам переменную (var1). Если это так, запустите a glm с указанными переменными.
Если ни один из них не использует var1, увеличьте количество топ-моделей в вашем bestglm вызове с 5 по умолчанию.

В справке(«bestglm») есть ссылка на «force.in», но это никуда не ведет, и если я попытаюсь его использовать, это предупредит меня, что дополнительный аргумент будет проигнорирован.

Комментарии:

1. Большое спасибо!