#r #logistic-regression #glm
Вопрос:
Мой набор данных содержит в общей сложности 13 переменных, и это тот glm, который у меня есть в настоящее время.
result2 = bestglm(training_set,IC = "AIC", family = binomial, method = "exhaustive")
Хотя это работает нормально и дает мне лучшую модель с использованием критерия AIC, созданная модель не включает переменную 1 (var1), которая мне нужна для моей модели.
Можно ли включить var1 в приведенный выше код таким образом, чтобы он возвращал лучшую модель с включенным в нее v1?
Спасибо.
Комментарии:
1. Это кажется странным желанием, но без дополнительной информации о деталях трудно сказать. Возможно , вы могли бы найти, какая переменная, включенная в модель, лучше всего коррелирует с
var1
ней, и удалить ее из своего фрейма данных перед повторным запуском, или просто отметить переменные, используемые в модели, созданной наbestglm
основе, и запустить стандартglm
с этими переменными плюсvar1
. Документы, похоже, не предлагают простого способа настаивать на сохранении произвольной переменной.2. Большое спасибо!
Ответ №1:
Вы можете посмотреть result2$BestModels
и посмотреть, включает ли какая-либо из топовых моделей нужную вам переменную (var1). Если это так, запустите a glm
с указанными переменными.
Если ни один из них не использует var1, увеличьте количество топ-моделей в вашем bestglm
вызове с 5 по умолчанию.
В справке(«bestglm») есть ссылка на «force.in», но это никуда не ведет, и если я попытаюсь его использовать, это предупредит меня, что дополнительный аргумент будет проигнорирован.
Комментарии:
1. Большое спасибо!