#r
#r
Вопрос:
Я обрабатываю набор данных для исследования «случай-контроль» с двоичной переменной результата, используя finalfit
пакет. При использовании finalfit
функции (которая включает glm
функцию для логистической регрессии, у меня возникают проблемы при включении более 11 объясняющих двоичных переменных.
Вот пример
library(dplyr)
library(finalfit)
#An example of the dataset:
o <- c(0,1,1,1,1,0,0,1,1,0,1,0) #would be the outcome variable
exp1 <- c(0,0,1,0,1,1,0,0,1,0,1,1)
exp2 <- c(1,0,0,0,0,1,1,0,1,0,0,1)
exp3 <- c(0,1,1,1,1,1,1,1,1,0,0,1) #would be the explanatory variable and so on....
data<-as.dataframe(o,exp1,exp2,exp3) #and the other variables
explanatory = c("exp1", "exp2", "exp2")
dependent = 'o'
data %>%
finalfit(dependent, explanatory)
При запуске кода с менее чем 11 объясняющими переменными он работает просто отлично, но вылетает с более чем 11 объясняющими переменными.
Ошибка в том, что столбцы Tibble должны иметь совместимые размеры. * Размер 5: существующие данные. * Размер 4: столбец в позиции 5. ℹ Перерабатываются только значения размера one.
Ответ №1:
Нет, предела нет. Он ведет себя точно так же, как glm
. Проблема, вероятно, связана с базовой моделью. Проверьте, что он сходится с:
data %>%
glmmulti(dependent, explanatory)