#r #logistic-regression #mixed-models
#r #логистическая регрессия #смешанные модели
Вопрос:
Я пытаюсь запустить логистическую регрессию, но для предметного проектирования, поэтому в итоге я использовал обобщенную смешанную модель ( glmer
и lme
функции в R). Существует один предиктор (с 3 условиями) и двоичный результат, кодируемый как 0 или 1.
Мне было интересно, есть ли у кого-нибудь советы о том, какую модель лучше использовать и почему.
У меня также возникают проблемы с интерпретацией выходных данных, и в сводке, похоже, отсутствует одно из трех условий в моем предикторе. Когда я запускаю приведенный ниже код:
D1_data <- read.table("data", header = TRUE, sep = ",")
print(D1_data)
library(nlme)
model <- lme(output ~ condition, data = D1_data, random = ~1|participant)
anova(model)
summary(model)
log.model <- glmer(output ~ condition (1|participant), data=D1_data, family=binomial(link=logit))
summary(log.model)
anova(log.model)
Сводка включает только первые два условия (в обоих случаях), например:
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 40.03 427.04 0.094 0.925
condition1 -39.63 427.04 -0.093 0.926
condition2 -37.07 427.04 -0.087 0.931
Хотя должно быть третье условие. В чем здесь проблема?
Комментарии:
1. «Какая модель лучше и почему» и как интерпретировать выходные данные — это статистика, а не программирование, поэтому вопрос будет гораздо более уместным в stats.stackexchange.com а не здесь, при переполнении стека.
2. Как правило, когда у вас есть
k
уровни категориальной переменной, первый уровень считается «эталонным уровнем», и именно для этого подходит перехват. Все остальные оценки приведены в сравнении с эталонным уровнем.3.Этот вопрос очень широкий (понимание того, какую модель использовать, почему и для интерпретации выходных данных)… Вероятно, слишком широко для stats.stackexchange.com . Я бы предложил проверить эти ресурсы GLMM в качестве места для начала: bbolker.github.io/mixedmodels-misc/glmmFAQ.html bbolker.github.io/mixedmodels-misc/ecostats_chap.html