Моделирование мощности simR для нескольких фиксированных эффектов

#r #simulation #mixed-models

#r #Симуляция #смешанные модели

Вопрос:

Я хочу оценить требуемый размер выборки для исследования на основе моделирования с использованием экспериментальных данных. Моя модель выглядит следующим образом:

 model1 <- glmer(decision ~ 1   default   aest   obstruc   privatt   (1   default   aest   obstruc | id), family = 'binomial', data = pilot_data)
  

Пакет simR предлагает возможность расширения заданного набора данных, а затем вычисления мощности вашей модели на разных этапах увеличения числа (в моем случае числа участников), визуализируемого в powercurve. Вместо тестирования только одного фиксированного эффекта (с помощью fixed функции) Я хотел бы одновременно запускать powerCurve три моих основных эффекта (основными эффектами являются: default, aest и obstruction; privatt — управляющая переменная).
Моя идея состоит в том, чтобы использовать fcompare функцию и сравнить мою полную модель с нулевой моделью (только с перехватом).

Мой вопрос: является ли эта процедура статистически корректной? В конце я хочу проверить, где мой показатель мощности достигает 80%, и набрать соответствующее количество участников.

Код для расширения набора данных и создания powercurve выглядит следующим образом:

 model1_ext <- extend(model1, along='id', n='250')
pc_model1 <- powerCurve(model1_ext, fcompare(~ 1, method = 'pb'), along='id', nsim=1000 )
  

Ответ №1:

Я подозреваю, что вы собираетесь недооценить требуемый размер выборки.

Предлагаемый вами тест спрашивает: «значимы ли все эти эффекты, взятые вместе?». Но если вы хотите знать, важен ли конкретный эффект, вы требуете немного больше от своих данных, и поэтому вам, вероятно, понадобится больший размер выборки.

Размер вашей выборки обычно определяется вашим «самым сложным» вопросом, поэтому я бы рекомендовал использовать отдельную кривую мощности для каждого эффекта.


Если у вас возникли проблемы со временем моделирования, вероятно, можно использовать 'kr' вместо 'pb' . Анализ уже является приблизительным (поскольку мы никогда не знаем «истинных» значений параметров, которые мы используем для наших симуляций). Если вы беспокоитесь, что два теста могут дать разные результаты, вы можете перепроверить предлагаемый размер выборки с помощью 'pb' за один прогон powerSim .