Построение спецификаций нескольких моделей на одном ggplot

#r #ggplot2 #dplyr #tidy

#r #ggplot2 #dplyr #аккуратный

Вопрос:

Я работаю с линейной моделью, и я хотел бы показать, насколько надежен эффект для разных спецификаций, используя одноточечный график различий в средних значениях в разных условиях. Это все, что я получил (MWE ниже).

У меня есть три важных фиктивных показателя обработки плюс пять ковариаций.

Что я хочу сделать сейчас, так это наложить оценки трех обработок на этом графике на графики для пяти дополнительных моделей, каждая из которых включает разные ковариации, а затем добавить легенду / формы / цвета, чтобы их различать. Я предполагаю, что мог group_by() бы использовать и do() пять отдельных моделей, но имена доверительных интервалов заменяются, и я не уверен, как заставить ggplot читать более одной модели (особенно в tidyverse, которая мне чужда).

Я не смог понять это или найти какие-либо существующие потоки, которые вполне справляются с подобной проблемой. Можно ли это сделать? Спасибо за любые советы!

MWE с примерами данных:

 treatment1 = rep(seq(0, 1, 1), 300)
treatment2 = sample(seq(from = 0, to = 1, by = 1), size = 300, replace = TRUE)
treatment3 = rep(seq(0, 1, 1), each=300)
response = rnorm(n = 300, mean = 3, sd = 1)
cov1 = rnorm(n = 300, mean = 0, sd = 1)*response
cov2 = rnorm(n = 300, mean = 0, sd = 1)/response
cov3 = rnorm(n = 300, mean = 0, sd = 1)-response
cov4 = rnorm(n = 300, mean = 0, sd = 1) response
cov5 = rnorm(n = 300, mean = 0, sd = 1)*log(response)
df <- data.frame(treatment1,treatment2,treatment3,
           response,cov1,cov2,cov3,cov4,cov5)

model <- df %>% group_by(treatment1, treatment2,treatment3) %>% 
  do(data.frame(tidy(lm(response ~ treatment1*treatment2*treatment3, data = .),conf.int=T, conf.level = 0.95 )))

facet.labs <- c("T1=0", "T1=1")
names(facet.labs) <- c("0", "1")


model$treatment3 <-factor(model$treatment3, labels = c("T3=1","T3=0"))
model$treatment3 <-factor(model$treatment3, levels = c("T3=1","T3=0"))

ggplot(model, aes(x=estimate, y=treatment2, shape = treatment3))  
  geom_pointrange(position = position_dodge(width = 1), aes(xmin=conf.low, xmax=conf.high), size=.75)  
  theme(panel.grid.major = element_blank(), 
        panel.grid.minor = element_blank(), 
        panel.background = element_blank(),
        axis.line = element_line(colour = "black"),
        panel.border = element_rect(colour = "black", fill=NA, size=.8))  
  scale_y_continuous(name ="", breaks = c(.1,1.22), labels=c("T2=0","T2=1"))  
geom_vline(xintercept=0, linetype="dotted")  
  labs(title="")   xlab("")   
  labs(shape="")  theme(axis.ticks = element_blank())  
  theme(axis.text.y = element_text(angle = 90, vjust = 0.5, hjust=1))  #,col="Treatment 1") 
  guides(fill = guide_legend(override.aes = list(linetype = 0,fill=NA))) 
  facet_wrap(~treatment1, labeller = labeller(treatment1 = facet.labs))  
  guides(shape = guide_legend(reverse=T))

  

Комментарии:

1. Можете ли вы показать или вручную нарисовать ожидаемый результат?

Ответ №1:

Возможно, это соответствует вашим потребностям. Пожалуйста, обратите внимание, что я включил только 3 модели. Вы можете добавить больше.

 library(broom)

treatment1 = rep(seq(0, 1, 1), 300)
treatment2 = sample(seq(from = 0, to = 1, by = 1), size = 300, replace = TRUE)
treatment3 = rep(seq(0, 1, 1), each=300)
response = rnorm(n = 300, mean = 3, sd = 1)
cov1 = rnorm(n = 300, mean = 0, sd = 1)*response
cov2 = rnorm(n = 300, mean = 0, sd = 1)/response
cov3 = rnorm(n = 300, mean = 0, sd = 1)-response
cov4 = rnorm(n = 300, mean = 0, sd = 1) response
cov5 = rnorm(n = 300, mean = 0, sd = 1)*log(response)
df1 <- data.frame(treatment1,treatment2,treatment3,
                 response,cov1,cov2,cov3,cov4,cov5)

facet.labs <- c("T1=0", "T1=1")
names(facet.labs) <- c("0", "1")

model1 <- df1 %>% group_by(treatment1, treatment2,treatment3) %>% 
  do(data.frame(tidy(lm(response ~ treatment1*treatment2*treatment3, data = .),conf.int=T, conf.level = 0.95 )))

#model1$treatment3 <-factor(model1$treatment3, labels= c("T3=1","T3=0"), levels = c("T3=1","T3=0"))

model11 <- data.frame(model1,model=1)

treatment1 = rep(seq(0, 1, 1), 300)
treatment2 = sample(seq(from = 0, to = 1, by = 1), size = 300, replace = TRUE)
treatment3 = rep(seq(0, 1, 1), each=300)
response = rnorm(n = 300, mean = 4, sd = 1)
cov1 = rnorm(n = 300, mean = 0, sd = 1)*response*2
cov2 = rnorm(n = 300, mean = 0, sd = 1)/response
cov3 = rnorm(n = 300, mean = 0, sd = 1)-response
cov4 = rnorm(n = 300, mean = 0, sd = 1) response
cov5 = rnorm(n = 300, mean = 0, sd = 1)*log2(response)
df2 <- data.frame(treatment1,treatment2,treatment3,
                  response,cov1,cov2,cov3,cov4,cov5)

model2 <- df2 %>% group_by(treatment1, treatment2, treatment3) %>% 
  do(data.frame(tidy(lm(response ~ treatment1*treatment2*treatment3, data = .),conf.int=T, conf.level = 0.95 )))

#model2$treatment3 <-factor(model2$treatment3, labels = c("T3=1","T3=0"), levels = c("T3=1","T3=0"))

model22 <- data.frame(model2,model=2)

cov1 = rnorm(n = 300, mean = 0, sd = 1)*response*0.5
cov5 = rnorm(n = 300, mean = 0, sd = 1)*log10(response)
df3 <- data.frame(treatment1,treatment2,treatment3,
                  response,cov1,cov2,cov3,cov4,cov5)

model3 <- df3 %>% group_by(treatment1, treatment2, treatment3) %>% 
  do(data.frame(tidy(lm(response ~ treatment1*treatment2*treatment3, data = .),conf.int=T, conf.level = 0.95 )))

#model3$treatment3 <-factor(model2$treatment3, labels = c("T3=1","T3=0"), levels = c("T3=1","T3=0"))

model33 <- data.frame(model3,model=3)

model <- rbind(model11,model22,model33)

myshapes <- c(15, 17)
mycolors <- c("blue","orange")
mygroup <- c("T3=1","T3=0")

modelb <- transform(model,trt2_model = paste0("model ",model, " - trt2 ", treatment2))

ggplot(modelb, aes(x=estimate, y=trt2_model, xmin=conf.low, xmax=conf.high, 
                  shape = factor(treatment3), color=factor(treatment3) ))   
  geom_pointrange(position = position_dodge(width = 1), aes(xmin=conf.low, xmax=conf.high), size=.75)  
  theme(panel.grid.major = element_blank(), 
        panel.grid.minor = element_blank(), 
        panel.background = element_blank(),
        legend.key = element_rect(fill = "white", colour = "white"),
        axis.ticks = element_blank(),
        axis.line = element_line(colour = "black"),
        #axis.text.y = element_text(angle = 90, vjust = 1, hjust=0.5),
        panel.border = element_rect(colour = "blue", fill=NA, size=.8))  
  #scale_y_continuous(name ="", breaks = c(.1,1.22), labels=c("T2=0","T2=1"))  
  geom_vline(xintercept=0, linetype="dotted", lwd=1, color="red")  
  labs(shape="", x="", y="", title="")  
  scale_shape_manual(name = " ",
                     labels = mygroup,
                     values = myshapes)    ## choice of shapes
  scale_color_manual(name = " ",
                     labels = mygroup,
                     values = mycolors )    ## colors of your choice
  
  guides(color='none', fill = guide_legend(override.aes = list(linetype = 0,fill=NA))) 
  facet_wrap(~treatment1, labeller = labeller(treatment1 = facet.labs))  
  guides(shape = guide_legend(override.aes=list(col=mycolors, lty=0, pt.cex=1.5, reverse=T)) )  
  theme_bw()
  

вывод

Комментарии:

1. Это невероятно! Не могу поверить, что это было так много работы. Спасибо, что показали мне, как это сделать.