Как мне создать список ggplots?

#r #ggplot2

#r #ggplot2

Вопрос:

У меня есть эти три фрейма данных и эта функция

 set.seed(1)
df1 <-
  data.frame(
    x = c("cat", "dog"),
    y = sample(1:100, 20),
    z = seq(ymd("2020-01-01"), ymd("2020-01-20"), by = "1 day")
  )

df2 <-
  data.frame(
    x = c("red", "green"),
    y = sample(1:100, 20),
    z = seq(ymd("2020-01-01"), ymd("2020-01-20"), by = "1 day")
  )

df3 <-
  data.frame(
    x = c("up", "down"),
    y = sample(1:100, 20),
    z = seq(ymd("2020-01-01"), ymd("2020-01-20"), by = "1 day")
  )


dataframes <-
  c("df1", "df2", "df3")

exploreDataFrames <- function(dataframes, sequence = seq_along(dataframes)){
  
  for (i in seq_along(sequence)){
    print(get(dataframes[i]))
    
    gg <-
      get(dataframes[i]) %>% 
      ggplot(aes(z, y, group = 1))  
      geom_line()  
      facet_wrap(~get(names(get(dataframes[i]))[1]))
    
    return(gg)
  }
}

exploreDataFrames(dataframes[3])
  

Я бы хотел, чтобы моя функция возвращала список с тремя записями:

 list[1][1] <- name_of_the_dataframe
list[1][2] <- copy_of_the_complete_dataframe
list[1][3] <- ggplot_object
  

Моя цель — иметь единый список и выполнять итерации по диаграммам ggplot, быстро разбивать его по имени определенного фрейма данных и извлекать полный фрейм данных.

Что мне нужно изменить в моей функции, чтобы сделать это возможным?

Ответ №1:

Вы можете использовать

 l = sapply(dataframes, function (dfname) {
      ggplot(get(dfname) , aes(z, y, group = 1))  
      geom_line()  
      facet_wrap(~get(names(get(dfname))[1]))
    }, simplify = FALSE, USE.NAMES = TRUE)
  

имена data.frame затем в names(l)

 names(l[1])
# [1] "df1" 
  

и данные находятся в

 l[[1]]$data

#     x  y          z
#1  cat 68 2020-01-01
#2  dog 39 2020-01-02
#3  cat  1 2020-01-03
#4  dog 34 2020-01-04
#5  cat 87 2020-01-05
#6  dog 43 2020-01-06
#7  cat 14 2020-01-07
#8  dog 82 2020-01-08
#9  cat 59 2020-01-09
#10 dog 51 2020-01-10
#11 cat 85 2020-01-11
#12 dog 21 2020-01-12
#13 cat 54 2020-01-13
#14 dog 74 2020-01-14
#15 cat  7 2020-01-15
#16 dog 73 2020-01-16
#17 cat 79 2020-01-17
#18 dog 37 2020-01-18
#19 cat 83 2020-01-19
#20 dog 97 2020-01-20
  

Комментарии:

1. Как это sapply работает? Я не уверен, как вы смогли получить имена и данные в l объекте

2. sapply — это своего рода цикл. Использование simply = F заставляет его возвращать список. Использование USE.NAMES = TRUE заставляет его называть каждый элемент списка после векторных элементов

3. Потрясающе! Как заставить его также доставлять фрейм данных?

4. ggplot творит это волшебство за вас. Попробуйте gg$data на любом объекте ggplot. Графики сохраняются вместе с данными, которые их создают.

5. Это так здорово, это отличный ответ @dww

Ответ №2:

Вам нужно инициализировать весь список, прежде чем начинать его заполнять. Поскольку у вас есть вложенный уровень в списке, вам также необходимо инициировать этот «внутренний» список:

 set.seed(1)
df1 <-
  data.frame(
    x = c("cat", "dog"),
    y = sample(1:100, 20),
    z = seq(ymd("2020-01-01"), ymd("2020-01-20"), by = "1 day")
  )
df2 <-
  data.frame(
    x = c("red", "green"),
    y = sample(1:100, 20),
    z = seq(ymd("2020-01-01"), ymd("2020-01-20"), by = "1 day")
  )

df3 <-
  data.frame(
    x = c("up", "down"),
    y = sample(1:100, 20),
    z = seq(ymd("2020-01-01"), ymd("2020-01-20"), by = "1 day")
  )


dataframes <-
  c("df1", "df2", "df3")

exploreDataFrames <- function(dataframes, sequence = seq_along(dataframes)){
  
  ll <- list()
  
  for (i in seq_along(sequence)){
    ll[[i]] <- list()
    ll[[i]][[1]] <- dataframes[i]
    # print(get(dataframes[i]))
    ll[[i]][[2]] <- get(dataframes[i])
    ll[[i]][[3]] <- 
      get(dataframes[i]) %>% 
      ggplot(aes(z, y, group = 1))  
      geom_line()  
      facet_wrap(~get(names(get(dataframes[i]))[1]))
    
  }
  return(ll)
}

out <- exploreDataFrames(dataframes)
  

Ответ №3:

Чтобы вернуть список, который запрашивает вопрос, создайте список для хранения объектов перед for циклом, с длиной, установленной на length(sequence) , и присвоите значения в цикле.

 exploreDataFrames <- function(dataframes, sequence = seq_along(dataframes)){
  
  out_list <- vector("list", length = length(sequence))
  for (i in seq_along(sequence)){
    dftmp <- get(dataframes[i])
    print(dftmp)
    
    gg <-
      dftmp %>% 
      ggplot(aes(z, y, group = 1))  
      geom_line()  
      facet_wrap(~get(names(dftmp)[1]))
    
    out_list[[i]]$data.name <- dataframes[i]
    out_list[[i]]$data <- dftmp
    out_list[[i]]$gg.plot <- gg
  }
  out_list
}

exploreDataFrames(dataframes[3])
  

Это отобразит out_list[[1]]$gg.plot объект, поскольку возвращаемое значение функции ничему не присваивается, оно возвращается к .GlobalEnv .