#r #ggplot2
#r #ggplot2
Вопрос:
У меня есть эти три фрейма данных и эта функция
set.seed(1)
df1 <-
data.frame(
x = c("cat", "dog"),
y = sample(1:100, 20),
z = seq(ymd("2020-01-01"), ymd("2020-01-20"), by = "1 day")
)
df2 <-
data.frame(
x = c("red", "green"),
y = sample(1:100, 20),
z = seq(ymd("2020-01-01"), ymd("2020-01-20"), by = "1 day")
)
df3 <-
data.frame(
x = c("up", "down"),
y = sample(1:100, 20),
z = seq(ymd("2020-01-01"), ymd("2020-01-20"), by = "1 day")
)
dataframes <-
c("df1", "df2", "df3")
exploreDataFrames <- function(dataframes, sequence = seq_along(dataframes)){
for (i in seq_along(sequence)){
print(get(dataframes[i]))
gg <-
get(dataframes[i]) %>%
ggplot(aes(z, y, group = 1))
geom_line()
facet_wrap(~get(names(get(dataframes[i]))[1]))
return(gg)
}
}
exploreDataFrames(dataframes[3])
Я бы хотел, чтобы моя функция возвращала список с тремя записями:
list[1][1] <- name_of_the_dataframe
list[1][2] <- copy_of_the_complete_dataframe
list[1][3] <- ggplot_object
Моя цель — иметь единый список и выполнять итерации по диаграммам ggplot, быстро разбивать его по имени определенного фрейма данных и извлекать полный фрейм данных.
Что мне нужно изменить в моей функции, чтобы сделать это возможным?
Ответ №1:
Вы можете использовать
l = sapply(dataframes, function (dfname) {
ggplot(get(dfname) , aes(z, y, group = 1))
geom_line()
facet_wrap(~get(names(get(dfname))[1]))
}, simplify = FALSE, USE.NAMES = TRUE)
имена data.frame затем в names(l)
names(l[1])
# [1] "df1"
и данные находятся в
l[[1]]$data
# x y z
#1 cat 68 2020-01-01
#2 dog 39 2020-01-02
#3 cat 1 2020-01-03
#4 dog 34 2020-01-04
#5 cat 87 2020-01-05
#6 dog 43 2020-01-06
#7 cat 14 2020-01-07
#8 dog 82 2020-01-08
#9 cat 59 2020-01-09
#10 dog 51 2020-01-10
#11 cat 85 2020-01-11
#12 dog 21 2020-01-12
#13 cat 54 2020-01-13
#14 dog 74 2020-01-14
#15 cat 7 2020-01-15
#16 dog 73 2020-01-16
#17 cat 79 2020-01-17
#18 dog 37 2020-01-18
#19 cat 83 2020-01-19
#20 dog 97 2020-01-20
Комментарии:
1. Как это
sapply
работает? Я не уверен, как вы смогли получить имена и данные вl
объекте2. sapply — это своего рода цикл. Использование
simply = F
заставляет его возвращать список. ИспользованиеUSE.NAMES = TRUE
заставляет его называть каждый элемент списка после векторных элементов3. Потрясающе! Как заставить его также доставлять фрейм данных?
4. ggplot творит это волшебство за вас. Попробуйте
gg$data
на любом объекте ggplot. Графики сохраняются вместе с данными, которые их создают.5. Это так здорово, это отличный ответ @dww
Ответ №2:
Вам нужно инициализировать весь список, прежде чем начинать его заполнять. Поскольку у вас есть вложенный уровень в списке, вам также необходимо инициировать этот «внутренний» список:
set.seed(1)
df1 <-
data.frame(
x = c("cat", "dog"),
y = sample(1:100, 20),
z = seq(ymd("2020-01-01"), ymd("2020-01-20"), by = "1 day")
)
df2 <-
data.frame(
x = c("red", "green"),
y = sample(1:100, 20),
z = seq(ymd("2020-01-01"), ymd("2020-01-20"), by = "1 day")
)
df3 <-
data.frame(
x = c("up", "down"),
y = sample(1:100, 20),
z = seq(ymd("2020-01-01"), ymd("2020-01-20"), by = "1 day")
)
dataframes <-
c("df1", "df2", "df3")
exploreDataFrames <- function(dataframes, sequence = seq_along(dataframes)){
ll <- list()
for (i in seq_along(sequence)){
ll[[i]] <- list()
ll[[i]][[1]] <- dataframes[i]
# print(get(dataframes[i]))
ll[[i]][[2]] <- get(dataframes[i])
ll[[i]][[3]] <-
get(dataframes[i]) %>%
ggplot(aes(z, y, group = 1))
geom_line()
facet_wrap(~get(names(get(dataframes[i]))[1]))
}
return(ll)
}
out <- exploreDataFrames(dataframes)
Ответ №3:
Чтобы вернуть список, который запрашивает вопрос, создайте список для хранения объектов перед for
циклом, с длиной, установленной на length(sequence)
, и присвоите значения в цикле.
exploreDataFrames <- function(dataframes, sequence = seq_along(dataframes)){
out_list <- vector("list", length = length(sequence))
for (i in seq_along(sequence)){
dftmp <- get(dataframes[i])
print(dftmp)
gg <-
dftmp %>%
ggplot(aes(z, y, group = 1))
geom_line()
facet_wrap(~get(names(dftmp)[1]))
out_list[[i]]$data.name <- dataframes[i]
out_list[[i]]$data <- dftmp
out_list[[i]]$gg.plot <- gg
}
out_list
}
exploreDataFrames(dataframes[3])
Это отобразит out_list[[1]]$gg.plot
объект, поскольку возвращаемое значение функции ничему не присваивается, оно возвращается к .GlobalEnv
.