#r #dplyr #tidyverse #tidyr
Вопрос:
Я знаю об pivot_longer
этом, хотя это поставило меня в тупик, так как я не уверен, что мне следует добавить в values_to
аругмент. Изображение ниже-это почти все, что мне нужно
Код:
df <- structure(list(A = 1:3, B = c("a", "b", "c"), C = c("d", "e",
"f"), D = c(10L, 15L, 20L), E = c(20L, 30L, 40L)), class = "data.frame", row.names = c(NA,
-3L))
Моя попытка:
library(tidyverse)
df %>% pivot_longer(cols=3,names_to="new",values_to="value")
** Будет действительно полезно, если вы также сможете добавить способ преобразования вывода в ввод.
Должен ли я просто сделать bind_rows()
это вместо этого ?
Комментарии:
1.
df %>% pivot_longer(cols = B:C) %>% select(-name)
Ответ №1:
I. ввод -> вывод
Вы можете просто разделить свой фрейм данных и связать его снова
library(dplyr)
df1 <- df %>% select(A, B, D, E)
df2 <- df %>% select(A, C, D, E) %>% rename(B = C)
bind_rows(df1, df2)
A B D E
1 1 a 10 20
2 2 b 15 30
3 3 c 20 40
4 1 d 10 20
5 2 e 15 30
6 3 f 20 40
Если вы хотите использовать pivot_longer, вот как вы могли бы это сделать:
library(tidyr)
df %>%
pivot_longer( cols = B:C # the cols we want to combine
, names_to = "old_col_names" # the col where we store the old names
, values_to = "B" # and we rename the new col to B
) %>%
# ------------- reoder columns and arrange to make it look like output
select(A, B, D, E) %>% # this removes the 'old_col_names' you could also do select(-old_col_names)
arrange(B) # arrange in alphabetical order
II выход -> вход
Для обратной операции — при условии, что вы не хотите разделять df и рекомбинировать его — вы можете {tidyr}
использовать pivot_wider()
столбец «новое» имя, соответствующий вашим требованиям. Для более сложных наборов данных вам, возможно, придется проявить творческий подход.
library(tidyr)
output %>%
# --------- introduce a "name" vector -------------
## -------- we use rep() to create set of 3s ... adapt as required!
mutate(group = c(rep("B",3), rep("C",3)) ) %>%
# --------- spread the data frame and rearrange the columns
pivot_wider( id_cols = c(A,D,E) # these columns are "constant"
, names_from = group # pull "new" column names from our group var
, values_from = B) %>% # spread the values we aggregated in B
select(A, B, C, D, E) # rearrange column order to input style