Объедините два столбца в повторяющуюся строку в R

#r #dplyr #tidyverse #tidyr

Вопрос:

Я знаю об pivot_longer этом, хотя это поставило меня в тупик, так как я не уверен, что мне следует добавить в values_to аругмент. Изображение ниже-это почти все, что мне нужно

введите описание изображения здесь

Код:

 df <- structure(list(A = 1:3, B = c("a", "b", "c"), C = c("d", "e", 
"f"), D = c(10L, 15L, 20L), E = c(20L, 30L, 40L)), class = "data.frame", row.names = c(NA, 
-3L))
 

Моя попытка:

 library(tidyverse)
df %>% pivot_longer(cols=3,names_to="new",values_to="value")
 

** Будет действительно полезно, если вы также сможете добавить способ преобразования вывода в ввод.

Должен ли я просто сделать bind_rows() это вместо этого ?

Комментарии:

1. df %>% pivot_longer(cols = B:C) %>% select(-name)

Ответ №1:

I. ввод -> вывод

Вы можете просто разделить свой фрейм данных и связать его снова

 library(dplyr)

df1 <- df %>% select(A, B, D, E)
df2 <- df %>% select(A, C, D, E) %>% rename(B = C)

bind_rows(df1, df2)
  A B  D  E
1 1 a 10 20
2 2 b 15 30
3 3 c 20 40
4 1 d 10 20
5 2 e 15 30
6 3 f 20 40
 

Если вы хотите использовать pivot_longer, вот как вы могли бы это сделать:

 library(tidyr)

df %>% 
  pivot_longer( cols = B:C                  # the cols we want to combine
              , names_to = "old_col_names"  # the col where we store the old names
              , values_to = "B"             # and we rename the new col to B
              ) %>% 
# ------------- reoder columns and arrange to make it look like output
   select(A, B, D, E) %>%                   # this removes the 'old_col_names' you could also do select(-old_col_names)
   arrange(B)                               # arrange in alphabetical order
 

II выход -> вход

Для обратной операции — при условии, что вы не хотите разделять df и рекомбинировать его — вы можете {tidyr} использовать pivot_wider() столбец «новое» имя, соответствующий вашим требованиям. Для более сложных наборов данных вам, возможно, придется проявить творческий подход.

 library(tidyr)

output %>% 
# --------- introduce a "name" vector -------------
## -------- we use rep() to create set of 3s ... adapt as required!
  mutate(group = c(rep("B",3), rep("C",3)) ) %>% 
# --------- spread the data frame and rearrange the columns
  pivot_wider( id_cols = c(A,D,E)    # these columns are "constant"
             , names_from  = group   # pull "new" column names from our group var 
             , values_from = B) %>%  # spread the values we aggregated in B
  select(A, B, C, D, E)              # rearrange column order to input style