Объединение двух столбцов в R в один длинный столбец

#r

#r

Вопрос:

У меня есть набор данных в R, в котором есть несколько столбцов, которые мне нужны, чтобы все были в одном столбце.

Вот пример набора данных

    Net1  Net2  Net3  Net4  Net5  Net6  Net7  Net8  Net9 Net10 Net11 Net12
  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <lgl> <lgl>
1   -18   -30    22    27    16    47   -31    53   -10    NA NA    NA   
2    -9    53     5   -38    -3   -46    48    19   -47   -27 NA    NA  
 

По сути, все столбцы представляют собой группы одного и того же. Net1 Net5 Net9 представляют одно и то же, поэтому они мне понадобятся в одном столбце. То же самое для Net2 Net6 Net10. Нет3 Нет7 Нет11. Наконец, Net4 Net8 Net12.

Таким образом, вместо того, чтобы быть 12 столбцами, их должно быть просто 4 в новом фрейме данных. С учетом того, что это желаемый результат:

    Net1  Net2  Net3  Net4  
  <dbl> <dbl> <dbl> <dbl> 
1   -18   -30    22    27    
2    16    47    -31   53    
3   -10    NA    NA    NA    
4    -9    53     5   -38    
5    -3    -46    48   19    
6    -47  -27     NA   NA      
 

Комментарии:

1. Погуглите «изменить форму с широкой на длинную». Одним из пакетов R, который делает это , является tidyr .

Ответ №1:

Вот другой tidyverse подход

 library(tidyr)

names(df) <- rep(c("Net1", "Net2", "Net3", "Net4"), 3L)
df %>% pivot_longer(everything(), ".value")
 

Вывод

 # A tibble: 6 x 4
   Net1  Net2  Net3  Net4
  <int> <int> <int> <int>
1   -18   -30    22    27
2    16    47   -31    53
3   -10    NA    NA    NA
4    -9    53     5   -38
5    -3   -46    48    19
6   -47   -27    NA    NA
 

Или поместите все в конвейер, если хотите

 df %>% 
  setNames(rep(c("Net1", "Net2", "Net3", "Net4"), 3L)) %>%
  pivot_longer(everything(), ".value")
 

Ответ №2:

Вот подход без излишеств:

 col_mat = matrix(1:12, nrow = 4)
col_mat
#      [,1] [,2] [,3]
# [1,]    1    5    9
# [2,]    2    6   10
# [3,]    3    7   11
# [4,]    4    8   12

result = as.data.frame(apply(col_mat, 1, function(x) unlist(df[x])))
names(result) = names(df)[col_mat[, 1]]
result
#   Net1 Net2 Net3 Net4
# 1  -18  -30   22   27
# 2   -9   53    5  -38
# 3   16   47  -31   53
# 4   -3  -46   48   19
# 5  -10   NA   NA   NA
# 6  -47  -27   NA   NA
 

Я использую этот пример данных — вам может потребоваться сначала преобразовать ваши логические столбцы в числовые.

    df = read.table(text = 'Net1  Net2  Net3  Net4  Net5  Net6  Net7  Net8  Net9 Net10 Net11 Net12
1   -18   -30    22    27    16    47   -31    53   -10    NA NA    NA   
2    -9    53     5   -38    -3   -46    48    19   -47   -27 NA    NA  ', header = TRUE)
 

Ответ №3:

Вот такой tidyverse подход :

 library(dplyr)
library(tidyr)

df %>%
  pivot_longer(cols = everything()) %>%
  group_by(row = ceiling(row_number()/4)) %>%
  mutate(name = paste0('Net', 1:4)) %>%
  pivot_wider() %>%
  ungroup %>%
  select(-row)

#   Net1  Net2  Net3  Net4
#  <int> <int> <int> <int>
#1   -18   -30    22    27
#2    16    47   -31    53
#3   -10    NA    NA    NA
#4    -9    53     5   -38
#5    -3   -46    48    19
#6   -47   -27    NA    NA
 

Ответ №4:

Вот простой базовый подход R:

 data.frame(matrix(t(df), ncol = 4, byrow = TRUE, dimnames = list(NULL, names(df)[1:4])))
#   Net1 Net2 Net3 Net4
# 1  -18  -30   22   27
# 2   16   47  -31   53
# 3  -10   NA   NA   NA
# 4   -9   53    5  -38
# 5   -3  -46   48   19
# 6  -47  -27   NA   NA