#r
#r
Вопрос:
У меня есть набор данных в R, в котором есть несколько столбцов, которые мне нужны, чтобы все были в одном столбце.
Вот пример набора данных
Net1 Net2 Net3 Net4 Net5 Net6 Net7 Net8 Net9 Net10 Net11 Net12
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <lgl> <lgl>
1 -18 -30 22 27 16 47 -31 53 -10 NA NA NA
2 -9 53 5 -38 -3 -46 48 19 -47 -27 NA NA
По сути, все столбцы представляют собой группы одного и того же. Net1 Net5 Net9 представляют одно и то же, поэтому они мне понадобятся в одном столбце. То же самое для Net2 Net6 Net10. Нет3 Нет7 Нет11. Наконец, Net4 Net8 Net12.
Таким образом, вместо того, чтобы быть 12 столбцами, их должно быть просто 4 в новом фрейме данных. С учетом того, что это желаемый результат:
Net1 Net2 Net3 Net4
<dbl> <dbl> <dbl> <dbl>
1 -18 -30 22 27
2 16 47 -31 53
3 -10 NA NA NA
4 -9 53 5 -38
5 -3 -46 48 19
6 -47 -27 NA NA
Комментарии:
1. Погуглите «изменить форму с широкой на длинную». Одним из пакетов R, который делает это , является
tidyr
.
Ответ №1:
Вот другой tidyverse
подход
library(tidyr)
names(df) <- rep(c("Net1", "Net2", "Net3", "Net4"), 3L)
df %>% pivot_longer(everything(), ".value")
Вывод
# A tibble: 6 x 4
Net1 Net2 Net3 Net4
<int> <int> <int> <int>
1 -18 -30 22 27
2 16 47 -31 53
3 -10 NA NA NA
4 -9 53 5 -38
5 -3 -46 48 19
6 -47 -27 NA NA
Или поместите все в конвейер, если хотите
df %>%
setNames(rep(c("Net1", "Net2", "Net3", "Net4"), 3L)) %>%
pivot_longer(everything(), ".value")
Ответ №2:
Вот подход без излишеств:
col_mat = matrix(1:12, nrow = 4)
col_mat
# [,1] [,2] [,3]
# [1,] 1 5 9
# [2,] 2 6 10
# [3,] 3 7 11
# [4,] 4 8 12
result = as.data.frame(apply(col_mat, 1, function(x) unlist(df[x])))
names(result) = names(df)[col_mat[, 1]]
result
# Net1 Net2 Net3 Net4
# 1 -18 -30 22 27
# 2 -9 53 5 -38
# 3 16 47 -31 53
# 4 -3 -46 48 19
# 5 -10 NA NA NA
# 6 -47 -27 NA NA
Я использую этот пример данных — вам может потребоваться сначала преобразовать ваши логические столбцы в числовые.
df = read.table(text = 'Net1 Net2 Net3 Net4 Net5 Net6 Net7 Net8 Net9 Net10 Net11 Net12
1 -18 -30 22 27 16 47 -31 53 -10 NA NA NA
2 -9 53 5 -38 -3 -46 48 19 -47 -27 NA NA ', header = TRUE)
Ответ №3:
Вот такой tidyverse
подход :
library(dplyr)
library(tidyr)
df %>%
pivot_longer(cols = everything()) %>%
group_by(row = ceiling(row_number()/4)) %>%
mutate(name = paste0('Net', 1:4)) %>%
pivot_wider() %>%
ungroup %>%
select(-row)
# Net1 Net2 Net3 Net4
# <int> <int> <int> <int>
#1 -18 -30 22 27
#2 16 47 -31 53
#3 -10 NA NA NA
#4 -9 53 5 -38
#5 -3 -46 48 19
#6 -47 -27 NA NA
Ответ №4:
Вот простой базовый подход R:
data.frame(matrix(t(df), ncol = 4, byrow = TRUE, dimnames = list(NULL, names(df)[1:4])))
# Net1 Net2 Net3 Net4
# 1 -18 -30 22 27
# 2 16 47 -31 53
# 3 -10 NA NA NA
# 4 -9 53 5 -38
# 5 -3 -46 48 19
# 6 -47 -27 NA NA