Сбор нескольких столбцов

#r #tidyr #tidy #gather

#r #tidyr #аккуратный #сбор

Вопрос:

Я пытаюсь собрать несколько столбцов в R. Примером могут служить некоторые недавние данные о фэнтези-футболе:

 homeId homePlayerName homePosition homeRosterPts awayId awayPlayerName awayPosition awayRosterPts
5      Nick Chubb           RB         23.3         1   Josh Jacobs         RB           8.9
4      Tyreek Hill          WR         24.6         10   Patrick Mahomes    QB           18.5
7      Davante Adams        WR         21.0         2   Michael Thomas      WR           12.4

Я хочу, чтобы в каждом столбце было по одному столбцу для идентификатора, имени игрока, очков и столбцов позиций, чтобы я мог приводить в порядок данные и связывать строки вместе — вместо того, чтобы дублироваться для дома и в гостях. Нужно ли мне использовать здесь функцию сбора? Любое решение было бы полезно!

Ответ №1:

Для развлечения / боли / образования, вот как вы можете это сделать с reshape помощью from base R:

 reshape(setNames(df, gsub("(home|away)(.*)", "\2.\1", names(df))), 
        direction = "long", varying = 1:ncol(df))
#        time Id     PlayerName Position RosterPts id
# 1.home home  5      NickChubb       RB      23.3  1
# 2.home home  4     TyreekHill       WR      24.6  2
# 3.home home  7   DavanteAdams       WR      21.0  3
# 1.away away  1     JoshJacobs       RB       8.9  1
# 2.away away 10 PatrickMahomes       QB      18.5  2
# 3.away away  2  MichaelThomas       WR      12.4  3

Вы также можете использовать melt из «data.table» следующим образом:

 library(data.table)
nam <- unique(sub("home|away", "", names(df)))
melt(as.data.table(df), measure = patterns(nam), value.name = nam)
#    variable Id     PlayerName Position RosterPts
# 1:        1  5      NickChubb       RB      23.3
# 2:        1  4     TyreekHill       WR      24.6
# 3:        1  7   DavanteAdams       WR      21.0
# 4:        2  1     JoshJacobs       RB       8.9
# 5:        2 10 PatrickMahomes       QB      18.5
# 6:        2  2  MichaelThomas       WR      12.4

Ответ №2:

gather удален, использование pivot_longer которого упрощает :

 tidyr::pivot_longer(df, 
                    cols = everything(), 
                    names_to = c('game', '.value'),
                    names_pattern = '(home|away)(.*)')

#  game     Id PlayerName     Position RosterPts
#  <chr> <int> <chr>          <chr>        <dbl>
#1 home      5 NickChubb      RB            23.3
#2 away      1 JoshJacobs     RB             8.9
#3 home      4 TyreekHill     WR            24.6
#4 away     10 PatrickMahomes QB            18.5
#5 home      7 DavanteAdams   WR            21  
#6 away      2 MichaelThomas  WR            12.4

данные

 df <- structure(list(homeId = c(5L, 4L, 7L), homePlayerName = c("NickChubb", 
"TyreekHill", "DavanteAdams"), homePosition = c("RB", "WR", "WR"
), homeRosterPts = c(23.3, 24.6, 21), awayId = c(1L, 10L, 2L), 
    awayPlayerName = c("JoshJacobs", "PatrickMahomes", "MichaelThomas"
    ), awayPosition = c("RB", "QB", "WR"), awayRosterPts = c(8.9, 
    18.5, 12.4)), class = "data.frame", row.names = c(NA, -3L))

Вопрос:

Ответ №1:

Ответ №2:

Вам также может понравиться

Зависимости для устранения ошибок Grails 2.4.0

Проблемы с производительностью агрегации и группировки MongoDB

Как масштабировать приложение ERPNext на вашем собственном сервере до 2000 пользователей с большой нагрузкой?