#r #bioinformatics #census
Вопрос:
У меня есть 2 кадра данных с цифровыми кодами, которые представляют различные задания.
В одном df ( df_a
) есть коды переписи, в другом ( df_b
) есть коды, представляющие основные задания.
Мне нужно создать новый столбец в df_a, в котором задания перечислены как важные или несущественные на основе кодов df_b
в.
Проблема в том, что некоторые коды заданий df_a
имеют символ M = несколько целых чисел в df_b
(например, 123M5 в df_a
= 12335, 12345, 12355… в df_b
). Я пытаюсь сделать это, установив M='\d'
df_a, но не преуспеваю… есть какие-нибудь мысли о том, как лучше подойти к этому? Спасибо!
Комментарии:
1. Я думал, вы хотите сопоставить или заменить цифру «M»на » s»?
Ответ №1:
Возможно, это то, что вам нужно:
df_a <- data.frame(job = c("1233M5", "12345", "1235M5" , "12346"))
df_b <- data.frame(essential = c(12335, 12346))
df_a$essential <- 0
df_a$essential[which(as.numeric(gsub("M", "", df_a$job)) %in% df_b$essential)] <- 1