Есть ли способ в R ранжировать категориальную переменную (из символов) в ранжированные порядковые данные?

Post author:admin
Запись опубликована:8 мая, 2023
Post category:Вопросы по программированию

#r #categorical-data

#r #категориальные данные

Вопрос:

Скажем, у меня есть список символьных строк alphabets = c(a, b, c, d,..., z) , и я хотел бы получить индекс этого списка в качестве нового столбца в data.frame .

например, (b, a, c, d, e, g) дало бы (2, 1, 3, 4, 5, 7) .

Ответ №1:

Необходимое вам решение — преобразовать вектор символов в коэффициент:

 alphabets = c("b", "a", "c", "d", "e", "g")
#convert to class factor with the order define by the levels option
alphabets<-factor(alphabets, levels=letters)

#display the values
as.numeric(alphabets)
#[1] 2 1 3 4 5 7

Ответ №2:

Это случай для match

 x <- c("b", "a", "c", "d", "e", "g")

match(x, letters)
#[1] 2 1 3 4 5 7

Или sapply с grep возвратом именованного int вектора

 sapply(x, grep, letters)
#b a c d e g
#2 1 3 4 5 7

Два комментария:

«У меня есть список символьных строк» Будьте точны с именами классов объектов! alphabets = c("a", "b", "c", "d") является character вектором, а не list .
letters является встроенной константой, которая возвращает 26 строчных букв (латинского алфавита) в качестве character вектора. Подробности см. ?letters .

Вопрос:

Ответ №1:

Комментарии:

Ответ №2:

Два комментария:

Вам также может понравиться

Код C visual studio 2010 .. ошибка

Что использовать для федеративного AAD для B2C issuerAssignedId?

Установить значение в выпадающем списке при редактировании