#r #labeling
#r #маркировка
Вопрос:
Я хотел бы автоматизировать следующую процедуру:
Получите минимальные и максимальные значения из вектора и определите размер шага от минимального до максимального с учетом определенного размера шага. Каждому значению внутри вектора теперь присваивается значение label
(уровень фактора), которое попадает в этот диапазон, например "20-30"
, когда значение равно 27.45
.
На данный момент я использую этот цикл for
for (label_willi_counter in 1:length(willi)) {
if(willi[label_willi_counter] < 10)
label_willi = c(label_willi, "0 - 10")
else if(willi[label_willi_counter] < 20)
label_willi = c(label_willi, "10 - 20")
else if(willi[label_willi_counter] < 30)
label_willi = c(label_willi, "50 - 30")
else if(willi[label_willi_counter] < 40)
label_willi = c(label_willi, "30 - 40")
else if(willi[label_willi_counter] < 50)
label_willi = c(label_willi, "40 - 50")
else if(willi[label_willi_counter] < 60)
label_willi = c(label_willi, "50 - 60")
else if(willi[label_willi_counter] < 70)
label_willi = c(label_willi, "60 - 70")
else if(willi[label_willi_counter] < 80)
label_willi = c(label_willi, "70 - 80")
else if(willi[label_willi_counter] < 90)
label_willi = c(label_willi, "80 - 90")
else
label_willi = c(label_willi, "90 - 100")
}
Ну, это работает, но я уверен, что есть более приятный (и, вероятно, более быстрый) подход к этому. Этот пример исправлен для minimum = 0
и maximum = 100
и step-size = 10
. Я ищу более общий способ сделать это.
Комментарии:
1. Звучит как задание для
?cut
.2. Спасибо, это был действительно быстрый ответ и именно то, что я искал
Ответ №1:
Попробуйте cut
:
x
# [1] 60 35 21 30 6 19 49 17 59 93 9 96 46 63 3 58 13 86 47 16
cut(x, breaks = seq(0,100,10), labels = lbl)
#[1] 50-60 30-40 20-30 20-30 0-10 10-20 40-50 10-20 50-60 90-100 0-10 #90-100 40-50 60-70
#[15] 0-10 50-60 10-20 80-90 40-50 10-20
#Levels: 0-10 10-20 20-30 30-40 40-50 50-60 60-70 70-80 80-90 90-100
данные
x <- c(60L, 35L, 21L, 30L, 6L, 19L, 49L, 17L, 59L, 93L, 9L, 96L, 46L,
63L, 3L, 58L, 13L, 86L, 47L, 16L)
lbl <- c("0-10", "10-20", "20-30", "30-40", "40-50", "50-60", "60-70",
"70-80", "80-90", "90-100")