Есть ли способ подмножества моих данных на основе категорий, которые я создал с помощью функции cut?

#subset #cut #percentile

Вопрос:

Основываясь на тертилях для переменной «SDQExternIssue», я смог определить диапазоны. Затем я использовал функцию cut для создания категорий «средний», «немного выше» и «высокий». Теперь я хочу подгруппировать или сгруппировать всех детей среднего, чуть выше и старшего возраста вместе, но я не уверен, как лучше всего это сделать.

Создание тертилей на основе переменной SDQExternIssue (внешней)

Нужно разделить мальчиков и девочек

 #D = main data set (PCA_data_3)
D <- fread("PCA_data_3.csv", na = 'NA') # could not find function "fread"
D


#sex differentiation 

#boys
Db <- subset(D, koen == 1, na.rm = T)
summary(Db)
str(Db)


#girls----
Dg <- subset(D, koen == 0, na.rm = T) #this did work 
summary(Dg)

# tertiles 
Tb1SDQExternIssue <- quantile(Db1$SDQExternIssue, c(0:3/3)) 
Tb1SDQExternIssue

# summarise the variable----
summary(Dg$SDQExternIssue)

# summarise the variable 
summary(Db$SDQExternIssue)


# Create a new column with categorising variables into >2 categories---- 

# Girls
TgSDQExternIssueCut <- cut(Dg$SDQExternIssue, 
                           breaks= c(0,1,2,3,4,5,6,7,Inf),
                           include.lowest=TRUE,
                           labels = c("average","average", "average", "slightly above", "slightly above", "high", "high","very high") )
TgSDQExternIssueCut

summary(TgSDQExternIssueCut)

# Create a new column with categorising variables into >2 categories 

# Boys

TbSDQExternIssueCut <- cut(Db$SDQExternIssue, 
                           breaks= c(0,1,2,3,4,5,Inf),
                           include.lowest=TRUE,
                           labels = c("average","average","slightly above", "slightly above", "slightly above", "high") )
TbSDQExternIssueCut$
  
  summary(TbSDQExternIssueCut)


Db1 <- subset(Db, SDQExternIssue == 0, 1, 2)
Db1