#subset #cut #percentile
Вопрос:
Основываясь на тертилях для переменной «SDQExternIssue», я смог определить диапазоны. Затем я использовал функцию cut для создания категорий «средний», «немного выше» и «высокий». Теперь я хочу подгруппировать или сгруппировать всех детей среднего, чуть выше и старшего возраста вместе, но я не уверен, как лучше всего это сделать.
Создание тертилей на основе переменной SDQExternIssue (внешней)
Нужно разделить мальчиков и девочек
#D = main data set (PCA_data_3)
D <- fread("PCA_data_3.csv", na = 'NA') # could not find function "fread"
D
#sex differentiation
#boys
Db <- subset(D, koen == 1, na.rm = T)
summary(Db)
str(Db)
#girls----
Dg <- subset(D, koen == 0, na.rm = T) #this did work
summary(Dg)
# tertiles
Tb1SDQExternIssue <- quantile(Db1$SDQExternIssue, c(0:3/3))
Tb1SDQExternIssue
# summarise the variable----
summary(Dg$SDQExternIssue)
# summarise the variable
summary(Db$SDQExternIssue)
# Create a new column with categorising variables into >2 categories----
# Girls
TgSDQExternIssueCut <- cut(Dg$SDQExternIssue,
breaks= c(0,1,2,3,4,5,6,7,Inf),
include.lowest=TRUE,
labels = c("average","average", "average", "slightly above", "slightly above", "high", "high","very high") )
TgSDQExternIssueCut
summary(TgSDQExternIssueCut)
# Create a new column with categorising variables into >2 categories
# Boys
TbSDQExternIssueCut <- cut(Db$SDQExternIssue,
breaks= c(0,1,2,3,4,5,Inf),
include.lowest=TRUE,
labels = c("average","average","slightly above", "slightly above", "slightly above", "high") )
TbSDQExternIssueCut$
summary(TbSDQExternIssueCut)
Db1 <- subset(Db, SDQExternIssue == 0, 1, 2)
Db1