Найдите, какие 5 переменных наиболее коррелируют с ответом

#r #variables #linear-regression #correlation

Вопрос:

У меня есть набор данных «страхование», который содержит 22 переменные данных о медицинских расходах. Я должен найти, какие 5 переменных наиболее коррелируют с переменной: «totexp». Я пробовал cor(страхование$totexp,страхование), но он просто дает мне корреляции, не сортируя их. затем я попробовал сортировать(cor(insurance$totexp,страхование)), и он показывает отсортированную корреляцию, но не показывает имена переменных.

Вы знаете, как лучше всего это сделать?

Заранее спасибо

Комментарии:

1. cors <- cor(insurance$totexp,insurance) ; cors[, order(cors[1, ])]

Ответ №1:

 cors <- cor(mtcars$mpg, mtcars)
cors[, order(cors[1, ])]
 

ВОЗВРАТ:

         wt        cyl       disp         hp       carb       qsec       gear         am         vs       drat        mpg 
-0.8676594 -0.8521620 -0.8475514 -0.7761684 -0.5509251  0.4186840  0.4802848  0.5998324  0.6640389  0.6811719  1.0000000
 

Мы можем использовать

 cors[, order(cors[1, ], decreasing = TRUE)]
 

Для убывающего порядка…