#r #variables #linear-regression #correlation
Вопрос:
У меня есть набор данных «страхование», который содержит 22 переменные данных о медицинских расходах. Я должен найти, какие 5 переменных наиболее коррелируют с переменной: «totexp». Я пробовал cor(страхование$totexp,страхование), но он просто дает мне корреляции, не сортируя их. затем я попробовал сортировать(cor(insurance$totexp,страхование)), и он показывает отсортированную корреляцию, но не показывает имена переменных.
Вы знаете, как лучше всего это сделать?
Заранее спасибо
Комментарии:
1.
cors <- cor(insurance$totexp,insurance) ; cors[, order(cors[1, ])]
Ответ №1:
cors <- cor(mtcars$mpg, mtcars)
cors[, order(cors[1, ])]
ВОЗВРАТ:
wt cyl disp hp carb qsec gear am vs drat mpg -0.8676594 -0.8521620 -0.8475514 -0.7761684 -0.5509251 0.4186840 0.4802848 0.5998324 0.6640389 0.6811719 1.0000000
Мы можем использовать
cors[, order(cors[1, ], decreasing = TRUE)]
Для убывающего порядка…