#r
#r
Вопрос:
Какова дисперсия для переменной Driver_Height в группе ИБП?
head(Delivery_data)
Company Box_Weight Driver_Height Driver_Salary
1 UPS 14.3 63 45144
2 UPS 16.8 65 44986
3 UPS 14.0 63 45798
4 UPS 17.8 59 44581
5 UPS 13.5 66 44912
6 UPS 13.3 64 44809
Я очень новичок в R, просто нужно отсортировать данные UPS и Ht для вычисления VAR.
В противном случае я мог бы создать объект для HT и выполнить вычисления. Приветствия!!
Комментарии:
1. @yarnabrina Я думаю, что они хотят группировать по компаниям или, по крайней мере, фильтровать по ИБП.
2. «Просто нужно отсортировать данные UPS и Ht для вычисления VAR» Зачем вам нужно сортировать данные для вычисления дисперсии?
3. Извините, это мой первый пост. Есть 3 компании, мне как-то нужно связать (UPS) с Driver_Height и вычислить переменную
4. Несмотря на то, что вы приняли ответ, я думаю, было бы неплохо пересмотреть ваш вопрос, чтобы сделать его более понятным, например, показав по крайней мере две группы и используя согласованное имя переменной для высоты.
Ответ №1:
Я думаю, вы пытаетесь спросить, можете ли вы получить дисперсию разных столбцов для подмножества строк одновременно?
#library(tidyverse)
Delivery_data %>% group_by(Company) %>%
summarize("Height.var" = var(Driver_Height), "Salary.var" = var(Driver_Salary))
Вы можете добавлять или удалять переменные, для которых вы хотите или не хотите вычислять дисперсию, как указано выше. Короткий путь, если вы быстро хотите получить дисперсию одного столбца (и одного подмножества строк), заключается в использовании []
скобок:
var(Delivery_data[Delivery_data$Company == "UPS", "Driver_Height"])