могу ли я рассчитать отклонение конкретно по столбцу и строкам

#r

#r

Вопрос:

Какова дисперсия для переменной Driver_Height в группе ИБП?

 head(Delivery_data)

  Company Box_Weight Driver_Height Driver_Salary
1     UPS       14.3            63         45144
2     UPS       16.8            65         44986
3     UPS       14.0            63         45798
4     UPS       17.8            59         44581
5     UPS       13.5            66         44912
6     UPS       13.3            64         44809
 

Я очень новичок в R, просто нужно отсортировать данные UPS и Ht для вычисления VAR.

В противном случае я мог бы создать объект для HT и выполнить вычисления. Приветствия!!

Комментарии:

1. @yarnabrina Я думаю, что они хотят группировать по компаниям или, по крайней мере, фильтровать по ИБП.

2. «Просто нужно отсортировать данные UPS и Ht для вычисления VAR» Зачем вам нужно сортировать данные для вычисления дисперсии?

3. Извините, это мой первый пост. Есть 3 компании, мне как-то нужно связать (UPS) с Driver_Height и вычислить переменную

4. Несмотря на то, что вы приняли ответ, я думаю, было бы неплохо пересмотреть ваш вопрос, чтобы сделать его более понятным, например, показав по крайней мере две группы и используя согласованное имя переменной для высоты.

Ответ №1:

Я думаю, вы пытаетесь спросить, можете ли вы получить дисперсию разных столбцов для подмножества строк одновременно?

 #library(tidyverse)
Delivery_data %>% group_by(Company) %>% 
summarize("Height.var" = var(Driver_Height), "Salary.var" = var(Driver_Salary))
 

Вы можете добавлять или удалять переменные, для которых вы хотите или не хотите вычислять дисперсию, как указано выше. Короткий путь, если вы быстро хотите получить дисперсию одного столбца (и одного подмножества строк), заключается в использовании [] скобок:

 var(Delivery_data[Delivery_data$Company == "UPS", "Driver_Height"])