Как мне найти долю точек данных (в пределах одного столбца), которые находятся в пределах одного стандартного отклонения от среднего значения в R-коде?

#r

#r

Вопрос:

Мне дали среднее значение: 62,4 и стандартное отклонение: 18,7. Итак, учитывая среднее и стандартное отклонение, как мне узнать точки данных, которые находятся на расстоянии одного стандартного отклонения от заданного среднего? Другой вопрос требует двух стандартных отклонений, но если я понимаю, как получить первый стандарт, я полагаю, что смогу справиться с этой проблемой. Я предпочитаю использовать DPYLR.

Комментарии:

1. which(datapoints > (62.4 - 18.7) amp; datapoints < (62.4 18.7)) ?

Ответ №1:

Простым решением является использование следующих двух функций R:

  • операторы сравнения векторизуются, т. Е. c(1,2) > c(2,0) Дают c(FALSE,TRUE)
  • TRUE и FALSE интерпретируются как 1 и 0 в арифметических выражениях

Таким образом, если x — вектор ваших точек данных, вы можете подсчитать количество точек данных в $ mu pm sigma $:

 mu <- mean(x)
s <- sd(x)
sum( (x > mu - s) amp; (x < mu   s))