#statistics #histogram #boxplot #median #percentile
#Статистика #гистограмма #прямоугольная диаграмма #медиана #процентиль
Вопрос:
У меня есть эти графики, оба сделаны из одних и тех же данных. Но я чувствую, что они не имеют смысла (поправьте меня, если я ошибаюсь).
На прямоугольном графике значение / медиана 50-го процентиля составляет 11,7
Насколько я понимаю, это означает, что 50% всех данных меньше этого значения, которое равно 11,7
Размер данных составляет 3404 точки данных. Это означает, что 3404/2 = 1702 точки данных меньше 11,7, верно?
Но на гистограмме количество значений в ячейке 0-20 равно 1257. Количество значений в ячейке 20-40 равно 311. Количество значений в ячейке 40-60 равно 113.
Общее количество точек данных между 0-60 составляет 1681 ~ 49% от всех данных.
Теперь я в замешательстве, потому что, когда ~ 50% данных находится в диапазоне 0-60, как медиана может быть 11,7?
Может кто-нибудь, пожалуйста, пролить свет на это? Я могу быть ужасно неправ и был бы благодарен всем, кто помогает!!
Спасибо!
Ответ №1:
Я предполагаю, что статистика вашего прямоугольника не включает многочисленные выбросы. Возможно, у вас достаточно выбросов для создания условий, которые вы описываете. Фактически, максимум вашего прямоугольника составляет всего 60.
Комментарии:
1. Спасибо за ответ. Однако речь идет не только о прямоугольном графике. Даже когда я вычисляю медиану отдельно, ее значение равно 11,7