Как интерпретировать прямоугольную диаграмму и гистограмму вместе?

#statistics #histogram #boxplot #median #percentile

#Статистика #гистограмма #прямоугольная диаграмма #медиана #процентиль

Вопрос:

введите описание изображения здесь

У меня есть эти графики, оба сделаны из одних и тех же данных. Но я чувствую, что они не имеют смысла (поправьте меня, если я ошибаюсь).

На прямоугольном графике значение / медиана 50-го процентиля составляет 11,7

Насколько я понимаю, это означает, что 50% всех данных меньше этого значения, которое равно 11,7

Размер данных составляет 3404 точки данных. Это означает, что 3404/2 = 1702 точки данных меньше 11,7, верно?

Но на гистограмме количество значений в ячейке 0-20 равно 1257. Количество значений в ячейке 20-40 равно 311. Количество значений в ячейке 40-60 равно 113.

Общее количество точек данных между 0-60 составляет 1681 ~ 49% от всех данных.

Теперь я в замешательстве, потому что, когда ~ 50% данных находится в диапазоне 0-60, как медиана может быть 11,7?

Может кто-нибудь, пожалуйста, пролить свет на это? Я могу быть ужасно неправ и был бы благодарен всем, кто помогает!!

Спасибо!

Ответ №1:

Я предполагаю, что статистика вашего прямоугольника не включает многочисленные выбросы. Возможно, у вас достаточно выбросов для создания условий, которые вы описываете. Фактически, максимум вашего прямоугольника составляет всего 60.

Комментарии:

1. Спасибо за ответ. Однако речь идет не только о прямоугольном графике. Даже когда я вычисляю медиану отдельно, ее значение равно 11,7