запросите: функции «распределения» пакета Chisquare {статистика} R

#r #distribution #r-package

Вопрос:

У меня есть некоторые вопросы о функциях «распределения» пакета Chisquare {статистика} R (ссылка: https://stat.ethz.ch/R-manual/R-devel/library/stats/html/Distributions.html)

Первоначально я занимался только распределениями в математических задачах. Я знаю математическую формулу PDF (функция плотности вероятности) и CDF (кумулятивная функция распределения) для (например) распределения Хи-квадрат. (формулы внизу)

Другими словами, в прошлом, когда я решал задачи на Хи-квадрат, я писал от руки. Например, решение его PDF, CDF или MGF. Или используйте F-тест или T-тест (в сочетании с нулевой гипотезой), чтобы проверить, соответствует ли его распределение Хи-квадрат или нет. Но теперь я знаю, что существует мощный «дистрибутив» пакета R, и я знаю, что при прогнозировании лучше визуализировать (показывать график распределения), а не показывать значения параметров, поэтому я хочу использовать вместо этого пакет R.

Поэтому я проверил функции «распределения» Chisquare в пакете R {статистика}. Однако функции, необходимые для заполнения параметров распределения.

Мне интересно 1) Если у меня есть массивный набор данных, означает ли это,что я должен использовать другие математические формулы,написанные мной самим,для вычисления каждого параметра (здесь x, q, p, df, ncp и т. Д.) В наборе данных, Прежде чем я смогу использовать «дистрибутив» пакета R? Я действительно не думаю, что это так, как если бы эта функция могла рисовать только график распределения, почему автор этого пакета дал подробные математические объяснения самого распределения?

2) Возвращаясь к массивному набору данных, я не знаю, какому распределению он соответствует (например, он может не соответствовать Хи-квадрат), есть ли способ проверить? Или, другими словами, должен ли я проверять каждое распределение, прежде чем использовать функции R для построения графика распределения?

3)Но я также подумал, что должен сделать это обратным способом, возможно, только после того, как я покажу распределение данных, я смогу узнать, какое точное распределение моих данных соблюдается. Но если бы я мог нарисовать распределение данных в целом (например, ggplot или график). Почему мне все еще нужно использовать пакет «дистрибутив» R?

введите описание изображения здесь
введите описание изображения здесь
введите описание изображения здесь

Комментарии:

1. Это не пакет, как написано на странице, на которую вы ссылаетесь, «Дистрибутивы в пакете статистики» . И вы разместили функции страницы Chisquare {stats} , но с нормальной плотностью и CDF. Я голосую за закрытие, так как неясно, о чем вы просите.

2. Возможно, этот вопрос о перекрестной проверке даст вам первое представление.

3. Цель этих функций-просто служить функциями плотности/распределения/квантиля и обеспечивать способ генерации случайных величин из хи-квадрата. Они возвращают векторы значений, которые могут быть использованы другими способами, помимо простого создания графика. Вам нужно будет использовать какую-то другую функцию, если ваша цель-подогнать распределение к набору данных.

4. Да, они предназначены для случаев, когда вы уже знаете параметры и хотите случайным образом генерировать переменные из распределения или вычислять одну из них: плотность (значение pdf в какой-то момент), распределение (значение cdf в какой-то момент), квантиль (значение обратного cdf в какой-то момент). Они не предназначены для оценки параметров на основе данных. (По крайней мере, не напрямую. Возможно, вы сможете использовать их как часть своей собственной функции или общего процесса для поиска дистрибутива, который наилучшим образом соответствует вашим данным)

5. Возможно, вам нужна fitdistr функция в MASS пакете или fitdist функция в fitdistrplus пакете?