#python #scipy #cdf #kolmogorov-smirnov #goodness-of-fit
Вопрос:
Я сопоставил распределение гаусса и распределение смеси гаусса с некоторыми данными и построил модели CDF на основе эмпирических данных, как показано:
Я пытаюсь использовать kstest для количественной оценки и сравнения соответствия каждой модели, но просмотр документации scipys kstest сбил меня с толку. Использую ли я kstest или ks_2samp, как я вижу в других сообщениях?
изменить: для контекста код, который я попробовал для одного примера kstest, является
ss.kstest(Y, y_cdf)
где Y-данные, а y_cdf-cdf модели смеси, однако это дает более низкое значение d для 1 компонента, чем для значения 2 компонента, и мне ясно, что модель смеси из 2 компонентов подходит лучше, поэтому не должно ли значение D kstest быть ниже?