#r #kernel-density
#r #плотность ядра
Вопрос:
Я генерирую распределения плотности 2D ядра для каждой пары числовых столбцов в наборе данных, используя функцию kde2d в пакете MASS.
Для этого требуются следующие параметры:
kde2d(x, y, h, n=25, lims = c(range(x), range(y)))
где n — «Количество точек сетки в каждом направлении. Может быть скалярным или целочисленным вектором длиной 2».
Я хочу оптимизировать размеры сетки для каждой пары столбцов. На данный момент я использовал фиксированные размеры 10×10. Кто-нибудь знает формулу для оптимизации размера сетки, чтобы я мог генерировать оптимальные оценки плотности для каждой пары столбцов?
Спасибо
Ответ №1:
Параметр n
в этой функции влияет не на вашу оценку плотности, а только на графическое представление, т. е. он должен зависеть только от размера графика, который вы хотите создать, но не от данных.
С другой стороны, на вашу оценку плотности действительно влияет выбор пропускной способности h
. Чтобы выбрать оптимальную полосу пропускания, вам нужно будет знать (или предполагать) распределение ваших данных
Комментарии:
1. Спасибо. Я использую значение по умолчанию для h для определения ширины полосы (
bandwidth.nrd
), и в большинстве случаев оценка выглядит довольно хорошо.