Оптимальный размер сетки для распределения плотности 2D ядра в R

#r #kernel-density

#r #плотность ядра

Вопрос:

Я генерирую распределения плотности 2D ядра для каждой пары числовых столбцов в наборе данных, используя функцию kde2d в пакете MASS.

Для этого требуются следующие параметры:

 kde2d(x, y, h, n=25, lims = c(range(x), range(y)))
  

где n — «Количество точек сетки в каждом направлении. Может быть скалярным или целочисленным вектором длиной 2».

Я хочу оптимизировать размеры сетки для каждой пары столбцов. На данный момент я использовал фиксированные размеры 10×10. Кто-нибудь знает формулу для оптимизации размера сетки, чтобы я мог генерировать оптимальные оценки плотности для каждой пары столбцов?

Спасибо

Ответ №1:

Параметр n в этой функции влияет не на вашу оценку плотности, а только на графическое представление, т. е. он должен зависеть только от размера графика, который вы хотите создать, но не от данных.

С другой стороны, на вашу оценку плотности действительно влияет выбор пропускной способности h . Чтобы выбрать оптимальную полосу пропускания, вам нужно будет знать (или предполагать) распределение ваших данных

Комментарии:

1. Спасибо. Я использую значение по умолчанию для h для определения ширины полосы ( bandwidth.nrd ), и в большинстве случаев оценка выглядит довольно хорошо.