Pandas — добавить столбец со сглаженной вероятностью

#python #pandas #probability-density

#python #pandas #вероятность-плотность

Вопрос:

Как мне создать новый столбец, содержащий плотность для каждого значения из другого столбца?

Это дает счетчик, который похож на получение значений из гистограммы:

 df['count'] = df.groupby(['feature'])['feature'].transform('count')  
  

Чего бы я хотел, так это:

 df['density'] = df.groupby(['feature'])['feature'].transform('density')  
  

Которого не существует. Также было бы неплохо иметь параметр для управления «гладкостью» функции плотности.
Чтобы проиллюстрировать, я хотел бы получить значения из кривой вместо высоты столбика

Чтобы проиллюстрировать, я хотел бы получить значения из кривой вместо высоты столбика

Комментарии:

1. Под «плотностью» вы подразумеваете деление на общее количество элементов? Итак df['count'] / len(df) ?

2. Я понимаю, что вы имеете в виду, на самом деле часть сглаживания имеет решающее значение.

3. Звучит так, как вы хотите kdeplot ?

4. Да, если возможно получить значения графика в столбце dataframe рядом с их соответствующим значением.

5. вам необходимо определить параметры предполагаемого распределения или ядра