#python #pandas #probability-density
#python #pandas #вероятность-плотность
Вопрос:
Как мне создать новый столбец, содержащий плотность для каждого значения из другого столбца?
Это дает счетчик, который похож на получение значений из гистограммы:
df['count'] = df.groupby(['feature'])['feature'].transform('count')
Чего бы я хотел, так это:
df['density'] = df.groupby(['feature'])['feature'].transform('density')
Которого не существует. Также было бы неплохо иметь параметр для управления «гладкостью» функции плотности.
Чтобы проиллюстрировать, я хотел бы получить значения из кривой вместо высоты столбика
Комментарии:
1. Под «плотностью» вы подразумеваете деление на общее количество элементов? Итак
df['count'] / len(df)
?2. Я понимаю, что вы имеете в виду, на самом деле часть сглаживания имеет решающее значение.
3. Звучит так, как вы хотите
kdeplot
?4. Да, если возможно получить значения графика в столбце dataframe рядом с их соответствующим значением.
5. вам необходимо определить параметры предполагаемого распределения или ядра