#python #pandas #dataframe
Вопрос:
Я пытаюсь создать новый фрейм данных (df2_g), выбрав максимальное значение (puntaje) сгруппированной категории (описание). Что-то вроде этого:
df2_g = df2.iloc[df2.groupby('descripcion')['puntaje'].agg(pd.Series.idxmax)]
По какой-то причине он возвращает меньше категорий, чем исходные. Что я ищу, так это то, что новый фрейм данных содержит все переменные предыдущего фрейма данных, и дополнительно для каждой категории возвращается только максимальное значение этой категории.
Комментарии:
1. df2[[‘puntaje’,’описание’]].groupby(‘описание’).макс() ???