#python-3.x #pandas
#python-3.x #pandas
Вопрос:
У меня есть этот фрейм данных, в котором у меня несколько идентификаторов пациента из-за разных посещений. Я пытаюсь рассчитать сумму пополнений для каждого пациента независимо от посещения
Мои данные выглядят следующим образом
PatientID refills_auth
000BE424-54C2 0
000BE424-54C2 0
000BE424-54C2 0
000BE424-54C2 1
000BE424-54C2 1
0011A43B-9638 0
0011A43B-9638 0
0011A43B-9638 0
0011A43B-9638 0
0011A43B-9638 1
0011A43B-9638 1
0011A43B-9638 0
0011A43B-9638 0
0011A43B-9638 0
0011A43B-9638 0
0011A43B-9638 0
0011A43B-9638 0
0011A43B-9638 0
0011A43B-9638 0
0011A43B-9638 3
0011A43B-9638 0
0011A43B-9638 0
0011A43B-9638 0
0011A43B-9638 0
0011A43B-9638 0
0011A43B-9638 0
InfoScrbRefSum.groupby(['PATID']).sum().groupby('PATID').sum()
и результат выглядит следующим образом
PatientID refills_auth
000BE424-54C2 00011
0011A43B-9638 1000011000000...
Часть суммы заполнена правильно, другие нет — Вот что я получаю для некоторых строк
Любая помощь высоко ценится
Комментарии:
1. в чем причина двойной группы по / sum?
2. «Некоторые из сумм заполнены правильно, другие нет» является расплывчатым. Какой именно результат вы ожидаете?
3. Пожалуйста, смотрите прилагаемый скриншот для пояснения
4. Я использовал
df.groupby(['PatientID']).sum()
, и я получил много NAN и неправильную сумму5. Я добавил два снимка результата, который я получил, используя
InfoScrbRefSum.groupby(['PatientID']).sum().groupby('PatientID').sum()
иInfoScrbRefSum.groupby(['PatientID']).sum()