#python #pandas
#python #pandas
Вопрос:
У меня следующий тип набора данных, я хочу удалить все строки с одинаковым идентификатором и group='DCM'
ID date group
0 3001 2010 DCM
1 3001 2012 NII
2 3002 2012 DCM
3 3002 2013 DCM
В результате:
ID date group
0 3001 2010 DCM
1 3001 2012 NII
Вот как создается база данных:
df = pd.DataFrame({'ID': ['3001','3001','3002','3002'], 'date': [2010,2012,2012,2013], 'group': ['DCM','NII','DCM','DCM']})
Комментарии:
1. Что вы пробовали до сих пор?
Ответ №1:
Попробуйте что-то вроде этого:
Ввод:
ID date group
0 3001 2010 DCM
1 3001 2012 NII
2 3002 2012 DCM
3 3002 2012 DCM
Метод:
df.drop_duplicates(keep=False, ignore_index=True)
Вывод:
ID date group
0 3001 2010 DCM
1 3001 2012 NII