Удаление повторяющихся строк на основе критерия столбца python

#python #pandas

#python #pandas

Вопрос:

У меня следующий тип набора данных, я хочу удалить все строки с одинаковым идентификатором и group='DCM'

     ID   date  group
0  3001  2010   DCM
1  3001  2012   NII
2  3002  2012   DCM
3  3002  2013   DCM
  

В результате:

     ID   date  group
0  3001  2010   DCM
1  3001  2012   NII
  

Вот как создается база данных:

 df = pd.DataFrame({'ID': ['3001','3001','3002','3002'], 'date': [2010,2012,2012,2013], 'group': ['DCM','NII','DCM','DCM']})
  

Комментарии:

1. Что вы пробовали до сих пор?

Ответ №1:

Попробуйте что-то вроде этого:

Ввод:

      ID  date group
0  3001  2010   DCM
1  3001  2012   NII
2  3002  2012   DCM
3  3002  2012   DCM
  

Метод:

 df.drop_duplicates(keep=False, ignore_index=True)
  

Вывод:

      ID  date group
0  3001  2010   DCM
1  3001  2012   NII