Удаление одного исходного значения при наличии нескольких источников

#python #pandas #pandas-groupby

#python #панды #pandas-groupby

Вопрос:

У меня есть следующий набор данных:

 year    ID    Source Category Value
2010     1     A      P         10
2010     1     B      P         15
2010     1     A      q         20
2011     2     A      P         12
2011     2     B      q         15

Я хочу реорганизовать набор данных следующим образом:

 year    ID    Source Category Value
2010     1     A      P         10
2010     1     A      q         20
2011     2     A      P         12
2011     2     B      q         15

В word, в каждом году, для каждой категории, если у нас есть значение из нескольких источников (A, B), мы отбросим исходное значение B. Но если есть только исходное значение B , то мы сохраним его.

Я попытался исправить это, используя df.groupby().count().replace('count') not working . Есть предложения по устранению этой проблемы?

Ответ №1:

Попробуйте

 df.drop_duplicates(subset=['year', 'Category'], keep="first")

Вопрос:

Комментарии:

Ответ №1:

Вам также может понравиться

Проблема с передачей параметров в React native

jQuery: бесконечный цикл по массиву … each()?

curl и wget приводят к разным перенаправлениям и результатам