Сверните повторяющиеся строки с помощью pandas

#python #pandas

#python #pandas

Вопрос:

У меня есть фрейм данных, который имеет повторяющиеся имена столбцов. Я хочу свернуть все одинаковые записи в одну.

Данные csv для данных будут,

 id,col1,col2,col1,col2
'a',1,0,1,0
'b',0,1,1,0
'c',1,0,0,0
  

Результат, который я ищу, является,

 id,col1,col2
'a',2,0
'b',1,1
'c',1,0
  

Я хочу суммировать по столбцам.

Я новичок в pandas и, похоже, не могу найти, как правильно агрегировать значения. Обратите внимание, что у меня около 4000 столбцов.

Комментарии:

1. Является ли первая строка в вашем желаемом результате ошибкой?

2. Опечатка, я ее исправил.

Ответ №1:

Вы можете использовать groupby по именам столбцов и агрегировать sum :

 print (df.groupby(level= 0, axis=1).sum())
   col1  col2   id
0     2     0  'a'
1     1     1  'b'
2     1     0  'c'