Удаление дубликатов столбцов

#python #pandas #dataframe #duplicates

#python #панды #фрейм данных #дубликаты

Вопрос:

У меня есть фрейм данных, в котором могут быть дублирующиеся столбцы. значения столбцов абсолютно идентичны. Мне нужно найти все экземпляры этих дубликатов и сохранить только один экземпляр

Вот как это выглядит

     0          1       2    3    4       5          6        7
0   DATE      YEARS  DAYS MONTHS YEAR   DATE        DATE    YEARS
1   1/1/2010    2010    0   1   2010    1/1/2010    1/1/2010    2010
2   1/2/2010    2010    1   1   2010    1/2/2010    1/2/2010    2010
3   1/3/2010    2010    2   1   2010    1/3/2010    1/3/2010    2010
4   1/4/2010    2010    3   1   2010    1/4/2010    1/4/2010    2010
5   1/5/2010    2010    4   1   2010    1/5/2010    1/5/2010    2010
6   1/6/2010    2010    5   1   2010    1/6/2010    1/6/2010    2010
7   1/7/2010    2010    6   1   2010    1/7/2010    1/7/2010    2010

В приведенных выше данных столбцы «ДАТА» и «ГОДЫ» повторяются. Итак, мне нужно избавиться от этих повторов и просто сохранить один столбец «ДАТА» и «ГОДЫ». Конечный результат должен иметь только один экземпляр
ДАТА
ГОДЫ
МЕСЯЦЫ
ДЕНЬ
ГОД

     0            1      2   3   4
0   DATE     YEARS    DAYS  MONTHS  YEAR
1   1/1/2010    2010    0   1   2010
2   1/2/2010    2010    1   1   2010
3   1/3/2010    2010    2   1   2010
4   1/4/2010    2010    3   1   2010
5   1/5/2010    2010    4   1   2010
6   1/6/2010    2010    5   1   2010
7   1/7/2010    2010    6   1   2010

Ответ №1:

Давайте сделаем drop_duplicates

 df = df.T.drop_duplicates(0).T

Вопрос:

Комментарии:

Ответ №1:

Вам также может понравиться

Ionic cordova сборка android — Ubuntu для командной строки Android studio

Класс, работающий на localhost, но не работающий в CentOS

Слишком много файлов в моем кластере сообщества Databricks, но где?