#python #pandas #dataframe #duplicates
#python #панды #фрейм данных #дубликаты
Вопрос:
У меня есть фрейм данных, в котором могут быть дублирующиеся столбцы. значения столбцов абсолютно идентичны. Мне нужно найти все экземпляры этих дубликатов и сохранить только один экземпляр
Вот как это выглядит
0 1 2 3 4 5 6 7
0 DATE YEARS DAYS MONTHS YEAR DATE DATE YEARS
1 1/1/2010 2010 0 1 2010 1/1/2010 1/1/2010 2010
2 1/2/2010 2010 1 1 2010 1/2/2010 1/2/2010 2010
3 1/3/2010 2010 2 1 2010 1/3/2010 1/3/2010 2010
4 1/4/2010 2010 3 1 2010 1/4/2010 1/4/2010 2010
5 1/5/2010 2010 4 1 2010 1/5/2010 1/5/2010 2010
6 1/6/2010 2010 5 1 2010 1/6/2010 1/6/2010 2010
7 1/7/2010 2010 6 1 2010 1/7/2010 1/7/2010 2010
В приведенных выше данных столбцы «ДАТА» и «ГОДЫ» повторяются. Итак, мне нужно избавиться от этих повторов и просто сохранить один столбец «ДАТА» и «ГОДЫ». Конечный результат должен иметь только один экземпляр
ДАТА
ГОДЫ
МЕСЯЦЫ
ДЕНЬ
ГОД
0 1 2 3 4
0 DATE YEARS DAYS MONTHS YEAR
1 1/1/2010 2010 0 1 2010
2 1/2/2010 2010 1 1 2010
3 1/3/2010 2010 2 1 2010
4 1/4/2010 2010 3 1 2010
5 1/5/2010 2010 4 1 2010
6 1/6/2010 2010 5 1 2010
7 1/7/2010 2010 6 1 2010
Комментарии:
1. Что не так с вашими заголовками столбцов?
Ответ №1:
Давайте сделаем drop_duplicates
df = df.T.drop_duplicates(0).T