Как сравнить несколько столбцов в двух таблицах и найти дубликаты?

#python-3.x #pandas #dataframe

#python-3.x #панды #фрейм данных

Вопрос:

У меня есть два фрейма данных

Фрейм данных 1

Имя

Dataframe 2

введите описание изображения здесь

Столбец ID не уникален в двух таблицах. Я хочу сравнить все столбцы в обеих таблицах, кроме идентификаторов, и распечатать уникальные строки

Ожидаемый результат

введите описание изображения здесь

Я попробовал функцию ‘isin’, но не работает. Размер каждого фрейма данных равен 150000, и я удалил дубликаты в обеих таблицах. Пожалуйста, посоветуйте, как это сделать?

Ответ №1:

Вы можете использовать df.append для объединения фрейма данных, затем использовать df.duplicated, который будет помечать дубликаты.

 df3 = df1.append(df, ignore_index=True)
df4 = df3.duplicated(subset=['Team', 'name', 'Country', 'Token'], keep=False)