#python-3.x #pandas #dataframe
#python-3.x #панды #фрейм данных
Вопрос:
У меня есть два фрейма данных
Фрейм данных 1
Dataframe 2
Столбец ID не уникален в двух таблицах. Я хочу сравнить все столбцы в обеих таблицах, кроме идентификаторов, и распечатать уникальные строки
Ожидаемый результат
Я попробовал функцию ‘isin’, но не работает. Размер каждого фрейма данных равен 150000, и я удалил дубликаты в обеих таблицах. Пожалуйста, посоветуйте, как это сделать?
Ответ №1:
Вы можете использовать df.append для объединения фрейма данных, затем использовать df.duplicated, который будет помечать дубликаты.
df3 = df1.append(df, ignore_index=True)
df4 = df3.duplicated(subset=['Team', 'name', 'Country', 'Token'], keep=False)