Поиск недостающих записей — R

#r

Вопрос:

У меня есть список 5509820 obs в df1, у которых есть адреса и т. Д. Чтобы запустить их через отдельную программу, мне пришлось разделить их на 6 файлов, по 1 миллиону файлов в каждом, запустить их через программу, а затем собрать их вместе в R.

Мне не хватает 80 строк. Я дал файлу идентификационный номер, прежде чем разделить их:

 df_combined<- tibble::rowid_to_column(df_combined, "ID")
 

Которая прошла через это. Поэтому мне нужно найти способ просмотреть df, который у меня сейчас есть, с меньшим количеством строк на 80, и выяснить, какие из них мне не хватает, чтобы я мог понять, какие из них я отбросил. Есть какие-нибудь предложения?

Комментарии:

1. Вы можете использовать anti_join(df1, df2, by = "id") from dplyr для возврата строк в df2, идентификаторы которых не указаны в идентификаторах df1.

2. Уэлп, это было невероятно идеально для того, что мне было нужно, спасибо!