#r
Вопрос:
У меня есть список 5509820 obs в df1, у которых есть адреса и т. Д. Чтобы запустить их через отдельную программу, мне пришлось разделить их на 6 файлов, по 1 миллиону файлов в каждом, запустить их через программу, а затем собрать их вместе в R.
Мне не хватает 80 строк. Я дал файлу идентификационный номер, прежде чем разделить их:
df_combined<- tibble::rowid_to_column(df_combined, "ID")
Которая прошла через это. Поэтому мне нужно найти способ просмотреть df, который у меня сейчас есть, с меньшим количеством строк на 80, и выяснить, какие из них мне не хватает, чтобы я мог понять, какие из них я отбросил. Есть какие-нибудь предложения?
Комментарии:
1. Вы можете использовать
anti_join(df1, df2, by = "id")
fromdplyr
для возврата строк в df2, идентификаторы которых не указаны в идентификаторах df1.2. Уэлп, это было невероятно идеально для того, что мне было нужно, спасибо!