Поиск недостающих записей - R

Вопрос:

У меня есть список 5509820 obs в df1, у которых есть адреса и т. Д. Чтобы запустить их через отдельную программу, мне пришлось разделить их на 6 файлов, по 1 миллиону файлов в каждом, запустить их через программу, а затем собрать их вместе в R.

Мне не хватает 80 строк. Я дал файлу идентификационный номер, прежде чем разделить их:

 df_combined<- tibble::rowid_to_column(df_combined, "ID")

Которая прошла через это. Поэтому мне нужно найти способ просмотреть df, который у меня сейчас есть, с меньшим количеством строк на 80, и выяснить, какие из них мне не хватает, чтобы я мог понять, какие из них я отбросил. Есть какие-нибудь предложения?

1. Вы можете использовать anti_join(df1, df2, by = "id") from dplyr для возврата строк в df2, идентификаторы которых не указаны в идентификаторах df1.

2. Уэлп, это было невероятно идеально для того, что мне было нужно, спасибо!

Поиск недостающих записей — R

Вопрос:

Комментарии:

Вопрос:

Комментарии:

Вам также может понравиться

Как я могу изменить переполнение css в зависимости от содержимого?

Как создать отладочный код с помощью директивы #ifdef. Objective-c

Использование “combn” для создания списка кадров данных для всех выбранных комбинаций переменных и столбцов для не выбранных переменных