Заполнение недостающих данных с использованием одного из объединенных наборов данных

#sas

#sas

Вопрос:

Итак, я импортировал несколько CSV-файлов с данными биомаркеров и объединил их в набор данных под названием bioma. Я установил bioma в лабораторный набор данных, поскольку его необходимо интегрировать для переноса в лабораторию. Мой вопрос в том, как я могу использовать дату рождения (LB_BDT_C), присутствующую в исходных лабораторных данных, для заполнения даты рождения каждого субъекта в файлах csv при объединении / объединении?. Я знаю, что в proc sql join есть функция объединения, которая, возможно, позволит достичь этого, но я уверен, что есть более эффективный способ при объединении / объединении данных. Дата рождения отсутствует в файлах набора данных bioma / excel. Прошу прощения, если я говорю просто и не вижу здесь основного трюка, потому что мне определенно кажется, что я

введите описание изображения здесь

Комментарии:

1. Покажите свой код, IMPORT MERGE , и SET . В зависимости от импорта вам, возможно, придется сложить все данные, затем отсортировать nodupkey-wise в таблицу ПОИСКА по идентификатору и где не хватает DOB. Последующий проход может ОБЪЕДИНИТЬ стек с ПОИСКОМ и заполнить недостающий DOB с помощью поиска DOB.

Ответ №1:

Я попробовал это после некоторой помощи, и, похоже, это сработало

 proc sql;
    create table distinctDOB as
        select distinct CLIENTID
                        ,LB_BDT_C
        from LAB2
        where LB_BDT_C is not null
    order by 1;
quit;
proc sort data=LAB2; by CLIENTID;
data LAB;
    merge LAB2 (drop=LB_BDT_C)
          distinctDOB;
    by CLIENTID;
    RUN;