#sas
#sas
Вопрос:
Итак, я импортировал несколько CSV-файлов с данными биомаркеров и объединил их в набор данных под названием bioma. Я установил bioma в лабораторный набор данных, поскольку его необходимо интегрировать для переноса в лабораторию. Мой вопрос в том, как я могу использовать дату рождения (LB_BDT_C), присутствующую в исходных лабораторных данных, для заполнения даты рождения каждого субъекта в файлах csv при объединении / объединении?. Я знаю, что в proc sql join есть функция объединения, которая, возможно, позволит достичь этого, но я уверен, что есть более эффективный способ при объединении / объединении данных. Дата рождения отсутствует в файлах набора данных bioma / excel. Прошу прощения, если я говорю просто и не вижу здесь основного трюка, потому что мне определенно кажется, что я
Комментарии:
1. Покажите свой код,
IMPORT
MERGE
, иSET
. В зависимости от импорта вам, возможно, придется сложить все данные, затем отсортировать nodupkey-wise в таблицу ПОИСКА по идентификатору и где не хватает DOB. Последующий проход может ОБЪЕДИНИТЬ стек с ПОИСКОМ и заполнить недостающий DOB с помощью поиска DOB.
Ответ №1:
Я попробовал это после некоторой помощи, и, похоже, это сработало
proc sql;
create table distinctDOB as
select distinct CLIENTID
,LB_BDT_C
from LAB2
where LB_BDT_C is not null
order by 1;
quit;
proc sort data=LAB2; by CLIENTID;
data LAB;
merge LAB2 (drop=LB_BDT_C)
distinctDOB;
by CLIENTID;
RUN;