Анализ выживаемости в R

#r #predict #survival #parametric-equations

Вопрос:

Я пытаюсь построить модель выживания на наборе данных, который имеет большое количество ковариаций (~250). Я использовал модель пропорциональных опасностей и использовал следующую формулу:

 param lt;- survreg(enrlSurv ~ X, dist = "loglogistic", data = train_df)  

Я создал X с помощью as.matrix() функции в фрейме данных train_df и исключил использование некоторых столбцов select . Я хотел знать, является ли это правильным способом определения формулы или существует лучший способ сделать это? Я также заметил в сводке param объекта, что у каждой ковариаты был подстрочный индекс «X».

Я также получаю ошибку при запуске функции прогнозирования:

 pct lt;- seq(.0,.99,by=.01) predOv lt;- predict(param, newdata=test_df, type = "quantile", p = pct)  

Функция прогнозирования возвращает то же количество строк, что и train_df, вместо test_df. Любая помощь будет очень признательна.