#r #predict #survival #parametric-equations
Вопрос:
Я пытаюсь построить модель выживания на наборе данных, который имеет большое количество ковариаций (~250). Я использовал модель пропорциональных опасностей и использовал следующую формулу:
param lt;- survreg(enrlSurv ~ X, dist = "loglogistic", data = train_df)
Я создал X с помощью as.matrix()
функции в фрейме данных train_df и исключил использование некоторых столбцов select
. Я хотел знать, является ли это правильным способом определения формулы или существует лучший способ сделать это? Я также заметил в сводке param
объекта, что у каждой ковариаты был подстрочный индекс «X».
Я также получаю ошибку при запуске функции прогнозирования:
pct lt;- seq(.0,.99,by=.01) predOv lt;- predict(param, newdata=test_df, type = "quantile", p = pct)
Функция прогнозирования возвращает то же количество строк, что и train_df, вместо test_df. Любая помощь будет очень признательна.