#survival-analysis #cox-regression #survival
Вопрос:
У меня есть вопрос относительно использования вероятности выживания ($surv), возвращаемой объектом survfit.
Я построил модель coxph, а затем использовал ее для расчета ожидаемого количества событий в каждом временном окне (в моем случае месяц) данных моделирования с помощью survfit(). В частности, для каждой записи я рассчитал вероятность события в течение временного окна T как $surv[T-1] — $surv[T]; наконец, я сложил отдельные вероятности вместе для каждого временного окна как ожидаемое количество событий в каждом временном окне.
С помощью этого метода я обнаружил, что модель coxph переоценила риск (вероятность события) на уровне популяции. Например, в данных моделирования фактическая общая кумулятивная вероятность события в первые шесть месяцев составляет 0,167, но я получил 0,194, как было предсказано с использованием метода выше; за первые двенадцать месяцев 0,296 против 0,334, 24 месяца-0,466 против 0,529. Я понимаю, что модель не будет идеальной, но все равно удивлен тем, что существует такой большой разрыв с самими данными моделирования.
Есть ли что-то неправильное в методе, который я использовал для расчета? Если нет, знаете ли вы, как исправить перерасход?