Как я могу расширить свой прогноз случайной выживаемости в лесу за прошлые годы в обучающем наборе данных?

#r #random-forest #survival-analysis

#r #случайный лес #анализ выживания

Вопрос:

Я обучил свою модель леса случайного выживания, используя 30 лет наблюдений. Я хотел бы спрогнозировать выживаемость за эти тридцать лет. Возможно ли это с лесами случайного выживания? Я использую пакет ranger для создания своего RSF, но я столкнулся с аналогичными проблемами с другими пакетами RSF.

Комментарии:

1. Другой подход: Вы, вероятно, находитесь в хвосте распределения, каким бы оно ни было. Используйте теорию распределения экстремальных значений для определения формы хвоста, а затем подгоните модель AFT к данным за последние 10 лет.

2. Я знаю, что этот вопрос устарел, но я бы настоятельно не советовал делать то, что вы пытаетесь сделать. Экстраполяция никогда не является хорошей идеей (даже с простыми задачами регрессии), с выживанием это невозможно, поскольку прогнозы делаются на основе оценки Каплана-Мейера, которая обучается на конечных данных. Я бы также избегал маршрута экстремальных значений, который плохо сочетается с прогнозами PH