Уместно ли использовать факторную переменную, созданную из предикторной переменной в регрессии PH Кокса?

#r #survival-analysis #cox-regression

#r #анализ выживаемости #cox-регрессия

Вопрос:

Это для R Studio — анализа выживаемости с данными пакета «выживание» и выполнения анализа PH Кокса.

У меня есть базовый набор данных о выживаемости (nafld1), который включает возраст и ИМТ. Я создал новую переменную из существующих данных bmi. Я создал категорию A, B или C на основе квантилей ИМТ. Итак, когда я включаю их в формулу coxph и получаю результаты, можно ли их включать, или они каким-то образом получают «двойной подсчет» в регрессии, поскольку формула выглядит примерно так

 ~sex age bmi bmi_g1 bmi_g2 bmi_g3
 

Концептуально это сбивает меня с толку, потому что группы основаны на ИМТ, а не технически полностью отдельной ковариации (в отличие от аналогичного лечения A или B), а скорее для уточнения деталей из приведенных данных.

Буду признателен за любую помощь, и, пожалуйста, дайте мне знать, если вам понадобится дополнительная информация.

Комментарии:

1. Это не математически неверно, но это не обязательно лучший подход. Можете ли вы подробнее рассказать о том, какова ваша цель, включая эти квантильные переменные? Я голосую за закрытие / переход на CrossValidated . Это эквивалентно моделированию логарифмической опасности как комбинации прямой ( bmi ) и кусочно-постоянной функции с точками останова ( bmi_g1 bmi_g2 bmi_g3 ).

2. Да — Целью было получить более подробную информацию о том, как ИМТ влияет на выживаемость пациентов. ИМТ в глобальном масштабе может быть статистически незначимым, но когда он разбит на разные группы низкого, среднего и высокого уровня, это дает более подробную историю и (возможно, немного очевидно) мы могли видеть, что более высокий имт сопряжен с большим риском…

3. Я бы настоятельно рекомендовал вам использовать сплайновую или аддитивную модель (например splines::ns(bmi, 6) , где число представляет степени свободы / волнистости / сложности / количества параметров, связанных с bmi , а не дихотомией — см. Стратегии моделирования регрессии Харрелла

4. Спасибо. На данный момент это немного выше моего уровня квалификации. Я делаю это для окончательного проекта в факультативном курсе, и мы не рассматривали сплайны или аддитивные модели в нашем классе.

5. Вы могли бы поместить ее туда и посмотреть, что произойдет…