Логистическая регрессия для численного предиктора?

#r #data-science #logistic-regression #data-mining

#r #наука о данных #логистическая регрессия #интеллектуальный анализ данных

Вопрос:

Я работаю над набором данных и хочу использовать некоторые из следующих переменных для прогнозирования «Operatieduur». Все предикторы были разложены на множители.

 LogicFit <- train(Operatieduur ~ Anesthesioloog   Aorta_chirurgie   Benadering  
                    Chirurg   Operatietype, data = TrainData,
                  method="glm", family="binomial")
 

Здесь я использую функцию «train» из пакета каретки, чтобы выполнить логистическую подгонку с помощью glm. Когда я запустил этот код, я получил сообщение об ошибке:

 1: model fit failed for Resample01: parameter=none Error in eval(family$initialize) : y values must be 0 <= y <= 1
 

Я погуглил и обнаружил, что причина в том, что resopnse «Operatieduur» представляет собой непрерывное числовое значение (это время продолжительности). Итак, как мне изменить функцию, чтобы использовать предикторы (все они являются категориальными значениями) для прогнозирования непрерывного числового значения? Может ли логистическая функция это сделать?

Комментарии:

1. Если бы ваши предикторы были непрерывными, возможно , имело бы смысл подгонять логистическую кривую с использованием nls() (т. Е. Предположить, что существует минимальное значение (возможно, фиксированное до 0) и максимальное значение (обычно не фиксированное до 1), и что увеличение любого из предикторов приводит к сигмоидальным кривым увеличения. Можете ли вы предоставить нам больше контекста / рассказать нам больше о ваших переменных?

Ответ №1:

Логистическая регрессия предсказывает категории, а не числовые переменные. Если вы хотите предсказать непрерывную числовую переменную (даже с использованием категориальных переменных), используйте обычную регрессию. В зависимости от количества категорий ваших переменных-предикторов вы можете рассмотреть одну горячую / фиктивную кодировку.