#logistic-regression #rapidminer #multicollinearity
Вопрос:
У меня есть несколько номинальных атрибутов, таких как Возрастная группа (16-20, 21-30 и т.д.), Тарифный план (1, 2, 3, 4), Международный план (Да, Нет), Жалобы (Правда, Ложь)
Когда я запускаю свою модель логистической регрессии для прогнозирования оттока клиентов, она последовательно удаляет один атрибут из номинального атрибута. Например, он удалит, Жалобы = Ложь, Тарифный план 2 и т.д.
Модель Логистической Регрессии, Удаляющая Номинальные Атрибуты
Это не удаление данных, а просто один атрибут из номинального набора.
Затем я попытался изменить номинальные атрибуты на числовые, чтобы они отображали все атрибуты, но затем я столкнулся с другой проблемой, когда один атрибут из каждого номинального набора является коллинеарным и, следовательно, удален из модели логистической регрессии.
Числовые атрибуты удаляются за коллинеарность
Я не совсем уверен, почему модель делает это, но я хотел бы использовать удаленные атрибуты внутри моделей, чтобы я мог их анализировать.
Комментарии:
1. Пожалуйста, проясните вашу конкретную проблему или предоставьте дополнительные сведения, чтобы выделить именно то, что вам нужно. Поскольку это написано в настоящее время, трудно точно сказать, о чем вы просите.