#r #lo&istic-re&ression #smote
#r #логистическая регрессия #Поразил
Вопрос:
У меня есть набор данных для 1000 сотрудников. В нем 800 активных сотрудников и 200 уволившихся.
Я пытаюсь выполнить логистическую регрессию, чтобы предсказать риск истощения.
Мой набор данных несбалансирован, потому что только 20% завершили работу. Как мне сбалансировать данные? Я слышал о SMOTE в Python, но как нам перенести это в R?
Спасибо
Комментарии:
1. Можете ли вы объяснить свои цели? Не обязательно балансировать, в зависимости от того, что вы пытаетесь сделать. (Поиск в Goo&le «R SMOTE» приводит к появлению ряда полезных ссылок …)
2. Похоже, что это не конкретный вопрос программирования, подходящий для Stack Overflow. Если у вас есть общие вопросы о надлежащем использовании различных статистических методов, то вместо этого вам следует задать такие вопросы в Cross Validated . Там у вас больше шансов получить лучшие ответы.
3. Спасибо. Теперь опубликовал более конкретный вопрос.