Выполнение логистической регрессии для несбалансированного набора данных в R

#r #lo&istic-re&ression #smote

#r #логистическая регрессия #Поразил

Вопрос:

У меня есть набор данных для 1000 сотрудников. В нем 800 активных сотрудников и 200 уволившихся.

Я пытаюсь выполнить логистическую регрессию, чтобы предсказать риск истощения.

Мой набор данных несбалансирован, потому что только 20% завершили работу. Как мне сбалансировать данные? Я слышал о SMOTE в Python, но как нам перенести это в R?

Спасибо

Комментарии:

1. Можете ли вы объяснить свои цели? Не обязательно балансировать, в зависимости от того, что вы пытаетесь сделать. (Поиск в Goo&le «R SMOTE» приводит к появлению ряда полезных ссылок …)

2. Похоже, что это не конкретный вопрос программирования, подходящий для Stack Overflow. Если у вас есть общие вопросы о надлежащем использовании различных статистических методов, то вместо этого вам следует задать такие вопросы в Cross Validated . Там у вас больше шансов получить лучшие ответы.

3. Спасибо. Теперь опубликовал более конкретный вопрос.