#python #scikit-learn #gaussian
#python #scikit-учиться #гауссовский
Вопрос:
У меня немного несбалансированный набор данных (примерно на 200 точек данных больше в классе 1, чем в классе 2), и я хочу решить эту проблему, установив параметр class_weight='balanced'
. Он отлично работал с LogisticRegression
моделью и с DecisionTree
моделью sklearn примерно так:
decisiontree = DecisionTreeClassifier(class_weight='balanced')
Я хочу сделать то же самое с sklearns GaussianNB
, но этот параметр class_weight
там не поддерживается.
Как я мог это сделать?
Любая помощь приветствуется.
Комментарии:
1. Насколько велик ваш набор данных? Вероятно, нет необходимости балансировать его…
2. это не так уж и много, пара сотен точек данных для каждого класса. но я хотел бы сделать это точно в любом случае 🙂
3. Дело не в точности, ваш набор данных просто не кажется особенно несбалансированным. Какой процент от полного набора данных, по вашему мнению, составляет ваш положительный класс?