как настроить class_weight GaussianNB

#python #scikit-learn #gaussian

#python #scikit-учиться #гауссовский

Вопрос:

У меня немного несбалансированный набор данных (примерно на 200 точек данных больше в классе 1, чем в классе 2), и я хочу решить эту проблему, установив параметр class_weight='balanced' . Он отлично работал с LogisticRegression моделью и с DecisionTree моделью sklearn примерно так:

 decisiontree = DecisionTreeClassifier(class_weight='balanced')
 

Я хочу сделать то же самое с sklearns GaussianNB , но этот параметр class_weight там не поддерживается.
Как я мог это сделать?

Любая помощь приветствуется.

Комментарии:

1. Насколько велик ваш набор данных? Вероятно, нет необходимости балансировать его…

2. это не так уж и много, пара сотен точек данных для каждого класса. но я хотел бы сделать это точно в любом случае 🙂

3. Дело не в точности, ваш набор данных просто не кажется особенно несбалансированным. Какой процент от полного набора данных, по вашему мнению, составляет ваш положительный класс?