Порог отсечения для задачи классификации 3 классов

#python #machine-learning #scikit-learn #roc #auc

#python #машинное обучение #scikit-learn #ОКР #auc

Вопрос:

Я построил модель случайного леса для задачи классификации 3 классов (низкий, средний, высокий).Я хочу получить оптимальное пороговое значение вероятности для модели.

При запуске этого кода я получаю сообщение об ошибке-

 false_pos_rate, true_pos_rate, proba = metrics.roc_curve(y_test, predicted_proba[:, -1])
 

Ошибка гласит —

 ValueError: multiclass format is not supported
 

Как мне достичь оптимального порогового значения вероятности для решения задачи трех классов?

Ответ №1:

в официальных примерах Sklean они используют OneVsAll подход, позволяющий получить ROC для каждого класса независимо и получить пороговое значение для каждого класса. перейдите по этой ссылке для примера кода: примеры sklean