predict_proba для LinearSVC с CalibratedClassifierCV и cross_val_predict

#python #machine-learning #scikit-learn #classification #cross-validation

#python #машинное обучение #scikit-учиться #классификация #перекрестная проверка

Вопрос:

Я пытаюсь вычислить точность и ROC для LinearSVM, но я не уверен в получении вероятностей для вычисления ROC.

У меня есть это для вычисления точности. y_pred дает мне точные прогнозы.

 svm = LinearSVC()
y_pred = cross_val_predict(svm, X, y, cv=5)
  

Для вычисления вероятностей у меня есть это:

 clf = CalibratedClassifierCV(svm, cv=5)
scores = cross_val_predict(clf, X, y, cv=5, method='predict_proba')[:,1]
  

Я не уверен в приведенных выше 2 строках, потому что я чувствую, что есть некоторое повторение с параметром cv = 5. Есть идеи о том, как объединить cross_val_predict и CalibratedClassifierCV? У меня нет отдельного набора тестов. svm с линейным ядром дает мне разные результаты, и я хочу использовать только LinearSVM.

Комментарии:

1. Вы просто пытаетесь обучить модель и определить auc и точность? Почему вы используете CalibratedClassifierCV() ? Кроме того, почему бы вам не создать набор проверки?

2. Я не хочу создавать другой набор. Я только хочу выполнить перекрестную проверку, используя cross_val_predict. Да, я просто тренирую модель для определения AUC и точности путем перекрестной проверки.