Оценки вероятности LIBSVM

#binary #classification #svm #probability #libsvm

#двоичный #классификация #svm #вероятность #libsvm

Вопрос:

Я хотел бы спросить, верно ли, что оценки вероятности, полученные LIBSVM, на самом деле указывают расстояние до разделяющей плоскости?

Если у меня есть двоичный класс, могу ли я сказать, что меньшие оценки вероятности класса 0 также означают, что более высокая вероятность его принадлежности к классу 1 по сравнению с более высокими оценками вероятности класса 0?

Спасибо

Ответ №1:

Первый вопрос:

Если расстояние между разделяющей гиперплоскостью и вектором очень велико, мы можем иметь высокую степень уверенности в том, что оно было правильно классифицировано, поэтому оценка вероятности будет высокой.

Напротив, если у вас есть вектор, очень близкий к вашей гиперплоскости, разделяющей два класса, его оценка вероятности будет близка к 0,5 для каждого класса.

Имейте в виду, что оценка вероятности — ЭТО НЕ расстояние. Но я бы сказал, что он вычисляется с использованием расстояния.

Второй вопрос:

Действительно, если у вас есть двоичный класс, оценка вероятности будет распределена между двумя классами.

Событие A «вектор принадлежит классу 0», тогда событие «вектор принадлежит классу 1» НЕ является

Если вектор находится в классе 0, мы вычисляем

введите описание изображения здесь

И мы можем вычислить вероятность НЕ

введите описание изображения здесь

Итак, если класс 1 имеет вероятность 0,8, класс 0 будет иметь вероятность 0,2.