#binary #classification #svm #probability #libsvm
#двоичный #классификация #svm #вероятность #libsvm
Вопрос:
Я хотел бы спросить, верно ли, что оценки вероятности, полученные LIBSVM, на самом деле указывают расстояние до разделяющей плоскости?
Если у меня есть двоичный класс, могу ли я сказать, что меньшие оценки вероятности класса 0 также означают, что более высокая вероятность его принадлежности к классу 1 по сравнению с более высокими оценками вероятности класса 0?
Спасибо
Ответ №1:
Первый вопрос:
Если расстояние между разделяющей гиперплоскостью и вектором очень велико, мы можем иметь высокую степень уверенности в том, что оно было правильно классифицировано, поэтому оценка вероятности будет высокой.
Напротив, если у вас есть вектор, очень близкий к вашей гиперплоскости, разделяющей два класса, его оценка вероятности будет близка к 0,5 для каждого класса.
Имейте в виду, что оценка вероятности — ЭТО НЕ расстояние. Но я бы сказал, что он вычисляется с использованием расстояния.
Второй вопрос:
Действительно, если у вас есть двоичный класс, оценка вероятности будет распределена между двумя классами.
Событие A «вектор принадлежит классу 0», тогда событие «вектор принадлежит классу 1» НЕ является
Если вектор находится в классе 0, мы вычисляем
И мы можем вычислить вероятность НЕ
Итак, если класс 1 имеет вероятность 0,8, класс 0 будет иметь вероятность 0,2.