Когда svm_c_linear_trainer от Dlib лучше, чем svm_c_linear_dcd_trainer?

#machine-learning #svm #training-data #dlib

#машинное обучение #svm #обучение-данные #dlib

Вопрос:

У меня проблема с машинным обучением из-за многомерных маркированных входных данных и относительно небольшого размера выборки. Использование очень классного визуального руководства привело меня к svm_c_linear_trainer методу. Но что я понимаю из документации, так это то, что аналогичный svm_c_linear_dcd_trainer имеет опцию «теплого запуска», что звучит как лучшая вещь, чем «холодный запуск», например, внутри цикла перекрестной проверки. Однако, svm_c_linear_dcd_trainer это выбранный метод для другого типа задач, основное отличие которого заключается в применении к немаркированным данным.

Возникнет ли проблема при использовании svm_c_linear_dcd_trainer с помеченными данными или есть другая веская причина, почему svm_c_linear_trainer лучше?

Ответ №1:

Эта статья о SVM с двойным спуском, а также документация на веб-сайте DLib показывают, что она svm_c_linear_dcd_trainer может использоваться в качестве дополнительной замены стандартной линейной SVM.

Предполагается, что он обладает превосходной производительностью (цитата из упомянутой статьи):

Эксперименты показывают, что наш метод быстрее, чем самые современные реализации.

… потому что алгоритм предположительно лучше использует оптимизацию, давая те же результаты, что и стандартные алгоритмы SVM.

Страницы 6 и 7 статьи, в которых он сравнивается с другими алгоритмами на нескольких разных наборах данных, могут быть особенно интересны для вас.