#machine-learning #svm #training-data #dlib
#машинное обучение #svm #обучение-данные #dlib
Вопрос:
У меня проблема с машинным обучением из-за многомерных маркированных входных данных и относительно небольшого размера выборки. Использование очень классного визуального руководства привело меня к svm_c_linear_trainer
методу. Но что я понимаю из документации, так это то, что аналогичный svm_c_linear_dcd_trainer
имеет опцию «теплого запуска», что звучит как лучшая вещь, чем «холодный запуск», например, внутри цикла перекрестной проверки. Однако, svm_c_linear_dcd_trainer
это выбранный метод для другого типа задач, основное отличие которого заключается в применении к немаркированным данным.
Возникнет ли проблема при использовании svm_c_linear_dcd_trainer
с помеченными данными или есть другая веская причина, почему svm_c_linear_trainer
лучше?
Ответ №1:
Эта статья о SVM с двойным спуском, а также документация на веб-сайте DLib показывают, что она svm_c_linear_dcd_trainer
может использоваться в качестве дополнительной замены стандартной линейной SVM.
Предполагается, что он обладает превосходной производительностью (цитата из упомянутой статьи):
Эксперименты показывают, что наш метод быстрее, чем самые современные реализации.
… потому что алгоритм предположительно лучше использует оптимизацию, давая те же результаты, что и стандартные алгоритмы SVM.
Страницы 6 и 7 статьи, в которых он сравнивается с другими алгоритмами на нескольких разных наборах данных, могут быть особенно интересны для вас.