#r #svm #feature-selection
#r #svm #выбор объекта
Вопрос:
У меня есть матрица 504 (r) x 615 (c), которая имеет 165 положительных, остальные отрицательные метки. Я использую RFS greedy feature selection (ссылка: https://www.cs.cmu.edu /~kdeng/thesis/feature.pdf). Я использую SVM с радиальным ядром для классификации во время выбора объекта. Я хочу знать, как выбрать параметры SVM для получения оптимальных функций. Этот вопрос возникает потому, что, когда я использую разные параметры (гамма = 0,01 — 0,7, стоимость = 0,1, 1, 10, 30), алгоритм выдает разные наборы функций.
Обновление: я взял 70% в качестве набора поездов, 30% в качестве набора перекрестной проверки. Я провел 2 эксперимента: 1 с gamma = 0.09, cost = 10, и система выбрала 48 функций; 2 с gamma = 0.01, cost = 30, и система выбрала 39 функций. Точность в наборе перекрестной проверки с первым набором функций лучше, чем во втором наборе.
Комментарии:
1. Добро пожаловать в SO!, чтобы убедиться в стабильности функций, вам понадобятся методы перекрестной проверки, они могут быть полезны, устранение рекурсивных функций caret и перекрестная проверка python sklearn
2. Спасибо. Кроме того, я не знал о пакете ‘caret’ — спасибо за это!
3. в общем случае вам нужно будет выполнить вложенную повторную выборку: внутренний цикл для настройки гиперпараметров, средний цикл для последовательного прямого выбора и внешний цикл для оценки производительности. Ознакомьтесь с этим руководством .