Если количество функций намного больше, чем количество примеров в наборе данных, svm все еще работает?

#machine-learning #svm #dimensionality-reduction

#машинное обучение #svm #уменьшение размерности

Вопрос:

Линейная регрессия не работает, если количество объектов больше размера набора данных; если не применяется регуляризация. Есть ли у svm похожие проблемы? Не даст ли это хорошего приближения, если количество примеров меньше по сравнению с размерностью объектов? Скажите, являются ли примеры 1/10-м или 1/100-м из функций??

Комментарии:

1. Этот вопрос был бы гораздо более уместным при перекрестной проверке . Хотя, если вы разместите там сообщение, оно может быть помечено как дублирующее, потому что список сообщений this должен ответить на ваш вопрос.

Ответ №1:

Когда количество примеров меньше по сравнению с количеством функций, у вас не будет достаточно данных, чтобы соответствовать нелинейной SVM, т.е. SVM с нелинейным ядром.SVM с линейным ядром (или без ядра) — это один из способов.

Если вы хотите использовать нелинейный SVM, вам нужно тщательно выбрать параметры ядра и параметры регуляризации и правильно настроить их.

Я имею в виду, что нет присущей проблемы с использованием SVM (или других регуляризованных моделей) для решения проблемы с сотнями наблюдений и тысячами атрибутов, при условии, что параметры регуляризации настроены правильно.