#r #pca #feature-selection #leave-one-out
Вопрос:
Я примеряю регрессионную модель с 44 переменными. Выполняя PCA из-за мультиколлинеарности, я получаю 6 основных компонентов. Я использую перекрестную проверку без исключения.
К сожалению, из-за PCA и его «Меры адекватности выборки», которая должна быть >0,5 для всех переменных в PCA, я должен исключить некоторые переменные.
Является ли это частью выбора переменной/функции в PCA? Правильно ли говорить, что эти переменные не требуются для того, чтобы сделать хороший прогноз на основе этих переменных?
Спасибо.
Комментарии:
1. Почему только 6 ПК из 44 переменных?
2. Я исключил 13 переменных из-за MSA ниже 0,5. С остальными переменными я получаю 6 шт. из-за критерия КАЙЗЕРА (собственное значение выше 1). Исходя из КАРТЫ Velicer, мне нужно было бы взять 6 шт.