Регрессия — PCA — Что делать с переменными?

#r #pca #feature-selection #leave-one-out

Вопрос:

Я примеряю регрессионную модель с 44 переменными. Выполняя PCA из-за мультиколлинеарности, я получаю 6 основных компонентов. Я использую перекрестную проверку без исключения.

К сожалению, из-за PCA и его «Меры адекватности выборки», которая должна быть >0,5 для всех переменных в PCA, я должен исключить некоторые переменные.

Является ли это частью выбора переменной/функции в PCA? Правильно ли говорить, что эти переменные не требуются для того, чтобы сделать хороший прогноз на основе этих переменных?

Спасибо.

Комментарии:

1. Почему только 6 ПК из 44 переменных?

2. Я исключил 13 переменных из-за MSA ниже 0,5. С остальными переменными я получаю 6 шт. из-за критерия КАЙЗЕРА (собственное значение выше 1). Исходя из КАРТЫ Velicer, мне нужно было бы взять 6 шт.