#python #machine-learning #pca #prediction
#python #машинное обучение #pca #прогнозирование
Вопрос:
С очень общей точки зрения, когда у вас есть набор данных X и вы хотите предсказать метку Y, какова цель начала с PCA (анализа основных компонентов), а затем выполнения самого прогноза (с помощью логистической регрессии или случайного леса или чего-то еще) как по интуитивной, так и по теоретической причине? В каком случае это может улучшить качество прогнозирования? Спасибо!
Комментарии:
1. Здесь это не по теме, вам следует взглянуть на stats.stackexchange.com .
Ответ №1:
Я предполагаю, что вы имеете в виду уменьшение размерности на основе PCA. Данные с низкой дисперсией часто, но не всегда, обладают небольшой прогностической силой, поэтому удаление измерений с низкой дисперсией в вашем наборе данных может быть эффективным способом улучшения времени работы прогностического средства. В тех случаях, когда это повышает отношение сигнал / шум, это может даже улучшить качество прогнозирования. Но это всего лишь эвристика и не является универсально применимым.