#python #machine-learning #scikit-learn #random-forest #decision-tree
#python #машинное обучение #scikit-learn #случайный лес #дерево решений
Вопрос:
Я пытаюсь точно выяснить, как генерируются прогнозы регрессии дерева решений. Это подробно не объясняется в документации, которую я рассмотрел.
Из документации sklearn DecisionTreeRegressor по функции predict:
Для модели классификации возвращается предсказанный класс для каждой выборки в X. Для регрессионной модели возвращается предсказанное значение, основанное на X.
Итак, прогнозы сделаны на основе простого среднего значения выходных данных конечного узла, в который попало новое значение X, или другим способом?
Ответ №1:
Как отмечено в документации sklearn (в последнем параграфе), sklearn использует алгоритм CART. И, как отмечалось здесь (слайд 29), CART просто выводит среднее значение конечного узла, в который попадает выборка.