Является ли предсказание регрессии из DecisionTreeRegressor от sklearn простым средним?

#python #machine-learning #scikit-learn #random-forest #decision-tree

#python #машинное обучение #scikit-learn #случайный лес #дерево решений

Вопрос:

Я пытаюсь точно выяснить, как генерируются прогнозы регрессии дерева решений. Это подробно не объясняется в документации, которую я рассмотрел.

Из документации sklearn DecisionTreeRegressor по функции predict:

Для модели классификации возвращается предсказанный класс для каждой выборки в X. Для регрессионной модели возвращается предсказанное значение, основанное на X.

Итак, прогнозы сделаны на основе простого среднего значения выходных данных конечного узла, в который попало новое значение X, или другим способом?

Ответ №1:

Как отмечено в документации sklearn (в последнем параграфе), sklearn использует алгоритм CART. И, как отмечалось здесь (слайд 29), CART просто выводит среднее значение конечного узла, в который попадает выборка.