на что указывает различный цвет узлов в классификаторе дерева решений sklearn?

#python #matplotlib #scikit-learn #decision-tree

Вопрос:

Я пытаюсь визуализировать вывод классификатора дерева решений. Это мой код

 from sklearn import tree
import matplotlib.pyplot as plt

plt.figure(figsize=(30,15))
tree.plot_tree(dt2,filled=True,fontsize=8)
plt.show()
plt.savefig('dtree.jpg')
 

Вот такой образ у меня получился. введите описание изображения здесь

Что представляют собой эти цвета? Как я должен их интерпретировать?

Ответ №1:

Согласно документации plot_tree по его filled параметру:

заполнено: bool, по умолчанию=False
Если установлено значение True, нарисуйте узлы, чтобы указать класс большинства для классификации, конечность значений для регрессии или чистоту узла для нескольких выходных данных.

Таким образом, в задачах классификации цвет указывает, к какому классу относится большинство образцов в каждом узле.

Комментарии:

1. Это не совсем ясно из документации, но, возможно, очевидно из вывода: чем темнее цвет, тем более чистый этот узел (сродни примечанию в документах о многовыходном выводе).