Тестирование статистики за деревом решений

#statistics #decision-tree

Вопрос:

Я обнаружил у себя проблему со статистикой. Я ищу решение…

Например, если у вас есть два дерева решений, и одно дерево сбросило 970 листьев, а другое-1027, вы предполагаете, что они должны сбросить одинаковое количество листьев.

Как вы проверяете, значительно ли отличается это количество отсчетов?

Ответ №1:

Мы используем распределение Пуассона для деревьев. И для более чем 1000 листьев на дереве это почти нормальный участок распределения. С этого момента для этого легко использовать статистику.