#statistics #decision-tree
Вопрос:
Я обнаружил у себя проблему со статистикой. Я ищу решение…
Например, если у вас есть два дерева решений, и одно дерево сбросило 970 листьев, а другое-1027, вы предполагаете, что они должны сбросить одинаковое количество листьев.
Как вы проверяете, значительно ли отличается это количество отсчетов?
Ответ №1:
Мы используем распределение Пуассона для деревьев. И для более чем 1000 листьев на дереве это почти нормальный участок распределения. С этого момента для этого легко использовать статистику.