Матрица путаницы, дающая мне ошибку «все аргументы должны иметь одинаковую длину»?

#r #tree #statistics #analytics #confusion-matrix

Вопрос:

Я получаю сообщение об ошибке «Ошибка в таблице(pre2020$combined_status, pred.rpart) : все аргументы должны иметь одинаковую длину» для следующего кода, который я написал. Я пытаюсь оценить дерево регрессии, которое я написал. Как я могу устранить эту ошибку?

 library(rpart)
n = nrow(pre2020)
train = sample(n, n/2)
rpart.pre2020 <- rpart(combined_status ~ . - person_id, data = pre2020,
                       subset = train)
summary(rpart.pre2020) 
pred.2020 = predict(rpart.pre2020)
table(pre2020$combined_status, pred.rpart)
 

Ответ №1:

 table(pred.2020, pre2020$combined_status[train])
 
 pred.2020   0   1
        0 259   0
        1   0 241
 

Или с помощью пакета кареток:

 library(caret)
confusionMatrix(pred.2020, pre2020$combined_status[train])
 

Пример вывода:

 Confusion Matrix and Statistics

          Reference
Prediction   0   1
         0 259   0
         1   0 241
                                     
               Accuracy : 1          
                 95% CI : (0.9926, 1)
    No Information Rate : 0.518      
    P-Value [Acc > NIR] : < 2.2e-16  
                                     
                  Kappa : 1          
 Mcnemar's Test P-Value : NA         
                                     
            Sensitivity : 1.000      
            Specificity : 1.000      
         Pos Pred Value : 1.000      
         Neg Pred Value : 1.000      
             Prevalence : 0.518      
         Detection Rate : 0.518      
   Detection Prevalence : 0.518      
      Balanced Accuracy : 1.000      
                                     
       'Positive' Class : 0