Неожиданный вывод из перекрестной таблицы

#r

#r

Вопрос:

Я использую метод перекрестной таблицы из gmodels пакета в следующем коде:

 CrossTable(news_test_pred, news_raw_test$type, prop.chisq = F, prop.c = F, prop.t = F, dnn = c('predicted', 'actual'))
  

После выполнения вывод выглядит следующим образом:

 Total Observations in Table:  19 


             | actual 
   predicted |  negative |  positive | Row Total | 
-------------|-----------|-----------|-----------|
    negative |         3 |         0 |         3 | 
             |     1.000 |     0.000 |     0.158 | 
-------------|-----------|-----------|-----------|
    positive |         9 |         7 |        16 | 
             |     0.562 |     0.438 |     0.842 | 
-------------|-----------|-----------|-----------|
Column Total |        12 |         7 |        19 | 
-------------|-----------|-----------|-----------|
  

Мой вопрос в том, что если было 12 «фактических негативов» и, из которых я правильно предсказал только 3 из них, почему он показывает 100%?

Я неправильно читаю эту перекрестную таблицу?

Комментарии:

1. Это вероятности строк ниже отрицательного и положительного значений. «1.00 0.00 == 1» и «0.562 0.438 == 1» Если вам нужны проценты для каждого «фактического», а не «прогнозируемого» значения, вы можете изменить первые два параметра.

2. @MrFlick Спасибо :). Я не знал, что могу их перевернуть. Ваш ответ имеет для меня смысл. Пожалуйста, опубликуйте, и я приму, если позволит ваше время

Ответ №1:

Вероятности, перечисленные ниже подсчетов во внутренних ячейках, представляют вероятность строки

  1.00 0.00 == 1
 0.562 0.438 == 1
  

Это говорит о том, что для 3 значений, которые вы прогнозировали как отрицательные, все они были фактически отрицательными.

Однако, похоже, вы хотите указать значение true, а не значение prdicted. Самый простой способ просто поменять ваши параметры на CrossTable

 CrossTable(news_raw_test$type, news_test_pred, 
    prop.chisq = F, prop.c = F, prop.t = F, 
    dnn = c('actual', 'predicted'))