#r
#r
Вопрос:
Я использую метод перекрестной таблицы из gmodels
пакета в следующем коде:
CrossTable(news_test_pred, news_raw_test$type, prop.chisq = F, prop.c = F, prop.t = F, dnn = c('predicted', 'actual'))
После выполнения вывод выглядит следующим образом:
Total Observations in Table: 19
| actual
predicted | negative | positive | Row Total |
-------------|-----------|-----------|-----------|
negative | 3 | 0 | 3 |
| 1.000 | 0.000 | 0.158 |
-------------|-----------|-----------|-----------|
positive | 9 | 7 | 16 |
| 0.562 | 0.438 | 0.842 |
-------------|-----------|-----------|-----------|
Column Total | 12 | 7 | 19 |
-------------|-----------|-----------|-----------|
Мой вопрос в том, что если было 12 «фактических негативов» и, из которых я правильно предсказал только 3 из них, почему он показывает 100%?
Я неправильно читаю эту перекрестную таблицу?
Комментарии:
1. Это вероятности строк ниже отрицательного и положительного значений. «1.00 0.00 == 1» и «0.562 0.438 == 1» Если вам нужны проценты для каждого «фактического», а не «прогнозируемого» значения, вы можете изменить первые два параметра.
2. @MrFlick Спасибо :). Я не знал, что могу их перевернуть. Ваш ответ имеет для меня смысл. Пожалуйста, опубликуйте, и я приму, если позволит ваше время
Ответ №1:
Вероятности, перечисленные ниже подсчетов во внутренних ячейках, представляют вероятность строки
1.00 0.00 == 1
0.562 0.438 == 1
Это говорит о том, что для 3 значений, которые вы прогнозировали как отрицательные, все они были фактически отрицательными.
Однако, похоже, вы хотите указать значение true, а не значение prdicted. Самый простой способ просто поменять ваши параметры на CrossTable
CrossTable(news_raw_test$type, news_test_pred,
prop.chisq = F, prop.c = F, prop.t = F,
dnn = c('actual', 'predicted'))