Могу ли я получить [0 0] из категориальной маркировки в CNN?

#python #keras #conv-neural-network

#python #keras #conv-нейронная сеть

Вопрос:

Из того, что я понимаю из маркировки keras, одна горячая кодировка не позволяет принимать значения равными [0 0]? верно ли это предположение?

Мы пытаемся классифицировать 2 класса, и мы хотим иметь возможность обнаруживать мусор при загрузке изображения мусора. Однако он всегда обнаруживает либо [0 1], либо [1 0]. Возможно ли получить [0 0] в качестве метки без введения класса, который будет обрабатывать мусор или нет?

Итак, в принципе, может ли CNN предсказать, что это будет что-то другое, если это не 2 класса?

Ответ №1:

Это не должно быть возможно. Ваш «мусор» был бы третьим классом, требующим меток [1 0 0], [0 1 0], и [0 0 1].

Очень просто, модель, которую вы описали, вернет одну из двух категорий, в зависимости от того, какая из них имеет более высокий рейтинг на вашем конечном уровне. Это происходит независимо от того, являются ли входные значения 0.501 и 0.499 или 0.011 и 0.010 с большой частью «не уверен». Если вы явно не закодируете «не уверен» в своей модели, то эта часть решения не будет учитываться в классификации.

Комментарии:

1. Однако я думаю, что у OP нет таких изображений и, следовательно, он не сможет обучить такую модель. Я предполагаю, что OP находится в ситуации, подобной анализу настроений, где существует диапазон вероятности (скажем, 0,4-0,6), что модель не слишком уверена в правильном классе входного изображения.

2. @YilunZhang да, мы делаем нечто подобное, где, если мы находимся в диапазоне вероятностей, скажем, 0,4 или меньше, тогда мы считаем это мусором. Однако, я думаю, мы могли бы также подумать о том, чтобы сделать это, как сказал Прун. мы просто загрузили случайные изображения, которые мы бы классифицировали как изображения мусора

3. @SonGoku Если вы можете добавить / дополнить свои обучающие данные, чтобы добавить третью метку, то вам обязательно следует это сделать. Это сможет решить вашу проблему. Я не знал, что вы можете добавить дополнительные данные для 3-й метки.

4. @ Yilun Zhang что касается анализа настроений, как вы думаете, какой подход был бы наилучшим на случай, если нам понадобится сделать что-то подобное?

5. @SonGoku: ваш вопрос об анализе настроений не является частью этого вопроса и является слишком общим для Stack Overflow. Пожалуйста, переместите это на соответствующий сайт или в комнату чата.