Что именно означает «ввод» в случае нейронной сети, выполняющей обнаружение изображений (например)?

#image-processing #input #neural-network #perceptron

Вопрос:

простая нейронная сеть

Скажем, у нас есть входные данные в виде набора изображений: — (200,56×56,3), где 200-количество отдельных изображений, 56×56-пиксели (длина по ширине), а 3 относятся к значениям RGB

Итак, x1,x2,x3,x4 и т. Д. Относятся к (количеству экземпляров, пикселям (длина), пикселям (ширина) и значению RGB?

или есть 1 881 600 входов (равно 200x56x56x3)?

Ответ №1:

Количество входов в вашем случае равно 1*56*56*3=9408 . Представьте , что вы хотите предсказать значение для 1 нового изображения размера 56*56 , вам нужно будет передать в сеть все значения RGB ( 3 ) каждого пикселя.

На практике нейронные сети с обратной связью, как описано на вашем рисунке, не используются для классификации изображений. Вместо этого мы используем CNN (Сверточную нейронную сеть).

Комментарии:

1. x1, x2, x3 и x4, упомянутые выше, относятся к размерам пикселей и значениям RGB или отдельным изображениям? Ваш ответ указывает на первое, я прав?

2. например, x1 может ссылаться на первое пиксельное красное значение, x2-на первое пиксельное синее значение и так далее…