Уравнения для выходных данных узлов в скрытом и выходных слоях нейронной сети

#artificial-intelligence #neural-network

#искусственный интеллект #нейронная сеть

Вопрос:

Эй, ребята, я новичок в нейронных сетях.. Я хочу знать, как составить уравнения для выходных данных узлов в скрытом и выходных слоях нейронной сети. Я хотел бы знать ответ на приведенный ниже вопрос и как вы это сделали. Я также не смог найти никаких доступных материалов для чтения по этому вопросу.

Предположим, у меня проблема с двоичной классификацией. Предположим, что у меня есть многослойная нейронная сеть с одним скрытым слоем. Предположим, что у меня есть сигмоидальная функция активации, заданная f(x)=1/(1 e^-z) . Кто-нибудь знает, как я нахожу уравнение для выходных данных узлов в скрытом слое и выходных данных узлов в выходном слое?

Спасибо, ребята, любая помощь была бы отличной.

Ответ №1:

Я сократил трехслойный NN до набора уравнений (1 входной узел, 3 скрытых узла, 1 выходной узел), и в итоге у меня получилось то, что показано на изображении. (Примечание: я предполагаю, что загрузка изображений сработала — они заблокированы фильтром морали компании).

  1. Я обозначил выходные данные каждого узла как o, подписавшись как {слой, нейрон}.
  2. Веса были помечены как w с нижними индексами, указывающими {to_layer,neuron}, и надстрочными индексами, указывающими {from_layer,neuron}.
  3. Условия смещения b были подписаны как {слой, нейрон}

Как показано, масштабированный входной сигнал NN (Cet) был сформулирован как выходной сигнал узла на уровне 1 (обозначенный как Eqn 3 на рисунке). Моя сигмоидальная функция активации похожа на вашу (уравнение 4). Оттуда был вычислен выходной уровень 2, узел 1 (уравнение 5), затем выходной уровень 2, узел 2 (уравнение 6), затем выходной уровень 2, узел 3 (уравнение 7).

Затем выходные данные (BISt на моем рисунке) были вычислены как взвешенная сумма активаций скрытого слоя, которая затем была передана через функцию активации.

уравнение рис.

Эта стратегия хорошо работала для моего приложения.

Комментарии:

1. Спасибо.. Я внимательно прочитаю это позже и нажму принятый ответ, когда у меня будет время разобраться :).

2. Нет проблем — дайте мне знать, если у вас возникнут какие-либо вопросы.

3. в случае этой сигмоидной функции, а не -x, почему в уравнении 4 есть 0.8 * x, можете ли вы, пожалуйста, объяснить мне, что

4. @ashim888 Особенности: издатель опустил «-» в показателе степени. Это должно быть exp (-0.8x). Общее утверждение: коэффициент 0,8 служит в качестве «формирующего» члена, который эффективно управляет крутизной функции сжатия вокруг x = 0. Более высокие значения (т. Е. 10 в данном случае) увеличивают крутизну и приводят к тому, что функция сжатия направляется к функции единичного шага. Более низкие значения (т. Е. 0,1 в данном случае) уменьшают крутизну и приводят к тому, что функция сжатия больше напоминает линию вблизи x = 0.