эффект нескольких сверточных слоев в CNN

#deep-learning #computer-vision #conv-neural-network

#глубокое обучение #компьютерное зрение #conv-нейронная сеть

Вопрос:

Это может быть очень просто, но я просто запутался в понимании того, почему в сети VGG у нас есть несколько сверточных слоев фильтра 3×3. Что конкретно произойдет, когда мы будем выполнять свертку одного и того же изображения дважды или более?

Комментарии:

1. Возможно, вас заинтересует datascience.stackexchange.com

2. Вы читали статью, в которой дается определение этой сети? Они точно упоминают эту деталь в статье. arxiv.org/abs/1409.1556

Ответ №1:

Ничего, если у вас нет нелинейного преобразования между ними. Тогда вы всегда можете свернуть его в один конвуляционный слой, который вычисляет то же самое.

Но VGG использует функции активации ReLU. Это позволяет изучать нелинейные преобразования данных.

Комментарии:

1. Допустим, если у нас есть нелинейный ReLU между двумя или более сверточными слоями (conv relu conv relu conv relu relu max pool), какую другую информацию я получу по сравнению с использованием одного сверточного слоя (conv relu max pool).