#deep-learning #computer-vision #conv-neural-network
#глубокое обучение #компьютерное зрение #conv-нейронная сеть
Вопрос:
Это может быть очень просто, но я просто запутался в понимании того, почему в сети VGG у нас есть несколько сверточных слоев фильтра 3×3. Что конкретно произойдет, когда мы будем выполнять свертку одного и того же изображения дважды или более?
Комментарии:
1. Возможно, вас заинтересует datascience.stackexchange.com
2. Вы читали статью, в которой дается определение этой сети? Они точно упоминают эту деталь в статье. arxiv.org/abs/1409.1556
Ответ №1:
Ничего, если у вас нет нелинейного преобразования между ними. Тогда вы всегда можете свернуть его в один конвуляционный слой, который вычисляет то же самое.
Но VGG использует функции активации ReLU. Это позволяет изучать нелинейные преобразования данных.
Комментарии:
1. Допустим, если у нас есть нелинейный ReLU между двумя или более сверточными слоями (conv relu conv relu conv relu relu max pool), какую другую информацию я получу по сравнению с использованием одного сверточного слоя (conv relu max pool).