эффект нескольких сверточных слоев в CNN

#deep-learning #computer-vision #conv-neural-network

#глубокое обучение #компьютерное зрение #conv-нейронная сеть

Вопрос:

Это может быть очень просто, но я просто запутался в понимании того, почему в сети VGG у нас есть несколько сверточных слоев фильтра 3×3. Что конкретно произойдет, когда мы будем выполнять свертку одного и того же изображения дважды или более?

Ответ №1:

Ничего, если у вас нет нелинейного преобразования между ними. Тогда вы всегда можете свернуть его в один конвуляционный слой, который вычисляет то же самое.

Но VGG использует функции активации ReLU. Это позволяет изучать нелинейные преобразования данных.

1. Допустим, если у нас есть нелинейный ReLU между двумя или более сверточными слоями (conv relu conv relu conv relu relu max pool), какую другую информацию я получу по сравнению с использованием одного сверточного слоя (conv relu max pool).