Как мы выбираем ядра в CNN? (Сверточные нейронные сети)

#image-processing #machine-learning #neural-network #deep-learning #conv-neural-network

#обработка изображений #машинное обучение #нейронная сеть #глубокое обучение #conv-neural-network

Вопрос:

Перед отправкой в нейронную сеть к изображениям применяются ядра для извлечения объектов.Но как мы понимаем, что конкретное ядро поможет извлечь необходимую функцию для нейронной сети.

Комментарии:

1. Это то, что вам нужно получить, проведя ряд испытаний над вашими изображениями. Если ваши изображения меньше, то размер ядра (3,3) был бы идеальным. Для изображений большего размера размер ядра может быть (7,7). Это зависит от особенностей вашего изображения. Если объекты на вашем изображении относительно меньше, то ожидается меньший размер ядра.

2. Я думаю, вы упускаете из виду, что значения ядра фактически изучены, а не предварительно разработаны, как при классической обработке изображений.

Ответ №1:

На этот вопрос нет абсолютно общего ответа, не известен никакой основной метод определения этих гиперпараметров. Обычный подход заключается в поиске похожих проблем и архитектур глубокого обучения, которые, как уже было показано, работают. Затем путем экспериментов можно разработать подходящую архитектуру. Однако обычные размеры ядра составляют 3×3, 5×5 и 7×7.

В противном случае, есть статьи об этом 1 и 2, вы можете захотеть взглянуть, чтобы увидеть искусство выбора гиперпараметров в CNN.