Почему мы можем изменить размер входного изображения darknet YOLO после обучения?

#machine-learning #deep-learning #neural-network #yolo #darknet

#машинное обучение #глубокое обучение #нейронная сеть #yolo #даркнет

Вопрос:

Конфигурационные файлы Darknet yolo — это что-то вроде этого:

 [net]
batch=64
subdivisions=8
height=416
width=416
channels=3
...
 

Но мы можем изменить высоту и ширину без обучения модели и получить лучший результат с большим размером изображения (конечно, вывод занимает больше времени). Я немного сбит с толку. Что происходит с весами, когда мы меняем размер изображения? Например, если первый слой имеет N входов, а второй слой имеет M нейронов, то у нас должны быть (N * M 1) веса, если сеть полностью подключена.
Итак, возникает вопрос: как мы можем изменить N (ширину и высоту) без изменения веса?

Ответ №1:

введите описание изображения здесь

Я также довольно новичок в этой теме, но я думаю, что только Yolov1 использует полностью связанные слои. Взгляните, например, на архитектуру Yolov2. Здесь нет слоев FC, только свертка. Может быть, это и есть ответ?

Комментарии:

1. Спасибо за ответ, полностью подключенный слой был только для примера, я не имею в виду, что у yolo есть слои FC. Если вы измените размер входного изображения с 416 на 320, он распространится на все слои, но нет необходимости изменять . вес файла после изменения размера ввода для вывода.

2. Да, я понимаю вашу точку зрения. Но если есть только слой свертки, разве веса не одинаковы для любого размера ввода? Что может измениться, так это размер карты объектов, поэтому, если у вас есть отклоняющийся размер входных данных для вывода, то результат будет не 13×13, а что-то другое. Imo, удаляющий все слои FC, дает вам сеть, независимую от размера ввода.

3. Дело в том, что в сверточных слоях будет обучено только одно ядро (например, 3 * 3), а затем это ядро может быть применено к любому входному изображению, а поскольку YOLO является полностью сверточной сетью, мы можем передавать изображение любого размера после обучения. Спасибо за ключевое слово: «сеть, не зависящая от размера ввода»