#python-3.x #gpu #yolo #darknet
#python-3.x #графический процессор #yolo #darknet
Вопрос:
Я внедряю YOLOv3 и обучил модель на своем пользовательском классе (который является tomato). Я использовал 53 веса модели darknet ( https://pjreddie.com/media/files/darknet53.conv.74 ), чтобы начать мое обучение в соответствии с инструкциями, предоставленными многими сайтами по обучению и обнаружению объектов с использованием YOLOv3. Я подумал, что нет необходимости перечислять шаги.
Ниже показано одно из моих изображений объектов, используемых для обучения (с ограничивающими рамками с использованием LabelImg):
Текстовый файл для приведенного выше изображения для ограничивающих рамок содержит следующие координаты, созданные с помощью labellmg:
0 0.152807 0.696655 0.300640 0.557093
0 0.468728 0.705306 0.341862 0.539792
0 0.819652 0.695213 0.337242 0.543829
0 0.317164 0.271626 0.324449 0.501730
Теперь, когда я использую одно и то же изображение для тестирования, чтобы определить точность обнаружения, оно не может обнаружить все помидоры, и, кроме того, ограничивающие рамки удалены от объектов, как показано ниже:
Я не уверен, что происходит.
Я клонировал git https://github.com/AlexeyAB/darknet и сделал локальную модель и обучил модель пользовательскому объекту. Ничего особенного. Приведенные выше снимки были сделаны с моего телефона. Я обучил даркнет, используя комбинацию загруженных изображений и пользовательских изображений помидоров, которые я сделал со своего телефона. У меня есть 290 изображений для обучения.
Ответ №1:
Возможно, ваша модель не может хорошо обобщать. Возможно, вы слишком много тренируетесь, что может привести к чрезмерной подгонке или даже к тому, что ваш набор данных невелик.
Вы можете попробовать протестировать никогда не виденные данные (новое изображение помидора) и посмотреть, хорошо ли оно работает.
Дважды проверьте свои файлы конфигурации, если там что-то не так, например, вы используете cfg-файл yolov4 в модели yolov3.
И я рекомендую вам прочитать эту статью, которая поможет вам лучше понять, как работают нейронные сети: https://towardsdatascience.com/understand-neural-networks-model-generalization-7baddf1c48ca
Комментарии:
1. спасибо за ваши комментарии. что касается тестирования на никогда не просматриваемых данных, похоже, это работает довольно хорошо, особенно на веб-изображениях. Я не использую yolov4.conf — но спасибо за проверку. Проблема, с которой я столкнулся, связана с изображениями, которые я сделал. Из того, что я думаю (в настоящее время тестирую его — не могу позволить себе графический процессор GCP, поэтому делаю перерыв), снимки, которые я делаю с iphone, похоже, ориентируют изображения с альбомной ориентации на портретную, что заставляет инструмент labelimg все испортить. Если моя догадка верна, я опубликую ответ после его тестирования