YOLO V4 Tiny — Создание большего количества фотографий из одного аннотированного изображения

#python #image-processing #computer-vision #object-detection #yolo

#питон #обработка изображений #компьютерное зрение #обнаружение объектов #yolo

Вопрос:

Я пытаюсь создать крошечный пользовательский набор данных yolo v4 с помощью Google collab. Я использую labelImg.py для аннотаций к изображениям, которые показаны в https://github.com/tzutalin/labelImg .

Я прокомментировал одно изображение, как показано ниже,

Аннотированное изображение

Текстовый файл с аннотированными координатами выглядит следующим образом,

 0 0.580859 0.502083 0.303906 0.404167
 

У меня есть только один класс, который является классом калькулятора. Я хочу использовать это одно изображение для создания еще 4 аннотированных изображений. Я хочу каждый раз поворачивать аннотированное изображение на 45 градусов и создавать новое аннотированное изображение и a.txt файл с координатами. Я видел что-то подобное в roboflow, но я не могу понять, как сделать это вручную с помощью скрипта python. Возможно ли это сделать? Если да, то каким образом?

Ответ №1:

Вы можете ознакомиться с репозиторием и статьей ниже для увеличения данных на основе python, включая поворот, сдвиг, изменение размера, перевод, переворачивание и т. Д.

https://github.com/Paperspace/DataAugmentationForObjectDetection

https://blog.paperspace.com/data-augmentation-for-bounding-boxes/

Если вы используете репозиторий darknet от AlexeyAB для yolov4, то есть некоторые дополнения, которые вы можете использовать для увеличения размера и вариативности обучающих данных.

https://github.com/AlexeyAB/darknet/wiki/CFG-Parameters-in-the-[net]-section

Посмотрите Data augmentation раздел, в котором вы можете использовать различные определенные дополнения для обнаружения объектов, добавив их в cfg файл yolo.