#python #image-processing #computer-vision #object-detection #yolo
#питон #обработка изображений #компьютерное зрение #обнаружение объектов #yolo
Вопрос:
Я пытаюсь создать крошечный пользовательский набор данных yolo v4 с помощью Google collab. Я использую labelImg.py для аннотаций к изображениям, которые показаны в https://github.com/tzutalin/labelImg .
Я прокомментировал одно изображение, как показано ниже,
Текстовый файл с аннотированными координатами выглядит следующим образом,
0 0.580859 0.502083 0.303906 0.404167
У меня есть только один класс, который является классом калькулятора. Я хочу использовать это одно изображение для создания еще 4 аннотированных изображений. Я хочу каждый раз поворачивать аннотированное изображение на 45 градусов и создавать новое аннотированное изображение и a.txt файл с координатами. Я видел что-то подобное в roboflow, но я не могу понять, как сделать это вручную с помощью скрипта python. Возможно ли это сделать? Если да, то каким образом?
Ответ №1:
Вы можете ознакомиться с репозиторием и статьей ниже для увеличения данных на основе python, включая поворот, сдвиг, изменение размера, перевод, переворачивание и т. Д.
https://github.com/Paperspace/DataAugmentationForObjectDetection
https://blog.paperspace.com/data-augmentation-for-bounding-boxes/
Если вы используете репозиторий darknet от AlexeyAB для yolov4, то есть некоторые дополнения, которые вы можете использовать для увеличения размера и вариативности обучающих данных.
https://github.com/AlexeyAB/darknet/wiki/CFG-Parameters-in-the-[net]-section
Посмотрите Data augmentation
раздел, в котором вы можете использовать различные определенные дополнения для обнаружения объектов, добавив их в cfg
файл yolo.