Обучаю ли я модель классификации изображений с помощью бинарной классификации или модели обнаружения объектов?

#object-detection #image-classification

Вопрос:

Я хочу обучить модель изображения, которая определяет, содержит ли изображение цветок или нет.

Кажется логичным обучить бинарную классификационную модель изображениям, содержащим цветы, и другим, которые этого не делают. Однако я понял, что последнее требует так много разных изображений, и оно просто не может охватывать изображения любого типа (которые не содержат цветка). Кажется, что для сбора данных требуется много усилий.

С другой стороны, я могу просто создать предварительно подготовленную модель обнаружения объектов, используя, например, yolo, в одном классе с заданными координатами цветов для каждого изображения. И во время вывода я могу просто определить, есть ли какие-либо цветы, обнаруженные на изображении, следовательно, назначить изображение, содержащее цветок, или без цветка. Таким образом, я могу сэкономить больше времени на сборе данных, хотя модель более сложная.

Может ли кто-нибудь посоветовать, правильно ли я это делаю, используя последний вариант?

Спасибо.