#tensorflow #keras #computer-vision #object-detection
Вопрос:
Мне нужно обучить новую модель(keras tensorflow), и я спрашивал себя, есть ли какая-либо разница между
- Предоставление набора изображений, содержащих только интересующий объект(обрезанный с исходного изображения)
- Предоставление увеличенных изображений с аннотациями объектов(координаты ограничивающей рамки и класса)
Моя логика подсказывает мне, что, скорее всего, внутренне обучение должно проводиться только на обрезанной части, поэтому технически разницы быть не должно. С уважением
Ответ №1:
Два подхода, которые вы описываете, обычно называются классификацией изображений (когда модели необходимо классифицировать только изображение) и обнаружением объектов (когда модели необходимо определить местоположение объекта на изображении и классифицировать его). Иногда просто дифференцируются как «классификация» и «обнаружение». Эти два подхода требуют разных методов, и для каждого подхода были разработаны разные модели. В общем, классификация изображений-это более простая задача, как вы, возможно, интуитивно поняли.
Какой подход использовать, зависит от вашего конечного приложения. Если вам нужно только знать, «существует ли объект на этом изображении», вы можете использовать методы классификации. Если вам нужно знать, «где на этом изображении находится объект» или «сколько этих объектов на изображении», то вам следует использовать методы обнаружения.
Что может показаться неинтуитивным, так это то, что обнаружение объектов-это не просто расширение классификации изображений, поэтому, если вам нужно обнаружение объектов, лучше начать с моделей обнаружения объектов, а не создавать классификатор изображений, который затем вы расширяете до обнаружения объектов. Эта статья дает некоторую интуицию по этой теме.