#object #deep-learning #computer-vision #object-detection #tracking
#объект #глубокое обучение #компьютерное зрение #обнаружение объектов #отслеживание
Вопрос:
Я хочу сравнить несколько методов многообъектного отслеживания (MOT) в компьютерном зрении в моем собственном наборе данных, поэтому сначала я хочу выбрать наилучшие показатели для этой задачи. Я провел некоторые исследования в научной литературе и пришел к выводу, что существует три основных набора показателей:
- Показатели из «Отслеживание нескольких частично закрытых людей на основе статического обнаружения частей тела»
- ЧЕТКИЕ показатели MOT
- Оценки идентификаторов
Поэтому мне интересно, какой из вышеперечисленных метрик я должен придать наибольшее значение?
И я хотел бы спросить, сталкивался ли кто-нибудь с подобной проблемой и есть ли у него какие-либо мысли на эту тему, которые могли бы оправдать и помочь мне выбрать наилучшие показатели для вышеупомянутой задачи.
Ответ №1:
Вы можете обратиться к метрикам, используемым в задаче MOT.
Вот результаты для MOT 2020 Challenge, и они включают используемые здесь показатели: https://motchallenge.net/results/MOT20 /
Основываясь на документе MOT 20, они сказали в разделе 4.1.7 (стр. 7):
Как мы видели в этом разделе, существует ряд разумных показателей производительности для оценки качества системы отслеживания, что затрудняет сведение оценки к одному единственному числу. Тем не менее, чтобы дать представление о том, как работает каждый трекер по сравнению с конкурентами, мы вычисляем и показываем средний рейтинг для каждого из них, ранжируя все трекеры в соответствии с каждым показателем, а затем усредняя по всем показателям производительности.
Ответ №2:
выбранные вами показатели связаны с вашей целью после отслеживания нескольких объектов, например: если ваши цели интересуют отслеживание людей внутри scence, вы должны переключить идентификатор показателя очень низко и так далее…
вы должны найти показатели, связанные с вашими целями.
Комментарии:
1. Не могли бы вы уточнить, каковы жизнеспособные показатели в MOT в целом и какие использовать в каком сценарии?
2. мое мнение: MOTA, MOTP, переключение идентификаторов, время для каждого кадра
Ответ №3:
Я знаю, что это устарело, но я не вижу, чтобы кто-то упоминал ХОТА (https://arxiv.org/pdf/2009.07736.pdf ). Это стало новым стандартом для многообъектного отслеживания, как можно увидеть здесь: https://arxiv.org/abs/2202.13514 и https://arxiv.org/pdf/2110.06864.pdf
MOTA и IDF1 переоценивают обнаружение и ассоциацию соответственно. HOTA явно измеряет оба типа ошибок и сочетает их сбалансированным образом. HOTA также включает измерение точности локализации результатов отслеживания, чего нет ни в MOTA, ни в IDF1.