#python #deep-learning #object-detection #bounding-box
Вопрос:
Я пытаюсь вычислить итерацию по объединению предсказанных ограничивающих прямоугольников с соответствующими им прямоугольниками истинности. Проблема в том, что модель обрезает изображение, чтобы найти объект. ( Я не могу этого изменить ). Итак, теперь у меня есть изображения, размеры которых отличаются от исходных, поэтому координаты предсказанных ограничивающих прямоугольников соответствуют новому размеру изображения. Каков наилучший способ в такой ситуации рассчитать пересечение над объединением с основной истиной ? Я попытался изменить размер предсказанного изображения до исходного размера (и изменить размер предсказанных координат), но некоторые из них слишком малы, чтобы ограничивающая рамка превратилась в линию. ( некоторые ограничительные рамки будут иметь одинаковое значение y для ymin и ymax). Так что же мне делать или как мне действовать дальше ?
Я отредактировал свой вопрос для получения дополнительных разъяснений: ни для исходных изображений, ни для обрезанных изображений не указан фиксированный размер. Каждое исходное изображение содержит таблицы, и модель будет обрезать эти таблицы. Основная истина-это координаты ячеек таблиц на исходном изображении, а предсказанные поля-это координаты ячеек каждой таблицы (на обрезанном изображении). Я выбрал линейную интерполяцию для вычисления прогнозируемых координат ячеек, как на исходном изображении, но поскольку исходное изображение невелико ( например, 594 x 845), вычисленные координаты станут очень маленькими. Например : прогнозируемое поле [696,0,1414,48] после использования линейной интерполяции оно станет [414,0,888,0], поэтому теперь это линия, а не прямоугольник. Изображение, данное моделью в данном случае, имеет размер 1000 x 1048
Комментарии:
1. Пожалуйста, приведите пример проблемного образца, в идеале с изображением исходного изображения и измененного изображения и/или полями предсказания истинности. Кроме того, вся имеющаяся у вас информация о сопоставлении исходного и измененного изображения может быть полезной
2. Ни для исходных изображений, ни для обрезанных изображений не задан фиксированный размер. Каждое исходное изображение содержит таблицы, и модель будет обрезать эти таблицы. Основная истина-это координаты ячеек таблиц на исходном изображении, а предсказанные поля-это координаты ячеек каждой таблицы (на обрезанном изображении). Я выбрал линейную интерполяцию для вычисления прогнозируемых координат ячеек, как на исходном изображении, но из-за того, что исходное изображение небольшое ( например, 598 x 848), вычисленные координаты станут очень маленькими. ]
3. например : прогнозируемое поле [696,0,1414,48] после использования линейной интерполяции оно станет [414,0,888,0], поэтому теперь это линия, а не прямоугольник
4. Какова ваша формула для линейной интерполяции ? Это не должно становиться строкой в вашем примере.
5. Не могли бы вы отредактировать вопрос, чтобы предоставить всю информацию, связанную с вашим неисправным образцом? Например, размер исходного изображения (598×848), размер обрезанного изображения, расположение обрезанного изображения относительно исходного изображения, поле истинности относительно исходного изображения и прогнозируемое поле истинности относительно обрезанного изображения ([696,0,1414,48] ).