Автоматически ли масштабируются изображения больших размеров (например, 2000 x 2000) до 300 x 300 при использовании их для обучения данных в AWS Sagemaker?

#object-detection #amazon-sagemaker #data-augmentation

#обнаружение объектов #amazon-sagemaker #увеличение данных

Вопрос:

Я работаю над проектом, который обучает модель ML для прогнозирования местоположения Уолдо в Where’s Wally? изображение с использованием AWS Sagemaker, в основе которого лежит алгоритм обнаружения объектов Single Shot Detection, но я думаю, что использование реального изображения головоломки с размерами 2000 x 2000 в качестве обучающих данных невозможно, и этот SSD автоматически изменит размер изображения до 300 x 300, что сделает Waldo бессмысленным размытым. Изменяет ли размер изображений SSD автоматически или он будет обучаться на изображении 2000 x 2000? Следует ли мне обрезать все пазлы до размеров 300 x 300 изображений, содержащих Waldo, или я могу включить сочетание реальных изображений пазлов с размерами 2000 x 2000 и обрезанных изображений 300 x 300?

Я рассматриваю возможность увеличения данных путем обрезки этих увеличенных изображений в местах, содержащих Wally, чтобы у меня могли быть изображения размером 300 x 300, где Wally не превращается в пятно на странице и действительно виден — это хорошая идея? Я думаю, что SSD действительно работает с изображением 2000 x 2000, но частота кадров в секунду значительно снизится — это неправильно? Я чувствую, что если я не буду использовать изображение 2000 x 2000 для обучения, на этапе прогнозирования, когда я начинаю загружать изображения модели с большими размерами (фактические изображения головоломки), модель не сможет точно предсказать местоположения — не так ли?

Ответ №1:

Обнаружение объектов SageMaker изменяет размер изображения на основе входного параметра «image_shape», размер которого вы используете больше 300 x 300. Но 2000 x 2000 могут быть слишком большими для алгоритма, и это также замедлит скорость обучения. Вы можете попробовать использовать размер изображения где-то посередине. Обрезка больших изображений на небольшие участки — хорошая идея для решения этой проблемы. Для вывода размер входного изображения также будет изменен до того же размера, что и параметр обучения «image_shape». Поэтому вы можете захотеть обрезать или изменить размер большого изображения перед отправкой их в конечную точку.