Отсутствующий инструмент в глубоком обучении: дополнение данных геометрическими ориентирами

#tensorflow #image-processing #keras #deep-learning #computer-vision

#tensorflow #обработка изображений #keras #глубокое обучение #компьютерное зрение

Вопрос:

Увеличение данных может быть легко достигнуто с помощью специальных модулей, например, в TensorFlow. Это отлично работает для задач классификации, однако, когда целью сети является предсказание геометрического объекта, например, ориентира, возникает проблема. По мере изменения изображения, например, переворачивания или искажения, соответствующие метки также необходимо адаптировать.

1 — Есть ли какой-либо инструмент для этого? Я уверен, что это распространенная проблема.

2 — Было бы полезно создать сценарий увеличения данных для нейронных сетей, которые предсказывают геометрические объекты?

Я хочу понять, нужно ли мне кодировать все это самостоятельно или мне не хватает чего-то, что уже существует. Если мне нужно это сделать, и это может быть полезно, я бы просто создал вещь с открытым исходным кодом.

Ответ №1:

Вы можете использовать библиотеку imgaug https://github.com/aleju/imgaug

Пример увеличения для ключевых точек с помощью imgaug вы можете найти здесь https://github.com/aleju/imgaug#example-augment-images-and-keypoints

Комментарии:

1. Большое спасибо! Похоже, это то, что я искал. Здорово, что он также работает для ограничивающих рамок и других типов аннотаций. 🙂