Распознавание изображений с дополнительными данными

#machine-learning #computer-vision #tensorflow #artificial-intelligence #deep-learning

#машинное обучение #компьютерное зрение #тензорный поток #искусственный интеллект #глубокое обучение

Вопрос:

Всем доброе утро, сначала я хотел бы прояснить, что вчера я начал делать свои первые шаги в машинном обучении. Я прочитал большинство основных предметов и посетил несколько презентаций. Я буду участвовать в проекте здесь несколько месяцев, чтобы эта технология была применена. Как новичок я хотел бы задать вопрос, который я считаю глупым, но я не смог найти на нее ответы.

В презентациях и статьях я видел создание классификатора, который может классифицировать изображения или наборы данных, но никогда оба одновременно. Например, набор данных о цветке ириса, который используется в качестве примера. В этом наборе данных у нас есть характеристики цветов, такие как ширина лепестка, но у нас нет его визуального представления. Можно подогнать оба и, например, оценить ширину лепестка определенного изображения?

Я полагаю, что это очень простой вопрос, но я не смог найти что-то подходящее для новичка.

Я был бы очень благодарен.

Ответ №1:

Модели машинного обучения всегда работают с некоторыми абстрактными элементами данных, такими как векторы, точки в многомерных пространствах и т. Д. Для простоты давайте на мгновение предположим, что алгоритмы ML работают с векторами. Поэтому задача классификации заключалась бы в присвоении метки Y вектору X(n).

Теперь с набором данных преобразование значений в строке в вектор относительно просто — ну, вам нужно как-то преобразовать тексты в числа или наоборот, но это стандартная процедура.

С изображениями все по-другому. Теперь вам нужно создать подходящее для ML представление изображения. Другими словами, вам нужно создать функции (например, числовые), описывающие изображение, которые вы можете позже использовать в качестве входных данных для вашего ML.

Примерами таких функций являются: цветовые гистограммы, средняя яркость, количество ребер, различные свертки и т.д. Могут быть более сложные, семантические функции, такие как присутствие человека на картинке. Однако вычислить их намного сложнее.

Итак, подводя итог — вы можете создать классификатор как для изображения, так и для набора данных, но в основном это означает преобразование обоих в набор функций.