Какую информацию содержат пиксели изображения?

#image #image-processing #image-classification

#изображение #обработка изображений #классификация изображений

Вопрос:

Для цветного изображения, скажем, с размерами 320 на 240, у нас есть 76 800 пикселей в изображении. Что представляет каждый пиксель для цветного изображения? Это просто значения RGB для этого пикселя? Как формы и текстуры представлены в пикселях? Если каждый пиксель в цветном изображении содержит только значения RGB, достаточно ли этой информации для сохранения формы, размера и текстуры объектов на изображении?

Комментарии:

1. Это зависит от того, достаточно ли высокое разрешение изображения для представления всех объектов с достаточной точностью. Для небольших объектов, сложных форм или текстур с большим количеством деталей вам может потребоваться больше пикселей в зависимости от того, насколько хорошо вы хотите их представить. Но в целом достаточно большого количества точек с тремя цветами в разной степени, чтобы описать визуальное впечатление от каждого объекта.

Ответ №1:

Один пиксель в пространстве RGB может содержать информацию только о значении цвета этого одного пикселя.

Формы и текстуры могут быть описаны только с помощью комбинации нескольких пикселей, эта информация не хранится в самих отдельных пикселях.

Более того, эта информация (такая же, как для формы, размера, текстуры возможных объектов) никогда не сохраняется явно в данных изображения. Вы можете вывести формы или текстуры на основе вашей интерпретации базовых пиксельных данных, но это всегда зависит от того, как вы сами определяете форму или текстуру.

Комментарии:

1. Итак, насколько я понимаю, только информации о цвете должно быть достаточно для воссоздания исходного изображения с текстурами, формами, размером и т. Д.?

2. @Sid Да, это также большая часть информации, которая хранится в большинстве известных вам форматов изображений (например, JPEG), за исключением некоторой метаинформации в заголовках. Вы можете получить любую другую информацию, такую как формы или текстуры, поскольку она хранится в растровом формате.

Ответ №2:

Каждый пиксель содержит упрощенное представление света, попадающего на соответствующую ячейку датчика в камере. Количество света усредняется по площади ячейки, а спектр света грубо описывается с помощью трех средневзвешенных значений интенсивности по частотам. Результатом является (обычно) три целых числа в диапазоне 0-255, в общей сложности 24 бита информации.

Поскольку пиксели выровнены по сетке, цифровое цветное изображение можно рассматривать как тройную матрицу целых чисел, вот и все. (Ниже приведен пример такой матрицы.) Эта информация является необработанной.

Семантическое содержимое изображения должно быть выведено с помощью системы анализа изображений, которая способна сегментировать изображение в отдельных областях и, в меньшей степени, характеризовать текстуры.

введите описание изображения здесь

Комментарии:

1. Спасибо за ваш ответ, это очень полезно. Просто чтобы продолжить, вы случайно не знаете, что представляет пиксель в цветном 3D-изображении (скажем, в файле .obj или .ply)? Будет ли по-прежнему всего три значения для цветов?

2. @Sid Это то же самое, только базовая сетка 3D вместо 2D. Просто представьте иллюстрацию в виде куба с сеткой вместо плоскости.

3. @Sid: файлы .obj и .ply не являются 3D-изображениями. Это облака точек. Три значения представляют координаты. Может быть связанный цвет или нет.

4. @TA: нет, OP говорит об облаках точек, а не об объемных изображениях.

5. @Sid: абсолютно.