Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МИРЭА / Методичка_2010 / Методичка_2010.doc
Скачиваний:
2662
Добавлен:
10.05.2015
Размер:
22.71 Mб
Скачать

Цветовая модель yuv

Остановимся также на цветовом пространстве YUV, которое широко применяется в телевещании и соответственно пришло на компьютер вместе с MPEG-форматом. Дело в том, что глаз человека наиболее чувствителен к яркости изображения и несколько менее – к цветности.

Если аддитивные составляющие RGB-сигнала представить в виде яркости (Y) и двух различных составляющих сигнала цветности (U и V) по следующим формулам:

Y = 0,299 R + 0,587 G + 0,114 B

U = 0,493 (B – Y)

V = 0,877 (R – Y),

то U в таком соотношении выражает различия между синей и желтой составляющими цветного изображения, а V – между красной и зеленой компонентами цветного изображения. Известно, что глаз человека легче различает градации яркости и оттенки зеленого, поэтому U и V можно отображать с меньшей точностью, что способно существенно уменьшить количество информации, сохраняемой при сжатии. Таким образом, используя особенности человеческого зрения, еще до того, как будет применяться компрессия данных, мы можем получить выигрыш только за счет перехода к другому цветовому пространству. Поэтому, когда говорят, например, что сжатие в MPEG осуществляется с коэффициентом 100:1 и более, часто забывают, что часть информации была «потеряна» уже при переходе к другому цветовому пространству.

Формат кодирования YUV 4:1:1 отличается от 4:2:2 способом дискретизации сигнала, которая вычисляется для конкретного канала как произведение базовой частоты цифрового кодирования на соответствующий коэффициент: например на 4 отсчета для канала Y берется по одному отсчету для каждого из цветоразностных каналов.

Цветовая сегментация изображения

Цветовая сегментация обычно производится по предварительно построенной модели распределения цвета искомого объекта в цветовом пространстве HSV. Рассмотрим работу процедуры подобного рода на примере задачи сегментации на изображении лица человека на основе цветовых характеристик человеческой кожи.

Построение модели рассматривается как задача поиска группы кластеров, соответствующих оттенкам кожи. Структура и параметры модели формируются путем обработки изображений участков кожи, выделенных вручную. Распределение, отражающее соотношение параметров цвета HиS, получено в данном примере в результате обработки порядка 900 изображений фрагментов кожи размерами 33 пикселя (рис. 3.1.6).

@Рис. 3.1.6. Взаимное соотношение компонент HиSна изображениях кожи

Аналогичным образом получено распределение, отражающее соотношение параметров цвета HиV(рис. 3.1.7).

@Рис. 3.1.7. Взаимное соотношение компонент HиVна изображениях кожи

Как видно, «трубки» распределений (H,S) и (H,V), характеризующие оттенки кожи, являются достаточно компактными в цветовом пространстве и составляют группу первичных признаков на этапе построения модели. «Трубки» распределений (H,S) и (H,V) могут быть разделены на подобласти, образующие группыкластеров(компактных множеств точек). На этапе сегментации каждому пикселю изображения ставится в соответствие вектор параметров цвета (H,S,V) и проверяется принадлежность параметров цвета к одному из кластеров модели кожи. Область изображения кожи формируется из пикселей, параметры которых вошли в один из кластеров. На рис. 3.1.8 – 3.1.10 приведены результаты работы алгоритма цветовой пиксельной сегментации лиц с различными оттенками кожи.

@Рис. 3.1.8. Пример цветовой пиксельной сегментации кожи

@Рис. 3.1.9. Пример цветовой пиксельной сегментации кожи

@Рис. 3.1.10. Пример цветовой пиксельной сегментации кожи

После того, как на изображении выделены пиксели, цвет которых соответствует оттенкам кожи, производится слияние выделенных пикселей в систему кластеров по мере близости их местоположения. Далее производится комплексная проверка кластеров для выявления кластеров, действительно являющихся лицами. Правило, которому должен отвечать фрагмент изображения, на котором присутствует лицо, достаточно очевидно: лицо обычно должно быть симметрично относительно вертикальной оси. На рис. 3.1.11. показан пример работы алгоритма обнаружения лиц на цветных изображениях. Фрагменты изображения с обнаруженными лицами выделены рамкой.

@Рис. 3.1.11. Пример работы алгоритма обнаружения лиц

1.2. Гистограмма и гистограммная обработка. Бинаризация и сегментация.Нормализация, Эквализация. Гистограммная сегментация. Бинаризация. Метод Отсу. Профили и проекции

БИНАРНОЕ ИЗОБРАЖЕНИЕ. ЗАДАЧА ВЫДЕЛЕНИЯ СВЯЗНЫХ ОБЛАСТЕЙ. МЕТОД "ЛЕСНОГО ПОЖАРА". ДВУХПРОХОДНЫЙ АЛГОРИТМ ВЫДЕЛЕНИЯ СВЯЗНЫХ ОБЛАСТЕЙ. АЛГОРИТМ ОБХОДА КОНТУРА.

Несмотря на все возможное богатство семантического, физического и любого другого содержания изображения, само это содержание определяется в конце концов только лишь распределением интенсивности некоторого сигнала по двумерной дискретной плоскости (или набором таких распределений, если изображение имеет несколько таких «цветовых», «диапазонных», «признаковых» или других плоскостей»). При этом каждый пиксель исходного цифрового изображения характеризуется тремя, вообще говоря, независимыми величинами – {x, у,I}, где пара целочисленных значений (x, у) описываетгеометрическое положениеданного пикселя в плоскости изображения, а величинаIхарактеризует егояркостьилиинтенсивностьв данной точке плоскости. В соответствии с этим, принято различать в изображении егояркостнуюигеометрическуюсоставляющие.

Эти составляющие в принципе могут изменяться независимо друг от друга. Допустим, мы на протяжении некоторого времени наблюдаем через окно какую-нибудь статическую внешнюю сцену при неизменных условиях освещенности, а затем условия освещенности неожиданно меняются. Cкажем, солнце зашло за тучу или, наоборот, вышло из-за облака. При этом мы увидим, что, хотяяркость(среднее значение интенсивности сигнала) иконтрастизображения (размах значений между минимальной и максимальной наблюдаемой яркостью) изменились, геометрическаяформаизображения (то есть положение видимых контуров объектов и областей различной яркости) – осталась неизменной. Возможна и обратная ситуация, когда яркостные характеристики изображения в среднем не меняются, несмотря на то, что явно наблюдаются изменения формы – например, движение каких-либо частей изображения относительно остальных его частей. Отсюда вытекает идее возможногораздельного анализа яркости и геометрии изображения. Такое разделение не только облегчает разработчику логический анализ задачи, но и понижает «порядок» изображения как предмета обработки с третьего ({x, у,I}) до второго ({x, у}) и первого ({I}) соответственно, что, в свою очередь, позволяет экономить время вычислений и требуемый для решения задачи объем памяти.

Особенную привлекательность этой идее на ранних этапах развития обработки изображений придавало то, что анализ двумерных полей был сравнительно новой и неизведанной задачей, в то время как в области обработки одномерных функций и сигналов у математиков и специалистов в других областях знания был уже накоплен значительный опыт. Следовательно, выделив из изображения какой-либо характеризующий его одномерный сигнал, можно было применить для его обработки и анализа большое количество уже существующих готовых инструментов. Кроме того, как уже говорилось, обработка одномерных сигналов требует существенно меньшей затраты вычислительных ресурсов, что было крайне важно в те времена, когда вычислительная техника еще не была так мощна и совершенна, как сегодня. Да и сегодня актуальность экономии вычислительных ресурсов сохраняется во всех тех задачах, которые должны решаться системами машинного зрения в реальном масштабе времени.

Итак, яркостная составляющая изображения действительно характеризуется одномерным массивом гистограммы(частоты встречаемости на изображениях пикселей одинаковой яркости). Однако геометрические характеристики изображения ({x, у}) по-прежнему требуют для своего описания двумерных данных. Естественно предположить, что первые исследователи изображений старались и в этой области найти такие характеристики, которые описывали бы двумерную геометрию изображения при помощи некоторых одномерных массивов. И такие полезные способы описания действительно были найдены. Это так называемые «профили» и «проекции» изображения. Профилем изображения вдоль некоторой линии называется функция интенсивности изображения, распределенного вдоль данной линии (прорезки).Проекциейизображения на некоторую ось (направление) называется интеграл (сумма) интенсивности пикселей изображения, взятый в направлении, перпендикулярном данной оси.

Итак, в данной главе мы будем рассматривать основные способы обработки и анализа изображений путем сведения двумерных задач к одномерным: построение и анализ гистограмм, гистограммную обработку изображений, а также построение и использование профилей и проекций изображения.

Еще одно предварительное замечание, прежде чем мы начнем непосредственно разбираться с различными видами и способами обработки и анализа изображений. Любая информация об изображении (а также и любая процедура его обработки) может носить глобальныйилилокальныйхарактер. Глобальнойсчитается информация или обработка, относящаяся ко всему изображению в целом.Локальнойсчитается информация (или обработка), относящаяся (применяемая) к некоторой его выделенной области (фрагменту изображения, некоторой линии, определенному множеству точек и т.д. и т.п.). Соответственно, необходимо помнить, что и гистограммы, и профили, и проекции, рассматриваемые ниже, могут относиться как к изображению в целом, так и к определенным его локальным областям.