
- •«Обработка изображений и распознавание образов» Визильтер Юрий Валентинович Методическое пособие-2010
- •Раздел 2. Распознавание образов. 165
- •1.1. Задачи и приложения машинного зрения. Примеры практических приложений.
- •Уровни и методы машинного зрения
- •Растровое изображение Изображение как двумерный массив данных
- •Алгебраические операции над изображениями
- •Физическая природа изображений
- •Изображения различных диапазонов длин волн
- •Изображения различной физической природы
- •Тип пикселя
- •Возможности и особенности системыPisoft
- •Базовые средства просмотра и анализа изображений и видеопоследовательностей
- •Алгебра изображений
- •Геометрические преобразования изображений
- •Устройства оцифровки и ввода изображений
- •Линейки и матрицы, сканеры и камеры
- •Геометрия изображения
- •Цифровые и аналоговые устройства
- •Пространственное разрешение
- •Программное обеспечение
- •Обработка цветных изображений
- •Цветовая модельRgb
- •Цветовая модель hsv
- •Цветовая модель yuv
- •Цветовая сегментация изображения
- •Гистограмма и гистограммная обработка изображений
- •Профиль вдоль линии и анализ профиля
- •Проекция и анализ проекции
- •Бинаризация полутоновых изображений
- •Сегментация многомодальных изображений
- •Выделение и описание областей
- •Выделение связных областей на бинарных изображениях
- •1. Отслеживающие алгоритмы на примере алгоритма обхода контура.
- •2. Сканируюющие алгоритмы.
- •1.3. Фильтрация. Выделение объектов при помощи фильтров
- •Оконная фильтрация изображений в пространственной области
- •Фильтрация бинарных изображений Модель шума «соль и перец»
- •Структура оконного фильтра
- •Логическая фильтрация помех
- •Бинарная медианная фильтрация
- •Бинарная ранговая фильтрация
- •Взвешенные ранговые фильтры
- •Анизотропная фильтрация
- •Расширение-сжатие (простая морфология)
- •Стирание бахромы
- •Нелинейная фильтрация полутоновых изображений
- •Ранговая оконная фильтрация
- •Минимаксная фильтрация
- •Задача выделения объектов интереса
- •Бинарные фильтры для выделения объектов
- •Метод нормализации фона
- •Скользящее среднее в окне
- •Гауссовская фильтрация
- •Преобразование Фурье. Линейная фильтрация в частотной области
- •Преобразование Фурье
- •Комплексное представление преобразования Фурье
- •Быстрое преобразование Фурье
- •Двумерное преобразование Фурье
- •Свертка с использованием преобразования Фурье
- •Фильтрация изображений в частотной области
- •Вейвлет-анализ
- •Пирамида изображений
- •Вейвлет-преобразование
- •Операторы вычисления производных
- •Операторы вычисления векторов градиентов
- •Операторы Марра и Лапласа
- •Постобработка контурного изображения Локализация края
- •Утончение контура
- •Сегментация полутоновых изображений
- •Пороговая и мультипороговая сегментация
- •Методы слияния, разбиения и слияния/разбиения областей
- •Способы описания выделенных областей
- •Текстурные признаки
- •1.6.Морфологические методы анализа сцен (по ю.П. Пытьеву) Методы обнаружения объектов, заданных эталонами
- •Согласованная фильтрация.
- •Корреляционное обнаружение.
- •Морфологический подход ю.П. Пытьева.
- •Форма изображения как инвариант преобразований изображений, отвечающих вариациям условий регистрации
- •Сравнение изображений по форме
- •Выделение отличий изображений по форме
- •Обнаружение объекта по его изображению и оценка его координат
- •*Морфология на базе кусочно-линейной интерполяции
- •Преобразование Хафа для поиска прямых
- •*Различные способы параметризации прямых
- •Преобразование Хафа для поиска окружностей
- •Анализ аккумулятора при поиске геометрических примитивов
- •Обобщенное преобразование Хафа
- •*Специализированная процедура голосования для поиска эллипсов
- •*Рекуррентное преобразование Хафа в скользящем окне
- •1.8.Математическая морфология (по ж. Серра)
- •Морфологические операции на бинарных изображениях
- •Морфологические операции на полутоновых изображениях
- •Морфологическое выделение «черт» и объектов
- •Морфологический спектр
- •Морфологические скелеты. Непрерывная бинарная морфология Непрерывная бинарная морфология
- •Непрерывное гранично-скелетное представление изображения
- •Обработка и использование скелета
- •*Обобщенные скелетные представления бинарных фигур
- •Алгоритмы утончения дискретного бинарного изображения
- •*Регуляризация скелетов
- •Типы нерегулярностей скелета
- •Устранение нерегулярностей
- •Регуляризация скелета по Тихонову
- •*Селективные морфологии
- •1.9. Анализ движения. Выделение движущихся объектов. Разность кадров. Вычитание фона. Анализ оптических потоков. Слежение за движущимися объектами. Корреляционное слежение.
- •Обучение с учителем. Детерминированные методы, основанные на «близости». Линейные решающие правила. Метод построения эталонов. Метод ближайшего соседа. Методkближайших соседей.
- •Линейные решающие правила
- •Метод построения эталонов
- •Методы ближайших соседей
- •Параметрические и непараметрические методы
- •Дискриминантные и моделирующие методы обучения
- •Способность распознавателя к обобщению. Регуляризация.
- •Байесовская теория решений. Случай двух классов. Классификаторы, разделяющие функции и поверхности решений. Вероятности ошибок. Разделяющие функции для случая нормальной плотности.
- •Дискриминантный анализ. Линейный дискриминант Фишера. Персептронная функция критерия. Линейный дискриминантный анализ (lda,дискриминант Фишера)
- •Персептрон Розенблатта
- •Анализ свидетельств
- •Байесовское объединение свидетельств
- •Структурное распознавание
- •Автоматизированное конструирование алгоритмов обнаружения объектов на основе преобразований модельных описаний объектов.
- •Нейросетевое распознавание
- •Нейронные сети ассоциативной памяти. Сети Хопфилда.
- •Многослойные персептроны. Оптимизационное обучение. Метод обратного распространения ошибки.
- •Многослойные персептроны. Правило Хебба.
- •*Связь с байесовским распознаванием
- •Сети встречного распространения. Самоорганизующиеся сети.
Цветовая модель yuv
Остановимся также на цветовом пространстве YUV, которое широко применяется в телевещании и соответственно пришло на компьютер вместе с MPEG-форматом. Дело в том, что глаз человека наиболее чувствителен к яркости изображения и несколько менее – к цветности.
Если аддитивные составляющие RGB-сигнала представить в виде яркости (Y) и двух различных составляющих сигнала цветности (U и V) по следующим формулам:
Y = 0,299 R + 0,587 G + 0,114 B
U = 0,493 (B – Y)
V = 0,877 (R – Y),
то U в таком соотношении выражает различия между синей и желтой составляющими цветного изображения, а V – между красной и зеленой компонентами цветного изображения. Известно, что глаз человека легче различает градации яркости и оттенки зеленого, поэтому U и V можно отображать с меньшей точностью, что способно существенно уменьшить количество информации, сохраняемой при сжатии. Таким образом, используя особенности человеческого зрения, еще до того, как будет применяться компрессия данных, мы можем получить выигрыш только за счет перехода к другому цветовому пространству. Поэтому, когда говорят, например, что сжатие в MPEG осуществляется с коэффициентом 100:1 и более, часто забывают, что часть информации была «потеряна» уже при переходе к другому цветовому пространству.
Формат кодирования YUV 4:1:1 отличается от 4:2:2 способом дискретизации сигнала, которая вычисляется для конкретного канала как произведение базовой частоты цифрового кодирования на соответствующий коэффициент: например на 4 отсчета для канала Y берется по одному отсчету для каждого из цветоразностных каналов.
Цветовая сегментация изображения
Цветовая сегментация обычно производится по предварительно построенной модели распределения цвета искомого объекта в цветовом пространстве HSV. Рассмотрим работу процедуры подобного рода на примере задачи сегментации на изображении лица человека на основе цветовых характеристик человеческой кожи.
Построение модели рассматривается как задача поиска группы кластеров, соответствующих оттенкам кожи. Структура и параметры модели формируются путем обработки изображений участков кожи, выделенных вручную. Распределение, отражающее соотношение параметров цвета HиS, получено в данном примере в результате обработки порядка 900 изображений фрагментов кожи размерами 33 пикселя (рис. 3.1.6).
@Рис. 3.1.6. Взаимное соотношение компонент HиSна изображениях кожи
Аналогичным образом получено распределение, отражающее соотношение параметров цвета HиV(рис. 3.1.7).
@Рис. 3.1.7. Взаимное соотношение компонент HиVна изображениях кожи
Как видно, «трубки» распределений (H,S) и (H,V), характеризующие оттенки кожи, являются достаточно компактными в цветовом пространстве и составляют группу первичных признаков на этапе построения модели. «Трубки» распределений (H,S) и (H,V) могут быть разделены на подобласти, образующие группыкластеров(компактных множеств точек). На этапе сегментации каждому пикселю изображения ставится в соответствие вектор параметров цвета (H,S,V) и проверяется принадлежность параметров цвета к одному из кластеров модели кожи. Область изображения кожи формируется из пикселей, параметры которых вошли в один из кластеров. На рис. 3.1.8 – 3.1.10 приведены результаты работы алгоритма цветовой пиксельной сегментации лиц с различными оттенками кожи.
@Рис. 3.1.8. Пример цветовой пиксельной сегментации кожи
@Рис. 3.1.9. Пример цветовой пиксельной сегментации кожи
@Рис. 3.1.10. Пример цветовой пиксельной сегментации кожи
После того, как на изображении выделены пиксели, цвет которых соответствует оттенкам кожи, производится слияние выделенных пикселей в систему кластеров по мере близости их местоположения. Далее производится комплексная проверка кластеров для выявления кластеров, действительно являющихся лицами. Правило, которому должен отвечать фрагмент изображения, на котором присутствует лицо, достаточно очевидно: лицо обычно должно быть симметрично относительно вертикальной оси. На рис. 3.1.11. показан пример работы алгоритма обнаружения лиц на цветных изображениях. Фрагменты изображения с обнаруженными лицами выделены рамкой.
@Рис. 3.1.11. Пример работы алгоритма обнаружения лиц
1.2. Гистограмма и гистограммная обработка. Бинаризация и сегментация.Нормализация, Эквализация. Гистограммная сегментация. Бинаризация. Метод Отсу. Профили и проекции
БИНАРНОЕ ИЗОБРАЖЕНИЕ. ЗАДАЧА ВЫДЕЛЕНИЯ СВЯЗНЫХ ОБЛАСТЕЙ. МЕТОД "ЛЕСНОГО ПОЖАРА". ДВУХПРОХОДНЫЙ АЛГОРИТМ ВЫДЕЛЕНИЯ СВЯЗНЫХ ОБЛАСТЕЙ. АЛГОРИТМ ОБХОДА КОНТУРА.
Несмотря на все возможное богатство семантического, физического и любого другого содержания изображения, само это содержание определяется в конце концов только лишь распределением интенсивности некоторого сигнала по двумерной дискретной плоскости (или набором таких распределений, если изображение имеет несколько таких «цветовых», «диапазонных», «признаковых» или других плоскостей»). При этом каждый пиксель исходного цифрового изображения характеризуется тремя, вообще говоря, независимыми величинами – {x, у,I}, где пара целочисленных значений (x, у) описываетгеометрическое положениеданного пикселя в плоскости изображения, а величинаIхарактеризует егояркостьилиинтенсивностьв данной точке плоскости. В соответствии с этим, принято различать в изображении егояркостнуюигеометрическуюсоставляющие.
Эти составляющие в принципе могут изменяться независимо друг от друга. Допустим, мы на протяжении некоторого времени наблюдаем через окно какую-нибудь статическую внешнюю сцену при неизменных условиях освещенности, а затем условия освещенности неожиданно меняются. Cкажем, солнце зашло за тучу или, наоборот, вышло из-за облака. При этом мы увидим, что, хотяяркость(среднее значение интенсивности сигнала) иконтрастизображения (размах значений между минимальной и максимальной наблюдаемой яркостью) изменились, геометрическаяформаизображения (то есть положение видимых контуров объектов и областей различной яркости) – осталась неизменной. Возможна и обратная ситуация, когда яркостные характеристики изображения в среднем не меняются, несмотря на то, что явно наблюдаются изменения формы – например, движение каких-либо частей изображения относительно остальных его частей. Отсюда вытекает идее возможногораздельного анализа яркости и геометрии изображения. Такое разделение не только облегчает разработчику логический анализ задачи, но и понижает «порядок» изображения как предмета обработки с третьего ({x, у,I}) до второго ({x, у}) и первого ({I}) соответственно, что, в свою очередь, позволяет экономить время вычислений и требуемый для решения задачи объем памяти.
Особенную привлекательность этой идее на ранних этапах развития обработки изображений придавало то, что анализ двумерных полей был сравнительно новой и неизведанной задачей, в то время как в области обработки одномерных функций и сигналов у математиков и специалистов в других областях знания был уже накоплен значительный опыт. Следовательно, выделив из изображения какой-либо характеризующий его одномерный сигнал, можно было применить для его обработки и анализа большое количество уже существующих готовых инструментов. Кроме того, как уже говорилось, обработка одномерных сигналов требует существенно меньшей затраты вычислительных ресурсов, что было крайне важно в те времена, когда вычислительная техника еще не была так мощна и совершенна, как сегодня. Да и сегодня актуальность экономии вычислительных ресурсов сохраняется во всех тех задачах, которые должны решаться системами машинного зрения в реальном масштабе времени.
Итак, яркостная составляющая изображения действительно характеризуется одномерным массивом гистограммы(частоты встречаемости на изображениях пикселей одинаковой яркости). Однако геометрические характеристики изображения ({x, у}) по-прежнему требуют для своего описания двумерных данных. Естественно предположить, что первые исследователи изображений старались и в этой области найти такие характеристики, которые описывали бы двумерную геометрию изображения при помощи некоторых одномерных массивов. И такие полезные способы описания действительно были найдены. Это так называемые «профили» и «проекции» изображения. Профилем изображения вдоль некоторой линии называется функция интенсивности изображения, распределенного вдоль данной линии (прорезки).Проекциейизображения на некоторую ось (направление) называется интеграл (сумма) интенсивности пикселей изображения, взятый в направлении, перпендикулярном данной оси.
Итак, в данной главе мы будем рассматривать основные способы обработки и анализа изображений путем сведения двумерных задач к одномерным: построение и анализ гистограмм, гистограммную обработку изображений, а также построение и использование профилей и проекций изображения.
Еще одно предварительное замечание, прежде чем мы начнем непосредственно разбираться с различными видами и способами обработки и анализа изображений. Любая информация об изображении (а также и любая процедура его обработки) может носить глобальныйилилокальныйхарактер. Глобальнойсчитается информация или обработка, относящаяся ко всему изображению в целом.Локальнойсчитается информация (или обработка), относящаяся (применяемая) к некоторой его выделенной области (фрагменту изображения, некоторой линии, определенному множеству точек и т.д. и т.п.). Соответственно, необходимо помнить, что и гистограммы, и профили, и проекции, рассматриваемые ниже, могут относиться как к изображению в целом, так и к определенным его локальным областям.