
- •«Обработка изображений и распознавание образов» Визильтер Юрий Валентинович Методическое пособие-2010
- •Раздел 2. Распознавание образов. 184
- •Уровни и методы машинного зрения
- •Растровое изображение Изображение как двумерный массив данных
- •Алгебраические операции над изображениями
- •Физическая природа изображений
- •Изображения различных диапазонов длин волн
- •Изображения различной физической природы
- •Тип пикселя
- •Возможности и особенности системы Pisoft
- •Базовые средства просмотра и анализа изображений и видеопоследовательностей
- •Алгебра изображений
- •Геометрические преобразования изображений
- •Устройства оцифровки и ввода изображений
- •Линейки и матрицы, сканеры и камеры
- •Геометрия изображения
- •Цифровые и аналоговые устройства
- •Пространственное разрешение
- •Программное обеспечение
- •Обработка цветных изображений
- •Цветовая модель rgb
- •Цветовая модель hsv
- •Цветовая модель yuv
- •Цветовая сегментация изображения
- •Гистограмма и гистограммная обработка изображений
- •Профиль вдоль линии и анализ профиля
- •Проекция и анализ проекции
- •Бинаризация полутоновых изображений
- •Сегментация многомодальных изображений
- •Выделение и описание областей
- •Выделение связных областей на бинарных изображениях
- •1. Отслеживающие алгоритмы на примере алгоритма обхода контура.
- •2. Сканируюющие алгоритмы.
- •Оконная фильтрация изображений в пространственной области
- •Фильтрация бинарных изображений Модель шума «соль и перец»
- •Структура оконного фильтра
- •Логическая фильтрация помех
- •Бинарная медианная фильтрация
- •Бинарная ранговая фильтрация
- •Взвешенные ранговые фильтры
- •Анизотропная фильтрация
- •Расширение-сжатие (простая морфология)
- •Стирание бахромы
- •Нелинейная фильтрация полутоновых изображений
- •Ранговая оконная фильтрация
- •Минимаксная фильтрация
- •Задача выделения объектов интереса
- •Бинарные фильтры для выделения объектов
- •Метод нормализации фона
- •Скользящее среднее в окне
- •Гауссовская фильтрация
- •Преобразование Фурье. Линейная фильтрация в частотной области
- •Преобразование Фурье
- •Комплексное представление преобразования Фурье
- •Быстрое преобразование Фурье
- •Двумерное преобразование Фурье
- •Свертка с использованием преобразования Фурье
- •Фильтрация изображений в частотной области
- •Вейвлет-анализ
- •Пирамида изображений
- •Вейвлет-преобразование
- •Операторы вычисления производных
- •Операторы вычисления векторов градиентов
- •Операторы Марра и Лапласа
- •Постобработка контурного изображения Локализация края
- •Утончение контура
- •Сегментация полутоновых изображений
- •Пороговая и мультипороговая сегментация
- •Методы слияния, разбиения и слияния/разбиения областей
- •Способы описания выделенных областей
- •Текстурные признаки
- •1.6. Морфологические методы анализа сцен (по ю.П. Пытьеву) Методы обнаружения объектов, заданных эталонами
- •Согласованная фильтрация.
- •Корреляционное обнаружение.
- •Морфологический подход ю.П. Пытьева.
- •Форма изображения как инвариант преобразований изображений, отвечающих вариациям условий регистрации
- •Сравнение изображений по форме
- •Выделение отличий изображений по форме
- •Обнаружение объекта по его изображению и оценка его координат
- •*Морфология на базе кусочно-линейной интерполяции
- •Преобразование Хафа для поиска прямых
- •*Различные способы параметризации прямых
- •Преобразование Хафа для поиска окружностей
- •Анализ аккумулятора при поиске геометрических примитивов
- •Обобщенное преобразование Хафа
- •*Специализированная процедура голосования для поиска эллипсов
- •*Рекуррентное преобразование Хафа в скользящем окне
- •1.8. Математическая морфология (по ж. Серра)
- •Морфологические операции на бинарных изображениях
- •Морфологические операции на полутоновых изображениях
- •Морфологическое выделение «черт» и объектов
- •Морфологический спектр
- •Морфологические скелеты. Непрерывная бинарная морфология Непрерывная бинарная морфология
- •Непрерывное гранично-скелетное представление изображения
- •Обработка и использование скелета
- •*Обобщенные скелетные представления бинарных фигур
- •Алгоритмы утончения дискретного бинарного изображения
- •*Регуляризация скелетов
- •Типы нерегулярностей скелета
- •Устранение нерегулярностей
- •Регуляризация скелета по Тихонову
- •*Селективные морфологии
- •Метод оптических потоков
- •Дифференциальный подход
- •Корреляционный подход
- •Частотный подход
- •Корреляционное слежение.
- •Форматы хранения и передачи цифровых изображений
- •Методы сжатия цифровых изображений
- •Формат bmp
- •Формат pcx
- •Формат gif
- •Формат tiff
- •Формат jpeg
- •Форматы хранения и передачи цифровых видеопоследовательностей
- •Формат avi
- •Формат mpeg
- •Форматы mpeg 1 и mpeg 2
- •Формат mpeg 4
- •Форматы mpeg 7
- •Раздел 2. Распознавание образов.
- •Обучение с учителем. Детерминированные методы, основанные на «близости». Линейные решающие правила. Метод построения эталонов. Метод ближайшего соседа. Метод k ближайших соседей.
- •Линейные решающие правила
- •Метод построения эталонов
- •Методы ближайших соседей
- •Параметрические и непараметрические методы
- •Дискриминантные и моделирующие методы обучения
- •Способность распознавателя к обобщению. Регуляризация.
- •Байесовская теория решений. Случай двух классов. Классификаторы, разделяющие функции и поверхности решений. Вероятности ошибок. Разделяющие функции для случая нормальной плотности.
- •Дискриминантный анализ. Линейный дискриминант Фишера. Персептронная функция критерия. Линейный дискриминантный анализ (lda, дискриминант Фишера)
- •Персептрон Розенблатта
- •Байесовское объединение свидетельств
- •Структурное распознавание
- •Автоматизированное конструирование алгоритмов обнаружения объектов на основе преобразований модельных описаний объектов.
- •Нейросетевое распознавание
- •Нейронные сети ассоциативной памяти. Сети Хопфилда.
- •Многослойные персептроны. Оптимизационное обучение. Метод обратного распространения ошибки.
- •Многослойные персептроны. Правило Хебба.
- •*Связь с байесовским распознаванием
- •Сети встречного распространения. Самоорганизующиеся сети.
Бинаризация полутоновых изображений
В обработке изображений часто используется процедура «пороговой бинаризации» – разбиение изображения на две области, одна из которых содержит все пиксели со значением ниже некоторого порога, а другая содержит все пиксели со значением выше этого порога.
Алгоритмы адаптивной бинаризации изображений базируются на использовании локальной или глобальной гистограммы изображения [20]. Подход, основанный на использовании гистограммы яркостей пикселей, является одним из самых известных и, безусловно, наиболее простым.
Оптимальная пороговая сегментация основана на приближении гистограммы изображения к некоторой кривой, используя весовые суммы двух или более вероятностей интенсивности с нормальным распределением. Тогда порог – это набор ближайших уровней яркости, соответствующих минимуму вероятности между максимумами двух или более нормальных распределений.
@Рис.
3.1.1. Уровни яркости гистограммы
аппроксимируются двумя нормальными
распределениями. (а) Функции распределения
объекта и фона. (б) Соответствующие
гистограммы и оптимальный порог
Для определения оптимального порога бинаризации предложено большое количество различных подходов. Наиболее удачным из них представляется подход Otsu [230], который предполагает не только определение оптимального порога бинаризации, но и вычисление некоторого критерия бимодальности, то есть оценку того, действительно ли исследуемая гистограмма содержит именно две моды (два выраженных пика). Идея данного подхода заключается в следующем.
Пусть изображение представляет собой двумерный массив IM размера XY, причем его элементы (пиксели) принимают значения на отрезке [0..255]. Тогда гистограмма этого изображения представляет собой одномерный массив Hist[0..255], в каждой ячейке которого Hist[i] содержится число пикселей изображения, имеющих значение, равное i. Рассмотрим теперь «подгистограмму» Hist[k...l], 0k, l255. Для любой такой подгистограммы (окна) [k,l] можно вычислить оценку математического ожидания яркости пикселей MO(k,l) и оценку дисперсии DISP(k,l). Пусть дан порог t: 0t255.
Тогда для данного порога t можно вычислить «критерий разделимости» SC вида
SC(t) = 1 – (DISP(0,t) + DISP(t+1,255)) / DISP(0,255) (3.1.1)
Критерий SC(t) всегда принимает значение на отрезке [0,1], причем значение его тем больше, чем лучше разделимость яркостного распределения на два класса относительно порога t. Алгоритм Отсу предполагает вычисление SC(t) для всех t[0..255], после чего оптимальный порог Отсу определяется как
T = argmax SC(t), t[0..255] (3.1.2).
Этот алгоритм имеет ясный статистический смысл и, как показывает практика, является эффективным и устойчивым способом определения адаптивного порога для бинаризации бимодальных изображений.
Сегментация многомодальных изображений
Специально разработанный для данного класса задач, метод статистического выделения мод позволяет оценивать количество и степень выраженности мод гистограммы, опираясь на соответствующий график статистической производной (функции локальной разделимости), представляющий собой график значений критерия Отсу, вычисляемых в локальном скользящем окне, согласованном по ширине с ожидаемой шириной моды гистограммы (рис. 3.1.2).
@Рис. 3.1.2. Пример автоматического разделения мод на гистограмме по максимумам функции локальной разделимости
Другой способ автоматического выделения мод гистограммы основывается на непосредственной оптимизации глобального критерия разделимости на n>1 мод, подобного критерию бимодальной разделимости Отсу. Введем (n+1)-мерный вектор t=(t0,..tn), где t0=0, tn=255, t1,..tn-1 - свободные переменные, соответствующие порогам, разделяющим моды гистограммы. Тогда среднеквадратичный критерий оптимального выбора порогов сегментации будет иметь следующий вид:
i=0,..,n DISP(ti, ti+1) min(t1,..tn-1).
Поскольку гистограмма – одномерный массив, эта задача однозначно решается методом динамического программирования [5]. В результате определяется такой набор порогов сегментации, который обеспечивает минимальное среднеквадратичное отклонение сегментированного на n уровней изображения от исходного.
На рис. 3.1.3. приводится пример автоматической гистограммной сегментации изображения при автоматическом оптимальном выделении набора порогов при заданном оптимальном числе мод гистограммы.
Если число мод гистограммы заранее неизвестно, то задача гистограммной сегментации является, вообще говоря, некорректной по Адамару и требует регуляризации [42]. В качестве регуляризованного критерия можно применить, например, следующий критерий, одновременно штрафующий и суммарное среднеквадратичное отклонение сегментированного изображения от исходного, и число выделяемых при сегментации мод:
i=0,..,n DISP(ti, ti+1) + n min(n,t1,..tn-1).
При фиксированном значении регуляризирующего параметра соответствующая процедура динамического программирования автоматически определяет оптимальное число мод n и одновременно – соответствующий оптимальный набор порогов. Однако выбор регуляризирующего параметра также является некой эвристической процедурой, и потому в практических задачах проще оказывается выбирать число мод гистограммы.
а)
б)
в)
г)
@Рис. 3.1.3. Пример автоматической гистограммной сегментации изображения: а) при выделении 10 мод гистограммы; б) при выделении 5 мод гистограммы; в) при выделении 3 мод гистограммы; г) при выделении 2 мод гистограммы.