
- •«Обработка изображений и распознавание образов» Визильтер Юрий Валентинович Методическое пособие-2010
- •Раздел 2. Распознавание образов. 184
- •Уровни и методы машинного зрения
- •Растровое изображение Изображение как двумерный массив данных
- •Алгебраические операции над изображениями
- •Физическая природа изображений
- •Изображения различных диапазонов длин волн
- •Изображения различной физической природы
- •Тип пикселя
- •Возможности и особенности системы Pisoft
- •Базовые средства просмотра и анализа изображений и видеопоследовательностей
- •Алгебра изображений
- •Геометрические преобразования изображений
- •Устройства оцифровки и ввода изображений
- •Линейки и матрицы, сканеры и камеры
- •Геометрия изображения
- •Цифровые и аналоговые устройства
- •Пространственное разрешение
- •Программное обеспечение
- •Обработка цветных изображений
- •Цветовая модель rgb
- •Цветовая модель hsv
- •Цветовая модель yuv
- •Цветовая сегментация изображения
- •Гистограмма и гистограммная обработка изображений
- •Профиль вдоль линии и анализ профиля
- •Проекция и анализ проекции
- •Бинаризация полутоновых изображений
- •Сегментация многомодальных изображений
- •Выделение и описание областей
- •Выделение связных областей на бинарных изображениях
- •1. Отслеживающие алгоритмы на примере алгоритма обхода контура.
- •2. Сканируюющие алгоритмы.
- •Оконная фильтрация изображений в пространственной области
- •Фильтрация бинарных изображений Модель шума «соль и перец»
- •Структура оконного фильтра
- •Логическая фильтрация помех
- •Бинарная медианная фильтрация
- •Бинарная ранговая фильтрация
- •Взвешенные ранговые фильтры
- •Анизотропная фильтрация
- •Расширение-сжатие (простая морфология)
- •Стирание бахромы
- •Нелинейная фильтрация полутоновых изображений
- •Ранговая оконная фильтрация
- •Минимаксная фильтрация
- •Задача выделения объектов интереса
- •Бинарные фильтры для выделения объектов
- •Метод нормализации фона
- •Скользящее среднее в окне
- •Гауссовская фильтрация
- •Преобразование Фурье. Линейная фильтрация в частотной области
- •Преобразование Фурье
- •Комплексное представление преобразования Фурье
- •Быстрое преобразование Фурье
- •Двумерное преобразование Фурье
- •Свертка с использованием преобразования Фурье
- •Фильтрация изображений в частотной области
- •Вейвлет-анализ
- •Пирамида изображений
- •Вейвлет-преобразование
- •Операторы вычисления производных
- •Операторы вычисления векторов градиентов
- •Операторы Марра и Лапласа
- •Постобработка контурного изображения Локализация края
- •Утончение контура
- •Сегментация полутоновых изображений
- •Пороговая и мультипороговая сегментация
- •Методы слияния, разбиения и слияния/разбиения областей
- •Способы описания выделенных областей
- •Текстурные признаки
- •1.6. Морфологические методы анализа сцен (по ю.П. Пытьеву) Методы обнаружения объектов, заданных эталонами
- •Согласованная фильтрация.
- •Корреляционное обнаружение.
- •Морфологический подход ю.П. Пытьева.
- •Форма изображения как инвариант преобразований изображений, отвечающих вариациям условий регистрации
- •Сравнение изображений по форме
- •Выделение отличий изображений по форме
- •Обнаружение объекта по его изображению и оценка его координат
- •*Морфология на базе кусочно-линейной интерполяции
- •Преобразование Хафа для поиска прямых
- •*Различные способы параметризации прямых
- •Преобразование Хафа для поиска окружностей
- •Анализ аккумулятора при поиске геометрических примитивов
- •Обобщенное преобразование Хафа
- •*Специализированная процедура голосования для поиска эллипсов
- •*Рекуррентное преобразование Хафа в скользящем окне
- •1.8. Математическая морфология (по ж. Серра)
- •Морфологические операции на бинарных изображениях
- •Морфологические операции на полутоновых изображениях
- •Морфологическое выделение «черт» и объектов
- •Морфологический спектр
- •Морфологические скелеты. Непрерывная бинарная морфология Непрерывная бинарная морфология
- •Непрерывное гранично-скелетное представление изображения
- •Обработка и использование скелета
- •*Обобщенные скелетные представления бинарных фигур
- •Алгоритмы утончения дискретного бинарного изображения
- •*Регуляризация скелетов
- •Типы нерегулярностей скелета
- •Устранение нерегулярностей
- •Регуляризация скелета по Тихонову
- •*Селективные морфологии
- •Метод оптических потоков
- •Дифференциальный подход
- •Корреляционный подход
- •Частотный подход
- •Корреляционное слежение.
- •Форматы хранения и передачи цифровых изображений
- •Методы сжатия цифровых изображений
- •Формат bmp
- •Формат pcx
- •Формат gif
- •Формат tiff
- •Формат jpeg
- •Форматы хранения и передачи цифровых видеопоследовательностей
- •Формат avi
- •Формат mpeg
- •Форматы mpeg 1 и mpeg 2
- •Формат mpeg 4
- •Форматы mpeg 7
- •Раздел 2. Распознавание образов.
- •Обучение с учителем. Детерминированные методы, основанные на «близости». Линейные решающие правила. Метод построения эталонов. Метод ближайшего соседа. Метод k ближайших соседей.
- •Линейные решающие правила
- •Метод построения эталонов
- •Методы ближайших соседей
- •Параметрические и непараметрические методы
- •Дискриминантные и моделирующие методы обучения
- •Способность распознавателя к обобщению. Регуляризация.
- •Байесовская теория решений. Случай двух классов. Классификаторы, разделяющие функции и поверхности решений. Вероятности ошибок. Разделяющие функции для случая нормальной плотности.
- •Дискриминантный анализ. Линейный дискриминант Фишера. Персептронная функция критерия. Линейный дискриминантный анализ (lda, дискриминант Фишера)
- •Персептрон Розенблатта
- •Байесовское объединение свидетельств
- •Структурное распознавание
- •Автоматизированное конструирование алгоритмов обнаружения объектов на основе преобразований модельных описаний объектов.
- •Нейросетевое распознавание
- •Нейронные сети ассоциативной памяти. Сети Хопфилда.
- •Многослойные персептроны. Оптимизационное обучение. Метод обратного распространения ошибки.
- •Многослойные персептроны. Правило Хебба.
- •*Связь с байесовским распознаванием
- •Сети встречного распространения. Самоорганизующиеся сети.
Дифференциальный подход
Дифференциальный подход основывается на нахождении скоростей точек изображения по разностной схеме. Первые методы [2,3,4] основывались на вычислении производных первого порядка. При этом предполагалось, что яркость в точке остается постоянной в течение небольшого промежутка времени, что выражается уравнением
.
Отсюда получим уравнение
(1)
.
Также можно сделать предположение о производных второго порядка [4,5,6,7]:
.
Тогда,
раскрывая дифференциал и градиент по
переменным
,
получим
(2)
.
Алгоритм, описанный в [2], основан на минимизации функционала (3), составленного из сглаживающей части и части, основанной на предположении (1):
(3)
.
Здесь
.
Область
– область, в которой ищется оптический
поток. Значение коэффициента
определяет уровень значимости сглаживающей
части функционала (3). Предложения по
выбору значения
различаются кардинально. Например, в
книге [2] предлагается выбирать данную
константу равной
,
в книге [1] – равной
.
Минимизирующая
функционал (3) последовательность
скоростей
имеет вид
(4)
,
.
Здесь
и
– скорости, усредненные по соседним
точкам
Необходимое количество итераций может варьироваться в зависимости от характеристик последовательности изображений. В работах [1,2] предлагается сделать не менее 100 итераций.
Пример работы алгоритма можно видеть на рисунке #.3.3.
Рис. #.3.3. Оптический поток с последующей сегментацией с сохранением номера области.
Алгоритм,
описанный в [7], основывается на минимизации
функционала (5) по области
.
(5)
.
Функционал
(5) содержит взвешенную сумму по точкам,
входящих в область
,
– весовая матрица.
Алгоритм, описанный в [4], минимизирует функционал
(6)
.
Данный функционал имеет похожую структуру на функционал (3). Отличием является иной вид сглаживающей части, который более точно просчитывает поток на контурах объекта. Параметр в [4] предлагалось выбирать равным , в [1] – . Параметр в (6) аналогичен параметру в (3).
Корреляционный подход
Дифференциальный
подход к вычислению оптического потока
может быть непрактичен в связи с
присутствием шумов на изображениях или
в связи с недостаточным количеством
изображений в последовательности. Так
были предложены корреляционные алгоритмы
[8,9], основанные на поиске наилучшего
смещения
между областями на последовательности
изображений. Большинство из них
основывается на максимизации функции
подобия или на минимизации SSD-функционала
(Sum-of-Squares
Difference):
(7)
.
SSD-функционал
представляет собой функцию смещения
.
Метод, предложенный в работе [8], основывается на применении пирамиды Лапласа, а также SSD-функционала. Минимум (7) ищется для нескольких уровней пирамиды. Такой подход позволяет определить большие смещения, так как при использовании пирамиды Лапласа строится несколько изображений, (количество изображений определяется уровнем пирамиды) идентичных первоначальному, но уменьшенного размера.
Скорости в данном методе находятся из минимизации функционала
(8)
,
где
и
– направления минимальной и максимальной
кривизны SSD-поверхности
в точке минимума,
и
– минимальный и максимальный радиусы
кривизны SSD-поверхности,
– смещение, полученное из решения задачи
для более высоких уровней пирамиды.
Решение находится с помощью итерационного
алгоритма Гаусса-Зейделя.
В работе [9] предложен двухэтапный метод. На первом этапе вычисляется значение SSD-функционала по трем изображениям:
(9)
,
где
определено в (7). Затем значение
из (9) используется для генерации
вероятностного распределения с плотностью
вероятности
(10)
,
где
.
Скорости
и
вычисляются как математические ожидания
смещений
и
соответственно, также вычисляется
ковариационная матрица
.
На
втором этапе вычисляются скорости
и
как взвешенные средние по соседним
точкам, вычисляется соответствующая
матрица
и минимизируется функционал
(11)
.
Здесь скорости и являются известными, а и находятся из последовательности точек
(12)
,
.
Решение получается из минимизации функционала (11).