
- •«Обработка изображений и распознавание образов» Визильтер Юрий Валентинович Методическое пособие-2010
- •Раздел 2. Распознавание образов. 165
- •1.1. Задачи и приложения машинного зрения. Примеры практических приложений.
- •Уровни и методы машинного зрения
- •Растровое изображение Изображение как двумерный массив данных
- •Алгебраические операции над изображениями
- •Физическая природа изображений
- •Изображения различных диапазонов длин волн
- •Изображения различной физической природы
- •Тип пикселя
- •Возможности и особенности системыPisoft
- •Базовые средства просмотра и анализа изображений и видеопоследовательностей
- •Алгебра изображений
- •Геометрические преобразования изображений
- •Устройства оцифровки и ввода изображений
- •Линейки и матрицы, сканеры и камеры
- •Геометрия изображения
- •Цифровые и аналоговые устройства
- •Пространственное разрешение
- •Программное обеспечение
- •Обработка цветных изображений
- •Цветовая модельRgb
- •Цветовая модель hsv
- •Цветовая модель yuv
- •Цветовая сегментация изображения
- •Гистограмма и гистограммная обработка изображений
- •Профиль вдоль линии и анализ профиля
- •Проекция и анализ проекции
- •Бинаризация полутоновых изображений
- •Сегментация многомодальных изображений
- •Выделение и описание областей
- •Выделение связных областей на бинарных изображениях
- •1. Отслеживающие алгоритмы на примере алгоритма обхода контура.
- •2. Сканируюющие алгоритмы.
- •1.3. Фильтрация. Выделение объектов при помощи фильтров
- •Оконная фильтрация изображений в пространственной области
- •Фильтрация бинарных изображений Модель шума «соль и перец»
- •Структура оконного фильтра
- •Логическая фильтрация помех
- •Бинарная медианная фильтрация
- •Бинарная ранговая фильтрация
- •Взвешенные ранговые фильтры
- •Анизотропная фильтрация
- •Расширение-сжатие (простая морфология)
- •Стирание бахромы
- •Нелинейная фильтрация полутоновых изображений
- •Ранговая оконная фильтрация
- •Минимаксная фильтрация
- •Задача выделения объектов интереса
- •Бинарные фильтры для выделения объектов
- •Метод нормализации фона
- •Скользящее среднее в окне
- •Гауссовская фильтрация
- •Преобразование Фурье. Линейная фильтрация в частотной области
- •Преобразование Фурье
- •Комплексное представление преобразования Фурье
- •Быстрое преобразование Фурье
- •Двумерное преобразование Фурье
- •Свертка с использованием преобразования Фурье
- •Фильтрация изображений в частотной области
- •Вейвлет-анализ
- •Пирамида изображений
- •Вейвлет-преобразование
- •Операторы вычисления производных
- •Операторы вычисления векторов градиентов
- •Операторы Марра и Лапласа
- •Постобработка контурного изображения Локализация края
- •Утончение контура
- •Сегментация полутоновых изображений
- •Пороговая и мультипороговая сегментация
- •Методы слияния, разбиения и слияния/разбиения областей
- •Способы описания выделенных областей
- •Текстурные признаки
- •1.6.Морфологические методы анализа сцен (по ю.П. Пытьеву) Методы обнаружения объектов, заданных эталонами
- •Согласованная фильтрация.
- •Корреляционное обнаружение.
- •Морфологический подход ю.П. Пытьева.
- •Форма изображения как инвариант преобразований изображений, отвечающих вариациям условий регистрации
- •Сравнение изображений по форме
- •Выделение отличий изображений по форме
- •Обнаружение объекта по его изображению и оценка его координат
- •*Морфология на базе кусочно-линейной интерполяции
- •Преобразование Хафа для поиска прямых
- •*Различные способы параметризации прямых
- •Преобразование Хафа для поиска окружностей
- •Анализ аккумулятора при поиске геометрических примитивов
- •Обобщенное преобразование Хафа
- •*Специализированная процедура голосования для поиска эллипсов
- •*Рекуррентное преобразование Хафа в скользящем окне
- •1.8.Математическая морфология (по ж. Серра)
- •Морфологические операции на бинарных изображениях
- •Морфологические операции на полутоновых изображениях
- •Морфологическое выделение «черт» и объектов
- •Морфологический спектр
- •Морфологические скелеты. Непрерывная бинарная морфология Непрерывная бинарная морфология
- •Непрерывное гранично-скелетное представление изображения
- •Обработка и использование скелета
- •*Обобщенные скелетные представления бинарных фигур
- •Алгоритмы утончения дискретного бинарного изображения
- •*Регуляризация скелетов
- •Типы нерегулярностей скелета
- •Устранение нерегулярностей
- •Регуляризация скелета по Тихонову
- •*Селективные морфологии
- •1.9. Анализ движения. Выделение движущихся объектов. Разность кадров. Вычитание фона. Анализ оптических потоков. Слежение за движущимися объектами. Корреляционное слежение.
- •Обучение с учителем. Детерминированные методы, основанные на «близости». Линейные решающие правила. Метод построения эталонов. Метод ближайшего соседа. Методkближайших соседей.
- •Линейные решающие правила
- •Метод построения эталонов
- •Методы ближайших соседей
- •Параметрические и непараметрические методы
- •Дискриминантные и моделирующие методы обучения
- •Способность распознавателя к обобщению. Регуляризация.
- •Байесовская теория решений. Случай двух классов. Классификаторы, разделяющие функции и поверхности решений. Вероятности ошибок. Разделяющие функции для случая нормальной плотности.
- •Дискриминантный анализ. Линейный дискриминант Фишера. Персептронная функция критерия. Линейный дискриминантный анализ (lda,дискриминант Фишера)
- •Персептрон Розенблатта
- •Анализ свидетельств
- •Байесовское объединение свидетельств
- •Структурное распознавание
- •Автоматизированное конструирование алгоритмов обнаружения объектов на основе преобразований модельных описаний объектов.
- •Нейросетевое распознавание
- •Нейронные сети ассоциативной памяти. Сети Хопфилда.
- •Многослойные персептроны. Оптимизационное обучение. Метод обратного распространения ошибки.
- •Многослойные персептроны. Правило Хебба.
- •*Связь с байесовским распознаванием
- •Сети встречного распространения. Самоорганизующиеся сети.
Морфологические операции на полутоновых изображениях
Естественный интерес представляет расширение основных операций и результатов морфологии на случай, когда изображение рассматривается как функция f: F®E, где FÌEN–1, а f задает интенсивность изображения на F (для случая двумерных изображений FÌE2). Для обобщения операций морфологии на этот случай, обычно вводят следующие понятия [337].
Теньюf называется множество U(f)ÌF´E, определяемое как
U(f) = {(x,y)ÎF´E|y£f(x)}.
Поверхностьюмножества AÍF´E называется множество T(A): F®E, определяемое в каждой точке как
T[A](x) = max{y|(x,y)ÎA}.
Связь между этими понятиями очевидна:
T[U(f)] = f.
Геометрическое представление тенифункции и поверхности представлено на рис. 6.1.14.
Теперь для интенсивного изображения легко определить понятия основных морфологических операций.
Пусть F,KÍEN–1, f: F®E, k: K®E. Тогда
– дилатациейf по k называется:
fk = T[U(f)bU(k)]
– эрозиейf по k называется
fk = T[U(f)bU(k)]
где bиbесть обычные бинарные операции над U(f),U(k)ÍEN. Другой способ вычисления эрозии и дилатации задается выражениями:
fk(x) = max{f(x–z)+k(z)}, AzÎK и (x–z)ÎF
fk(x) = min{f(x+z)–k(z)}, AzÎK и (x+z)ÎF.
Геометрическое представление дилатациииэрозиифункции и поверхности проиллюстрировано на рис. 6.1.15, 6.1.16.
@Рис. 6.1.14. «Тень» функции и поверхность «тени»
@Рис. 6.1.15. Полутоновая морфологическая эрозия
@Рис. 6.1.16. Полутоновая морфологическая дилатация
Для полутоновых изображений существует аналог теоремы Матерона о представлении морфологических операторов в виде объединения зрозий. Кроме того, результаты здесь также могут быть представлены в двойственной форме, так как.
–(fk) = (–f)k~, где k~(x) = k(–x)
fk = –((–f)k~).
Выражения для операций открытия и закрытия для полутонового случая полностью эквивалентны формулам (6.1.1) и (6.1.2):
f◦k=(fk)k,
f·k=(fk)k
с учетом всех предыдущих выражений.
Морфологическое выделение «черт» и объектов
Выделение мелкоразмерных объектов, границ и характерных точек на изображении является одной из главных областей применения ММ. В частности, характерными элементами являются «T», «Y» и «W»-соединения (на полутоновых изображениях), острые пики и глубокие впадины «рельефа изображения», мысы и «заливы», ступенчатые разрывы поверхности и т.д.
Определим морфологическую границуXmдля множества X как разность расширения и сжатия X по сферическому структурирующему элементу Br
Xm = (XBr) – (XBr). (6.1.3)
С топологической точки зрения, мы получим множество точек, окрестности которых пересекаются как с объектом X так и с фоном (дополнением) XC.
Введем категории точек морфологической границы:
гладкой поверхностьюназывается связное множество точек в Xm, которые имеют двумерную окрестность в Xm, то есть в каждой из этих точек существует непрерывная нормаль к поверхности;
сингулярной кривой называется кривая CÍXm, представляющая собой связное множество точек, имеющих одномерную окрестность на Xm;
точки границы Xm, не принадлежащие ни гладкой поверхности, ни сингулярной кривой, называютсясингулярными точками.Примером сингулярных точек могут служить «T», «Y» и «W»-узлы.
В /12/ показано, что детектор (6.1.3) обеспечивает хорошее обнаружение узлов и ступенчатых разрывов поверхности полутонового изображения. Однако, для обнаружения пиков, впадин и острых углов необходим другой алгоритм.
Элементарные геометрические соображения показывают, что операции расширения и сжатия позволяют обнаруживать пики и острые углы. Механизм обнаружения прост. Как уже отмечалось ранее, расширение X дисковым (сферическим) структурирующим элементом можно рассматривать как объединение всех дисков (сфер) вписанных в изображение, а сжатие можно рассматривать, как расширение по фону XC. Из рисунка 6.1.17 видно, что в точке острого угла разность между расширенным и сжатым изображением будет максимальна. Поэтому детектор острых углов можно определить как разность между открытием X и закрытием X:
gXm = X◦B – X·B.
@Рис. 6.1.17. Принцип морфологического обнаружения острых углов на бинарных изображениях
Структурирующий элемент, используемый для выделения, черт не обязан быть «сферическим» в точном смысле этого слова, поскольку масштаб изображения по яркостной оси никак не связан с его геометрическим масштабом. Однако, легко показать, что операции выделения «черт» при помощи ММ являются инвариантными к поворотам в том и только том случае, когда структурирующий элемент имеет форму тела вращения вокруг оси, проходящей через точку с координатами (0,0). Поскольку результат применения морфологических операторов зависит только от формы структурирующего элемента, вращение изображения относительно структурирующего элемента эквивалентно повороту на такой же угол (в обратном направлении) структурирующего элемента относительно изображения. Тогда условием инвариантности операторов к повороту является эквивалентность структурирующего элемента самому себе при повороте относительно точки (0,0) на любой угол. Это выполняется только в том случае, когда структурирующий элемент имеет форму тела вращения.
Габаритные размеры такого структурирующего элемента (диаметр носителя и высота) определяют масштаб «черт», выделяемых по описанной выше схеме.
Математическая морфология и ее основные операции создают новую базу для применения метода нормализации фона (см. главу 3.3). В этом случае используются два структурирующих элемента В1и В2. Элемент В1конструируется таким образом, чтобы «подходить» даже к самым маленьким размерам объекта на изображении и в тоже время отсекать импульсный шум, элемент В2имеет большие размеры апертуры и в состоянии подавить любой, даже самый большой по геометрическим размерам отклик объекта. Алгоритм нормализации фона выглядит в этом случае следующим образом:
X' = ((X◦B1)·B1)◦B2(X◦B1)·B1
Для выбора класса и конкретной реализации алгоритмов предварительной обработки, а также исследования их оптимальных параметров необходимо проведение математического моделирования с учетом характеристик модельной и реальной фоновой обстановки.
Таким образом, в задачах инвариантного обнаружения на изображении границ, характерных точек и других «черт», а также малоразмерных объектов в сложной шумовой обстановке, могут применяться алгоритмы, основанные на использовании операторов математической морфологии со структурирующими элементами в форме тел вращения. Возможна масштабная настройка таких алгоритмов путем изменения размера структурирующих элементов.