- •(Конспект лекций)
- •Содержание
- •3 Сосудистая оболочка; 4 радужная оболочка; 5 сетчатка;
- •6 Зрительный нерв; 7 центральная ямка (макула?); 8 хрусталик;
- •9 Слепое пятно; 10 зрачок; 11 стекловидное тело.
- •Квантование изображений
- •2.2. Типы представления изображений
- •2.3. Пиксели, разрешение, размер изображения
- •2.4. Цветовая глубина
- •2.5. Типы изображений
- •2.6. Размер растровых изображений
- •2.7. Форматы данных
- •Распространенные форматы файлов растровой графики
- •Файлы bmp
- •Файлы pcx
- •Файлы tiff
- •Файлы gif
- •Файлы png
- •Файлы jpeg
- •Распространенные форматы файлов растровой графики
- •3.1. Улучшение визуального качества изображений путем поэлементного преобразования
- •3.2. Линейное контрастирование изображения
- •3.3. Соляризация изображения
- •3.4. Препарирование изображения
- •3.5. Преобразование гистограмм, эквализация
- •3.6. Применение табличного метода при поэлементных преобразованиях изображений
- •4.1. Введение в Фурье-преобразование
- •4.2. Двумерное дискретное преобразование Фурье
- •5.1. Оптимальная линейная фильтрация. Уравнение Винера-Хопфа
- •5.2. Масочная (оконная) фильтрация изображений
- •Влияние размера выборки
- •5.3. Медианная фильтрация
- •Сравнение алгоритмов фильтрации
- •6.1. Сегментация изображений
- •6.1.1. Основные принципы сегментации изображений
- •6.1.2. Пороговое ограничение
- •6.1.3. Центроидное связывание
- •6.1.4. Алгоритмы слияния-расщепления
- •6.1.5. Алгоритмы разметки точек смешанного типа
- •6.1.6. Раскраска изображений
- •6.1.7. Сегментация путем выделения границ
- •6.1.8. Подавления шумов
- •6.2. Формализация задач распознавания изображений
- •6.2.1. Распознавание с помощью инвариантных признаков
- •6.2.2. Корреляционные алгоритмы распознавания
- •6.2.3. Распознавание с помощью нормализации
- •7.1. Преобразование изображений – преобразование Хока
- •7.2. Математическая морфология и обработка изображений
- •8.1. Основы цветного зрения
- •8.2. Цветовые модели
- •8.3. Основы цветной печати (цветоделение)
- •Вельтмандер п.В.Учебное пособие "Архитектуры графических систем. Машинная графика" Книга 2
- •Роуз а. Зрение человека и электронное зрение./ Перевод с английского под редакцией в.С.Вавилова. - м.: Мир, 1977
- •9.2. Методы сжатия изображений без потерь
- •9.3. Методы сжатия изображений с потерями
- •9.4. Фрактальное и вейвлетное сжатие изображений
- •9.1. Основы сжатия изображений
- •2N2n элементов, а во втором случае – нечетном косинусном преобразовании,
- •Матрицы Хаара
- •Преобразование Уолша – Адамара можно рассматривать как дискретный аналог непрерывного преобразования по базису, составленному из функций Уолша.
- •Результаты статистических исследований ортогональных преобразований
- •Информационное описание поиска и распознавания объектов
- •10.1. Управление процессами обработки и анализа изображений
- •10.2. Современная технология содержательного поиска в электронных коллекциях изображений
- •11. Обработка аудиоинформации
- •11.2. Цифровое представление звука Цифро-аналоговое и аналого-цифровое преобразование
- •11.3. Восприятие звука человеком
- •Клиппирование речевого сигнала
- •Избыточность речевого сигнала. Вокодер
- •Более сложные методы сжатия
- •Некоторые характеристики технологии mpeg
- •Алгоритм кодирования mpeg
- •Уровни mpeg
- •Intensity stereo coding – в высокочастотных подполосах кодируется суммированный из двух каналов сигнал вместо различных сигналов левого и правого каналов.
- •Технология mp3
- •TwinVq-кодирование
- •Сравнение звуковых форматов
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.5. Классификация речевых систем
- •12.6. РЕчевые технологии
- •Рекомендуемая литература Учебная и методическая литература
- •Другие виды литературы
7.2. Математическая морфология и обработка изображений
Одной из фундаментальных проблем анализа изображений является создание адекватного математического описания изображений, передающего их содержание, смысл. Иными словами, это описание должно отражать лишь существенные (с точки зрения решаемой задачи) особенности изображения, и не зависеть от несущественных деталей. В морфологическом анализе такими несущественными характеристиками являются условия регистрации изображений объекта или сцены и параметры регистрирующей аппаратуры. Методы морфологического анализа являются, таким образом, шагом на пути решения проблемы описания семантики изображений.
Хорошо известно, что изображения одной и той же сцены, отвечающие различным условиям освещения и(или) измененным оптическим свойствам объектов могут отличаться радикально. Это обстоятельство порождает значительные трудности в прикладных задачах анализа и интерпретации изображений реальных сцен, в которых решение не должно зависеть от условий регистрации изображений. Речь идет, например, о задачах выделения неизвестного объекта на фоне известной местности, известного объекта на произвольном фоне при неконтролируемых условиях освещения, о задаче совмещения изображений одной и той же сцены, полученной в различных спектральных диапазонах и т.д.
Для решения перечисленных задач были разработаны методы морфологического анализа изображений, оказавшиеся достаточно эффективными.
Применение аппарата математической морфологии в анализе изображений является одним из сравнительно новых направлений. Начало математической морфологии, использующей представления теории множеств и интегральной геометрии, было положено работами французских исследователей Ж. Матерона и Дж. Серра, занимавшихся проблемами минералогии и петрографии. Цель их исследований состояла в количественном описании физических и механических свойств материалов посредством анализа их геометрической структуры. Затем математическая морфология достигла состояния серьезного инструмента обработки изображений с основным применением в материаловедении, исследовании цитологических препаратов, анализе медицинских изображений.
В этой главе фрагментарно обсуждаются основные операции математической морфологии и их свойства, т. к. объема одной главы совершенно недостаточно для сколь-нибудь последовательного изложения теоретических основ, и приводятся результаты применения этих операций для обработки и анализа изображений (в основном двухградационных).
Следует заметить, что публикации, посвященные как теоретическим вопросам математической морфологии, так и ее приложениям в области обработки изображений, в русскоязычной литературе практически отсутствуют.
Напомним некоторые основные понятия из теории множеств, которые потребуются в дальнейшем. Пусть En – n-мерное пространство. Ниже примем, что En = Rn или En = Zn, где Rn – n-мерное евклидово пространство, a Zn – n-мерное дискретное пространство (n-мерная решетка). В применении к изображениям, как правило, рассматриваются двумерные пространства. Если X = {x} и Y = {y} – множества в Еn, то объединением множеств X и Y называется множество Z = {z: zX или zY} = XY, (т.е. множество, состоящее из таких элементов z, которые принадлежат X или Y), а пересечением множеств X и Y называется множество Z = XY = {z: zX , zY}. Множество Z = Xc ={z: zX} называется дополнением множества X. Разностью множеств X и Y называется множество Z = {z: zX, zY} = X\Y. Множество Z называется пустым, если оно не содержит ни одного элемента. Обозначается такое множество как Z = . Справедливы следующие соотношения:
(XY)c = XcYc;
(XY)c = XcYc; (7.1)
X\Y= XYc
Определим на Еn индикаторную функцию множества X следующим образом:
.
Определим также меру множества X:
– для непрерывного
пространства Rn
и
– для дискретного
пространства Zn.
Для изображений эти определения означают, что мерой множества X является его площадь в непрерывном случае и количество узлов решетки, входящих в множество, – в дискретном.
Операции математической морфологии
Двухградационное изображение можно рассматривать как индикаторную функцию набора множеств в Е2 (как, например, индикаторную функцию множества X1X2X3 на рис. 7.23). Для данного множества X можно зафиксировать некоторый элемент (не обязательно принадлежащий этому множеству), который назовем центром (или началом) множества X .
Рис. 7.23. Двухградационное изображение
Обозначим через Хa множество X, центр которого помещен в точку а. Одним из основных понятий математической морфологии является понятие структурного элемента. Структурный элемент В – это множество, состоящее из двух непересекающихся подмножеств В1 и B2, для которых определено общее начало.
НМ-преобразование
Базовым преобразованием, позволяющим строить набор различных операций математической морфологии, является преобразование Hit or Miss. Авторам не удалось найти адекватного перевода этому названию, поэтому далее будет использоваться название НМ-преобразование. Для данного множества X = {xEn} и данного структурного элемента В результат НМ-преобразования определяется как
Y = XB
= {x:
X,
Xc}
(7.2)
(Здесь через Xc обозначено дополнение множества X ).
Нетрудно видеть (рис. 7.24), что в результате НМ-преобразования на исходном изображении выделяются элементы, окрестность которых совпадает со структурным элементом (заметим, что форма окрестности определяется формой структурного элемента). Условие (7.2) выполняется для элементов, лежащих на нижней границе X (например, 1...4 позиции структурного элемента). В позиции 5 X, но Xc, в позиции 6, наоборот, X, но Xc, а в позиции 7 не выполняются оба условия.
Применяя HМ-преобразование с различными структурными элементами, можно выделять специфические геометрические особенности изображений.
Рис. 7.24. НМ-преобразование
Морфологические операции в дискретном пространстве
Обычно п-мерные дискретные данные упорядочиваются в соответствии с п целочисленными параметрами, образуя некоторую пространственную структуру. Если эти параметры изменяются регулярным образом (например, номера столбцов и строк в дискретном изображении), структура может быть представлена в виде решетки. Построим двумерную решетку следующим образом: определим в R2 два линейно независимых вектора u1 и u2. Решеткой назовем множество вершин всех возможных векторов вида u=k1u1+k2u2, где k1,k2 – целые числа. Примеры наиболее распространенных решеток приведены на рис. 7. 25.
Рис. 7.25. Примеры решеток: 1– квадратная,
2 – прямоугольная, 3 – гексагональная
Переход от непрерывного к дискретному пространству создает ряд проблем не только формального, но и практического характера. Принципиальная анизотропия дискретного пространства делает невозможным, например, поворот на произвольный угол. Возникает проблема и с нахождением расстояния, которое в непрерывном пространстве вводится достаточно естественным образом. Для некоторых типов решеток неоднозначным образом определяется понятие соседства. Последнее обстоятельство иллюстрирует рис. 7.26. Назовем множество связным, если из одной его точки к любой другой можно проложить путь, проходящий только по точкам, принадлежащим этому множеству, при этом каждая следующая точка пути должна соседствовать с текущей.
Рис. 7.26. Соседство и связность: а – прямоугольная решетка;
б – гексагональная решетка
На рис. 7.26, а слева приведено три возможных задания соседства для прямоугольной решетки: соседство через стороны решетки, через узлы решетки и через стороны и узлы. Если мы примем первое определение соседства, то обнаружим, что белое поле в правой части рисунка состоит из двух частей, не связанных между собой. Следовательно, их должна разделять связная область черного цвета. Между тем такой области нет, поскольку точки черного контура тоже не связаны между собой. Если воспользуемся вторым определением соседства, получим не менее парадоксальную ситуацию: теперь точки и вне и внутри связного контура принадлежат односвязной области. Та же ситуация возникает и при третьем определении соседства.
Один из способов устранения этого противоречия состоит в том, чтобы определять по-разному соседство для белых и черных областей, скажем, для белых через стороны, а для черных – через узлы. Но тогда одни и те же операции, выполненные на изображениях, инвертированных друг относительно друга по яркости, могут приводить к различным результатам. Другой способ состоит в выборе типа решетки, не создающего вовсе этой проблемы. К такому типу относится гексагональная решетка (рис. 7.26, 6). Поэтому ниже будем пользоваться этой решеткой.
Влияние анизотропии дискретного пространства демонстрирует рис.7.27. Здесь показано поведение функции f(r), вычисленной для объекта, представляющего дискретную аппроксимацию равностороннего треугольника на гексагональной решетке. В качестве структурного элемента используется дискретный аналог круга радиусом r – гексагон rH, где r – длина стороны гексагона (см. рис. 7.27, а слева). В первом случае (рис. 7.27, а) стороны треугольника параллельны базисным векторам решетки u1, u2 и вектору (u1+u2), задающему третье главное направление решетки. Во втором случае (рис. 7.27, б) треугольник повернут на угол 90°.
Рис. 7.27. Влияние ориентации на функцию формы объекта.
Белым обозначены точки, исчезающие на первом шаге ( r = 1 ); светло-серым – на втором ( r = 2); темно-серым – на третьем ( r = 3 ): черным – на четвертом (r = 4)
Эти особенности необходимо учитывать при реализации введенных выше морфологических операций в дискретном пространстве. Существует ряд операций, которые можно определить и в непрерывном пространстве, однако их применение имеет практический смысл только на решетках. Одна из таких операций нам уже известна. Это НМ-преобразование. НМ-преобразование, использующее различные структурные элементы, позволяет выделять особые точки на изображении. Например, точки разветвления линий на гексагональной решетке могут появляться только в конфигурациях, приведенных на рис. 7.28, причем конфигурации 1–2, 3–8 и 9–14 идентичны с точностью до поворота вокруг центральной точки. Поэтому НМ-преобразование с использованием структурных элементов, построенных на базе конфигураций 1, 3 и 9, позволяет выявить любые точки разветвления.
Рис. 7.28. Конфигурации, соответствующие точкам разветвления
на гексагональной решетке
Вычисление количества связных компонент
Полостями множества X называются связные компоненты множества Xc. На гексагональной решетке количество связных компонент пc и количество полостей nh множества X связаны соотношением
,
(7.3)
где символом n(*) обозначено количество конфигураций *, встречающихся в множестве X. Если компоненты X не содержат полостей, то пc просто равно их количеству, поскольку в этом случае Xc состоит из одной связной компоненты и, следовательно, пh = 1. Но, как мы видели раньше, НМ-преобразование выделяет в исходном множестве точки, окрестность которых совпадает со структурным элементом.
Рис. 7.29. Структурные элементы, используемые для подсчета
связных компонент (точкой обозначено начало)
Используя в НМ-преобразовании структурные элементы, приведенные на рис. 7.29, получим
.
(7.4)
Утончение и утолщение
Операция утончения (thinning) определяется как
Y = X T = X \ (X T), (7.5)
а операция утолщения (thickenning) – как
Y = X
T = X
(X
T), (7.6)
где T=(T1,T2) – структурный элемент, состоящий из двух непересекающихся подмножеств T1 и Т2.
Отметим, что если начало структурного элемента принадлежит T1 , то X T X, если же начало принадлежит Т2, то X T Xc. Поэтому в первом случае Y = X T = X при любом Т2, а во втором – Х О Т = Х при любом T1. Чтобы избежать получения этих тривиальных результатов, всегда будем полагать, что при выполнении операции утончения (соответственно, утолщения) начало структурного элемента не принадлежит Т2 (соответственно, T1). Кроме того, можно показать, что (X T)c = Хc О Т* где T* = (T2,T1). Примеры операций утончения и утолщения приведены на рис. 7.30.
Введем последовательность структурных элементов {Тi} и обозначим
Х О {Тi} = (…((Х О Т1) О Т2)…) О Тi… (7.7)
последовательные утончения и
X {Ti} = (…((X T1) T2)…) Ti… (7.7')
последовательные утолщения множества X с помощью последовательности структурных элементов {Ti}.
Рис.7.30. Утончение и утолщение:
а – серыми кружками помечено исходное множество; б – черными кружками помечен результат НМ-преобразования посредством структурного элемента T,
а крестиками – результат НМ-преобразования посредством структурного элемента Т* (начало структурного элемента – кружок с точкой в центре); в– утончение; г – утолщение
Изучим результат последовательных
утончений множества X
посредством последовательности
структурных элементов {Li},
,
где Li
отличаются друг от друга поворотом
вокруг центральной точки (рис. 7.31). На
крайнем правом рисунке показан
установившийся результат последовательных
утончений, который при последующих
утончениях не изменяется.
Рис. 7.31. Последовательные утончения
Приведенный пример демонстрирует применение операции утончения для построения скелетона (или скелета) множества X. Понятие скелетона (или скелета) достаточно интуитивно. На этом уровне его иногда пытаются описать с помощью качественной модели «степного пожара». Представим себе степной массив, покрытый сухой травой. Допустим, что одновременно вдоль всей границы массива вспыхивает огонь, распространяющийся во всех направлениях с одинаковой скоростью. В первый момент фронт распространения огня совпадает с границей. По мере его распространения различные участки фронта встречаются друг с другом и в местах встречи фронтов огонь будет гаснуть. Вот эти места самогашения огня и образуют "скелетон" массива (рис. 7.32).
Для непрерывного двумерного пространства сформулированы следующие свойства точек скелетона множества X :
если точка x – является точкой скелетона, и Bx – наибольший круг с центром в точке х, содержащийся в X, то невозможно найти содержащийся в X больший круг (не обязательно с центром в точке x), содержащий Bx;
круг Bx касается границы множества X в двух или более точках.
Одно из определений скелетона: скелетон S(X) множества X есть множество центров максимальных кругов, содержащихся в X. Под максимальным кругом подразумевается круг, касающийся границ множества X в двух или более точках. Рис. 7.33 иллюстрирует это определение.
|
|
Рис. 7.32. Формирование линии гашения огня |
Рис. 7.33. К определению скелетона. Максимальные круги |
Из этого определения (и из рис. 7.33) следует одно замечательное свойство скелетона: если каждой точке скелетона сопоставить значение радиуса максимального круга, центром которого она является, то по скелетону можно восстановить множество X , его породившее:
,
где (x) – радиус максимального круга для точки х скелетона, В – круг единичного радиуса. Отметим без доказательства еще одно важное свойство скелетона: если множество X связно, то его скелетон S(X) тоже является связным множеством.
К сожалению, скелетон множества, заданного на дискретной решетке, только приближенно напоминает скелетон непрерывного множества. Более того, для одного и того же множества результат построения скелетона посредством последовательных утончений может быть различным в зависимости от порядка структурных элементов в последовательности (топологические свойства скелетона, такие как количество связных компонент, точек разветвления, ветвей, концевых точек и тому подобное при этом сохраняются). Это снова связано с анизотропией дискретного пространства. Тем не менее применение дискретного скелетона иногда оказывается чрезвычайно полезным. Так, скелетонизацию часто используют при обработке чертежей или распознавании символов для сведения линий к единичной ширине. Построение скелетона фоновой компоненты изображения, содержащего некоторое множество объектов, позволяет сегментировать его на участки, каждый из которых можно интерпретировать как зону влияния (жизненное пространство) объекта. Статистический анализ размеров, ориентации и количества соседей таких зон применяется при анализе прочностных характеристик материалов, при исследовании поведения популяций микроорганизмов и развития лесных массивов.
Грузман И.С., Киричук В.С., Косых В.П., Перетягин Г.И., Спектор А.А. Цифровая обработка изображений в информационных системах: Учебное пособие.- Новосибисрк: Изд-во НГТУ, 2002.
Матерон Ж. Случайные множества и интегральная геометрия. М.: Мир, 1978.
Serra J. Image Analysis and mathematical Morphology. – London-New York: Academic Press, 1982.
Heijmans H. Mathematical Morphology: Basic Principles. //Proceedings of Summer School on Morphological Image and Signal Processing. – Zakopane, Poland, 1995 (ftp: //ftp.cwi.nl/pub/morphology/report/Heijmans_Zakopane_intro.ps.Z).
Soille P. Morphological Image Analysis. – Berlin, Heidelberg, New York: Springer-Verlag, 1999.
Пытьев Ю.П. Задачи морфологического анализа изображений. В сб. Математические методы исследования природных ресурсов Земли из космоса. Под ред. В.Г.Золотухина. - М.:Наука 1984
Pyt'ev Yu.P. Morphological Image Analysis. - Pattern Recognition and Image Analysis. V.3, No.1, 1993, pp.19-28.
По данной теме предлагается выполнение курсового проекта. Выбранную тематику необходимо согласовать с преподавателем и получить у него задание на проектирование.
Предлагается пройти тест для самоконтроля (Тест 7) на усвоение материала.
8. Цвет и задачи, решаемые с цветным изображением
8.1. Основы цветного зрения
Зрение человека, цветовое восприятие и его особенности
Физические принципы формирования оттенков
8.2. Цветовые модели
Модель RGB
Модели CMY и CMYK
Модели HSV, HLS и HSB
Модель L*a*b*
8.3. Основы цветной печати (цветоделение)
Контраст, детальность, разрешение принтера и частота пространственной дискретизации
Вывод на экран и печать цветных изображений
Глубина цвета
Устройства цветной печати
Разделение цвета
8.4. Краткое содержание темы (слайды)
8.5. Ссылки и литература для дальнейшего изучения
8.6. Курсовое проектирование
8.7. Задание
