Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Luciv / МКОИ_пособие

.pdf
Скачиваний:
51
Добавлен:
21.03.2016
Размер:
5.37 Mб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

Государственное образовательное учреждение высшего профессионального образования

«Санкт-Петербургский государственный университет информационных технологий, механики и оптики»

Программа развития национального исследовательского университета информационных и оптических технологий «ИТМО»

В.Т. Фисенко, Т.Ю. Фисенко

МЕТОДЫ КОМПЬЮТЕРНОЙ ОБРАБОТКИ ИЗОБРАЖЕНИЙ

Учебно-методическое пособие по образовательному модулю

ДВМ.В.01- «Методы компьютерной обработки изображений»

Санкт-Петербург

2009

В.Т. Фисенко, Т.Ю. Фисенко, Методы компьютерной обработки изображений: учеб. пособие,- СПб: СПбГУ ИТМО, 2009. –с.132.

Учебно-методическое пособие по организации самостоятельной работы по образовательному модулю ДВМ.В.01- «Методы компьютерной обработки изображений».

В пособии приведены методы компьютерной обработки изображений, связанные с формированием признаков объектов и анализом изображений. Учебно-методическое пособие содержит теоретический материал для самостоятельной работы студентов по избранным разделам дисциплины ДВМ.В.01- «Методы компьютерной обработки изображений».

Пособие рекомендуется студентам, обучающимся по направлению подготовки магистров 200200.68. – «Компьютерная видеоинформатика».

Санкт-Петербургский государственный университет информационных технологий, механики и оптики, 2009 © В.Т. Фисенко, Т.Ю. Фисенко 2009

2

Список использованных сокращений

 

 

ЗС -

зрительная система,

 

 

L- колбочки

колбочки,

чувствительные

в

длинноволновом

 

диапазоне спектра (Long-wavelength),

 

М- колбочки

колбочки,

чувствительные

в

средневолновом

 

диапазоне спектра (Middle-wavelength),

S- колбочки

колбочки, чувствительные в коротковолновом

 

диапазоне спектра (Short -wavelength),

 

RGB -

красный (R), зеленый (G) и синий (B),

 

МКО -

Международная комиссия по освещению (CIE),

ЛКТ -

Латеральное коленчатое тело (lateral geniculate

 

nucleusLGN),

 

 

CIE -

МКО (Comission Internationale de l’Eclairage),

JPEG-

объединенная группа экспертов по фотографии (Joint

 

Photographic Experts Group),

 

 

MPEG-

Международная экспертная группа по обработке

 

последовательностей изображений (Moving Picture

 

Expert Group), набор инструментов для сжатия видео

 

последовательностей,

 

 

PAL-

аналоговая система телевизионного вещания

SECAM-

аналоговая система телевизионного вещания

NTSC -

аналоговая система телевизионного вещания (США,

 

Канада, Япония и др.),

 

 

JND-

порог цветоразличения (минимальная заметная

 

разница),

 

 

 

КЦТ-

Коррелированная цветовая температура

ИОР-

идеальный отражающий рассеиватель

 

XYZ-

цветовое координатное пространство

 

КСФ

Контрастно-сенситивная функция

 

CIELAB-

цветовое координатное пространство

 

CIELUV-

цветовое координатное пространство

 

НЧ -

низкочастотный,

 

 

ПСШ -

пиковое отношение сигнал/шум,

 

 

СКО -

Среднее квадратическое отклонение,

 

CCIR -

МККР (International Radiocommunication Consultative

 

Committee),

 

 

 

ГОСТ -

Государственный стандарт

 

 

1D -

одномерный,

 

 

 

2D -

двумерный,

 

 

 

3D -

трехмерный,

 

 

 

ОНР-

область неопределенности решения.

 

3

Предисловие

Компьютерная обработка изображений - одно из интенсивно развиваемых направлений исследования. Изложение материала предполагает знакомство студентов с основными цифровыми методами обработки и распознавания изображений, рассмотренными в учебном пособии [1]. Главная цель этого пособия - раскрыть методы компьютерной обработки изображений, связанные с формированием признаков объектов и анализом изображений. Многочисленные иллюстрации позволяют сделать изложение материала понятным и доступным как студентам, так и практикующим инженерам. Большое внимание уделено проблемам восприятия цветного изображения зрительной системы (ЗС) человека, сегментации изображений, описанию объектов, поскольку эти вопросы являются ключевыми при построении систем оптико - электронного преобразования сигналов. Все алгоритмы обработки описаны так, что они могут быть реализованы на компьютере. В пособии отсутствует описание конкретных пакетов программ, в которых можно выполнить эти алгоритмы. Выполнение может осуществляться, например, в системе MATLAB, доступной студентам и специалистам-практикам.

В компьютерных системах, когда получателем информации является человек, большое значение имеют методы оценки восприятия изображений. В первом разделе приведен краткий обзор морфологии и физиологии ЗС человека, акцентированный на тех ее особенностях, что важны для разработки методов обработки цветных цифровых изображений. Психофизические эксперименты дали нам большую часть знаний о ЗС человека. Для оценки экспериментальных данных определены четыре вида шкал: номинальные, порядковые, интервальные и пропорциональные шкалы. Рассмотрены методы измерения визуальной чувствительности к малым изменениям в стимуле. Показано, что результаты психофизических экспериментов зависят от методов получения информации от наблюдателя и многих факторов, обусловленных как физиологическими и психическими особенностями наблюдателя, так и условиями проведения эксперимента. В разделе 1 рассмотрены основные принципы базовой колориметрии. Показано, что для расширения базовой колориметрии до уровня эффективной спецификации цветового восприятия стимулов в широком диапазоне условий просмотра, необходимо учитывать данные, описывающие статус хроматической и световой адаптации; уровень фотометрической яркости; цвет фона; цвет окружения и др.

Создание моделей цифровых изображений, разработка некоторых методов обработки изображений, обработка результатов экспериментальных исследований требуют знания теории вероятностей и математической статистики. В разделе 2.1 дается основное представление о случайных величинах и распределениях. Приведены оценки моментов распределений. Большое внимание уделено нормальному закону распределения. Изложены

4

правила определения оценок и доверительных границ параметров нормального распределения.

Методы сегментации изображений представлены в разделе 2. Текстура является важной характеристикой изображения. Проблемы описания текстур, их анализа представлены в материале раздела 2.2, посвященного формированию признаков текстурных изображений.

Методам порогового ограничения для бинаризации изображений посвящен раздел 2.3. Рассмотрены методы анализа гистограмм, методы кластеризации, методы порогового ограничения, основанные на энтропии изображения и на подробии признаков.

Методам многопороговой обработки посвящен раздел 2.4. Рассмотрены метод стабильности моды, методы улучшения гистограмм, методы кластеризации.

Особое место отводится морфологии бинарных изображений, предназначенной для представления и описания свойств формы и структуры объектов. Рассмотрены методы морфологической сегментации в разделе 3.1. Раздел 3.2 посвящен морфологическим методам изменения областей путем утончения, утолщения, формирования скелетона и отсечения ложных ветвей.

Методы представления данных сегментации рассмотрены в разделе 4. Для сокращения пространства признаков вводится описание сегментированных областей изображения. Для компактного описания границ областей предназначены методы, рассмотренные в разделе 4.1. Методы описания областей рассмотрены в разделе 4.2.

Основные принципы распознавания образов, методология построения систем классификации изложены в разделе 5.

Мы стремились к тому, чтобы материал пособия позволил читателям ознакомиться с современными компьютерными методами формирования признаков объектов и анализа изображений и помог ориентироваться в большом мире книг по цифровым методам обработки информации.

5

1Методы оценки восприятия изображений

1.1Цвет. Основные положения

При обработке изображений очень важно понимать особенности работы ЗС человека, поскольку получателем информации во многих применениях является человек. Разработка адаптивных алгоритмов коррекции цветовых искажений, повышения насыщенности, сегментации на основе характеристик цветности и др. базируется на моделях цветового восприятия.

1.2Зрительная система человека

На рисунке 1.1 представлены основные элементы оптической системы человеческого глаза [2]. Глаз работает аналогично видеокамере. Роговица и хрусталик действуют совместно (подобно тому, как действуют вместе линзы объектива), фокусируя видимый мир на сетчатой оболочке глазного дна, которая подобна светочувствительному материалу.

Рисунок 1.1 Условная схема правого глаза человека

Роговица - это передняя внешняя прозрачная поверхность глазного яблока, через которую проникает свет. Выпуклая форма поверхности роговицы находится в непосредственном контакте с воздухом, обеспечивает наибольшее изменение коэффициента преломления в оптической системе глаза. Роговица не имеет кровеносных сосудов. Дефекты преломления, такие как близорукость, дальнозоркость или астигматизм, являются следствием изменений кривизны роговицы.

Хрусталик выполняет функцию аккомодации зрения и представляет собой двояковыпуклую линзу. Хрусталик имеет переменный коэффициент преломления: максимальный коэффициент преломления в центре и минимальный - на периферии. Это снижает вероятность аберраций, присущих всем простым оптическим системам.

6

Кривизна хрусталика регулируется т.н. цилиарными мышцами. Когда мы рассматриваем ближний объект, хрусталик становится «толстым», увеличивая тем самым свою оптическую силу и позволяя нам сфокусировать зрение на ближних объектах. Когда мы рассматриваем дальний объект, хрусталик «уплощается», теряя свою оптическую силу и приводя удаленные объекты к резкости.

При старении хрусталик становится менее эластичным, а к пятидесяти годам, как правило, теряет эластичность полностью, и наблюдатель уже не может сфокусировать зрение на ближних объектах. Наряду с отвердением хрусталика повышается его оптическая плотность. Хрусталик поглощает и рассеивает коротковолновую световую энергию (синий), и по мере его отвердения степень поглощения и рассеивания растет. То есть с годами хрусталик желтеет, и хотя благодаря различным механизмам хроматической адаптации мы не осознаем возрастных изменений, все же с возрастом мы начинаем смотреть на мир через желтый фильтр, который не только меняется с годами, но и сильно отличается от наблюдателя к наблюдателю.

Описанные эффекты активно проявляют себя в ситуациях, когда возникает необходимость выполнить экспертное цветовое сравнение или сравнение цвета вместе с другими наблюдателями, и особенно - при рассматривании пурпурных объектов, потому что старый хрусталик поглощает большую часть «синей» энергии, отраженной от пурпурного объекта, но нейтрален в отношении отраженной «красной» энергии. Поэтому пожилым наблюдателям (в отличие от молодых) объект представляется более красным.

Пространство между роговицей и хрусталиком заполнено жидкостью. Пространство между хрусталиком и сетчаткой заполнено стекловидным телом, которое также является жидкостью, но с большей вязкостью, подобной вязкости желатина. Давление обеих жидкостей слегка повышено относительно атмосферного, обеспечивая постоянство формы глазного яблока.

Радужная оболочка (радужка) представляет собой циркулярную мышцу, управляющую размером зрачка. Радужка пигментирована, благодаря чему у каждого из нас цвет глаз индивидуален и определяется концентрацией и распространенностью меланина внутри радужной оболочки.

Зрачок представляет собой отверстие в центре радужки (ирисову диафрагму), через которое освещается сетчатка. Диаметр зрачка зависит от уровня освещенности, но он может меняться не только от освещенности, но и от возбуждения, наркотического состояния и др. Зрачок устанавливает определенный уровень освещенности сетчатки, при изменении диаметра зрачка площадь зрачка может меняться примерно в 5 раз, соответственно изменяя освещенность сетчатки. Но одним только изменением диаметра зрачка невозможно объяснить адаптацию человеческого зрения к разным уровням освещенности, которые могут меняться в широком диапазоне - вплоть до 10 порядков.

7

Сетчатка - это светочувствительный слой сложной структуры, толщиной с папиросную бумагу, расположенный на задней внутренней поверхности глазного яблока, включающий в себя, наряду с другими, светочувствительные клетки - фоторецепторы.

Оптическое изображение, сформированное глазом, проецируется на сетчатку, которая обеспечивает начальную обработку сигнала и формирует «схему» его передачи в высшие отделы головного мозга. Фоторецепторы: палочки и колбочки, - служат для преобразования информации, представленной в оптическом изображении, в химические и электрические сигналы. Эти сигналы обрабатываются сетью нервных клеток сетчатки, а затем передаются в мозг по зрительному нерву.

Позади сетчатки находится пигментный эпителий - темный пигментный слой, который обеспечивает абсорбцию света, прошедшего через сетчатку, но не поглощенного фоторецепторами, тем самым предотвращая обратное рассеяние света через сетчатку, снижающее резкость и контраст воспринимаемого изображения.

Центральная ямка сетчатки (fovea retinae) - участок сетчатки, фовеацентрализ, в котором мы имеем наилучшее пространственное и цветовое зрение. Когда мы смотрим на объект, мы двигаем глазами так, чтобы изображение объекта попадало на центральную ямку. Центральная ямка занимает область с визуальным угловым размером, равным примерно 1,5° в центре поля зрения. Для сравнения, размер ногтя большого пальца кисти вытянутой руки примерно равен 1° визуального угла.

Центральная ямка защищена желтым фильтром, называемым макула (желтое пятно), который защищает ее от воздействия интенсивного коротковолнового излучения. Оптические плотности макулярного пигмента различны у разных наблюдателей. Хрусталик и макула – это желтые фильтры, влияющие на спектральные характеристики ЗС.

Зрительный нерв состоит из аксонов (исходящих отростков) ганглиозных клеток - клеток верхнего уровня нейронных процессов в сетчатке. Зрительный нерв состоит примерно из 1 млн волокон, передающих информацию примерно от 130 млн фоторецепторов. Таким образом, имеет место явное сжатие визуального сигнала, происходящее до его передачи к более высоким уровням ЗС.

В зрительном нерве собирается информация со всего пространства, заполненного фоторецепторами. В каждом глазу есть небольшая область, в которой не может быть зрительного возбуждения: эта область носит название слепого пятна.

Пространственные структуры сетчатки определяют характер и природу т.н. зрительных полей.

На рис. 1.2 показана послойная структура сетчатки, которая включает в себя несколько слоев нервных клеток. Первый слой - фоторецепторы (палочки и колбочки). Вертикальная обработка сигнала идет через слои сетчатки по цепочке и может быть смоделирована путем отслеживания связей клеток друг с другом - фоторецепторов с биполярными клетками,

8

биполярных с ганглиозными (аксоны последних формируют зрительный нерв). На каждом из этих этапов сравниваются и объединяются сигналы от множества фоторецепторов. Так происходит потому, что весь массив фоторецепторов обеспечивает входной сигнал для множества биполярных клеток, а множество биполярных клеток обеспечивает входной сигнал для множества клеток ганглиозных.

Рисунок 1.2 Условная схема сетчатки глаза человека

Горизонтальные клетки обеспечивают латеральные (боковые) связи между фоторецепторами и биполярными клетками, а амакриновые клетки обеспечивают латеральные связи между биполярными и ганглиозными клетками.

Обработка информации, происходящая в клетках каждого типа, еще мало изучена, но важно отметить, что сигналы сетчатки, передаваемые в высшие отделы головного мозга, представляют некоторые комбинации сигналов, полученных от фоторецепторов.

Каждый синапс (участок контакта) между нервными клетками может эффективно выполнять математические операции (сложение, вычитание, умножение, деление) в совокупности с усилением сигнала, контролем его мощности и нелинейности. Таким образом, сеть клеток внутри сетчатки представляет собой сложнейший «графический компьютер», производящий сжатие информации в 130 раз без потери визуально значимых данных.

Свет на пути к фоторецепторам проходит через все нервные структуры сетчатки, но так как все клетки сетчатки прозрачны и находятся в фиксированном положении, а питание и удаление отходов, производимых фоторецепторами, осуществляется через заднюю поверхность глаза, они не видны наблюдателю.

Существует два типа фоторецепторов сетчатки: палочки и колбочки, которые получили названия благодаря своей форме. Палочки вытянуты, а

9

периферийные колбочки имеют скорее коническую форму. Морфологическая классификация фоторецепторов сетчатки создает некоторую путаницу, поскольку колбочки центральной ямки плотно упакованы и поэтому внешне схожи с палочками.

Более важным является функциональное отличие между данными типами клеток: при низких уровнях яркости (например, меньших l кд/м2) зрение обеспечивают только палочки, в то время как колбочки работают при более высоких уровнях яркости. Переход от палочкового (скотопического) зрения к колбочковому (фотопическому) обеспечивает работу ЗС в большом диапазоне уровней яркости: на высоких уровнях яркости (например, выше 100 кд/м2 ) палочки полностью насыщаются и функционируют только колбочки. На промежуточных уровнях яркости и палочки и колбочки функционируют совместно (мезопическое зрение).

Палочки и колбочки также существенно отличаются друг от друга по своим спектральным чувствительностям - рис. 1.3 а). Существует только один вид палочковых рецепторов, пик спектральной чувствительности которого находится в районе 510 нм, тогда как пики спектральной чувствительности трех видов колбочковых рецепторов приходятся на разные участки видимого спектра.

Рисунок 1.3. а) Нормированные спектральные чувствительности L-, М- и S- колбочек; б) нормированные МКО-функции спектральной световой эффективности для скотопического - V (λ )- и фотопического -V (λ )зрения.

Три типа колбочек названы как L-, М- и S-колбочками, что отражает их суть: названия даны в соответствии с длинноволновой (Long-wavelength),

средневолновой (Middle-wavelength) и коротковолновой (Short-wavelength)

чувствительностями колбочек. Иногда колбочки обозначают иными символами: RGB, по ассоциации с чувствительностью к красному, зеленому и синему. Спектральные чувствительности трех типов колбочек накладываются друг на друга. Принцип работы некоторых устройств

10