Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции Максимова.doc
Скачиваний:
10
Добавлен:
01.04.2025
Размер:
20.86 Mб
Скачать

6.2.3. Распознавание с помощью нормализации

В условиях действия групп преобразований важное значение приобретает метод распознавания с помощью нормализации. Одновременное использование инвариантных признаков, кор­реляционных процедур и нормализации изображений сущест­венно расширяет возможности распознавания изображений.

Суть нормализации заключается в выборе представителя каж­дого класса эквивалентности относительно действия заданной группы G. Обычно невозможно указать явное разбиение множе­ства М входных сигналов на классы эквивалентности. Однако при известной группе G можно явно описать множество М0 М, состоящее из представителей каждого класса. Точнее, множе­ство М0 должно удовлетворять двум требованиям: для каждого класса эквивалентности должно быть изображение из М0, при­надлежащее этому классу; такое изображение должно быть един­ственным.

Рассмотрим простейший пример, когда G = Gc – группа сме­щений, М – множество произвольных входных изображений. Указанным требованиям удовлетворяет множество М0, состоящее из изображений, центр носителя которых совпадает с центром поля зрения (т. е. центрированные изображения). Действительно, подходящим смещением любое изображение можно центрировать, значит, множество М0 пересекается с каждым классом эквивалент­ности. Очевидно и выполнение требования единственности.

Множество М0 можно построить и для других групп преобра­зований. Однако информация об этом множестве сама по себе мало что дает – необходимо наличие правила, по которому устанавли­вается соответствие между произвольным входным изображением В и эквивалентным ему изображением из М0. Изображение из мно­жества М0, эквивалентное изображению В, назовем нормализован­ным. Оператор F(В), переводящий входное изображение в нормализованные, называется нормализатором. Для нахождения нормализаторов разработаны специальные методы.

Вернемся к группе GС. Пусть М0 – множество центрирован­ных изображений. Нормализатором в этом случае будет опера­тор центрирования входных изображений, обеспечивающий авто­матическое совмещение центра носителя изображения с началом координат.

Допустим, что множество М0 и нормализатор F: М М0 известны. Покажем, как с помощью такой информации можно ре­шить задачу об эквивалентности изображений – базовую для различных задач распознавания.

При отсутствии помех (идеальный случай) вопрос об эквива­лентности двух изображений B1, B2 решается просто: изображения эквивалентны, если нормализованные изображения совпадают (F(B1) = F (B2)) и неэквивалентны в противном случае. Это ут­верждение вытекает из свойств множества MQ. При наличии слу­чайных помех необходимым и достаточным условием эквивалент­ности изображений может служить неравенство |(F(B1), F(B2)) - *| < , где – некоторый коэффициент корреляции, * – его максимально возможное значение,  – выбранный по­рог, определяемый по априорно известному уровню помех.

Отсюда ясно, как использовать множество М0 и нормализа­тор F для решения задачи распознавания в условиях действия групп. Рассмотрим более сложную задачу классификации вход­ных изображений B1,..., Вт – разбиение этого множества на группы из эквивалентных изображений относительно действия заданной группы преобразований. Информация об эталонах в этой задаче вообще отсутствует.

Для ее решения применим оператор нормализации F к каж­дому входному изображению: ,..., . Полученные изображения ,..., принадлежат в случае отсутствия помех множеству М0. В первую группу эквива­лентных изображений отнесем входное изображение В1 и все изображения Bj такие, что = . Возьмем теперь изображе­ние Br, не вошедшее в первую группу, и все изображения Bi такие, что = . Они в совокупности составят второй класс эквивалентности. Продолжая эту процедуру до тех пор, пока все входные изображения не будут исчерпаны, получим разбиение на классы эквивалентности.

В случае помех необходимо ввести необходимые пороги и за­менить равенство нормализованных изображений оценкой на бли­зость коэффициента корреляции между ними.

Таким образом, нормализация является качественно иным спо­собом решения задач распознавания.

Нахождение нормализованных изображений обычно требует больше вычислительных затрат, чем определение признаков изо­бражения. Однако корреляция существенно расширяет круг задач, в которых возможно надежное распознавание в реальном масштабе времени.

Рис. 6.17. Распознавание в условиях геометрических преобразований:

а – эталонное изображение; б, в, г, д – входные;

///// – область носителя изображения

Метод нормализации при распознавании занимает промежуточ­ное место между корреляционными и признаковыми алгоритмами как по помехозащищенности, так и по быстродействию. В отли­чие от перехода в пространство признаков при нормализации изображение не «теряется», а только замещается изображением того же класса эквивалентности. В то же время, в отличие от кор­реляционных алгоритмов, кроме входного изображения рассма­тривается еще только одно – нормализованное.

Применение для распознавания одних только методов норма­лизации неэффективно. Оптимальным является их сочетание с ме­тодами, основанными на переходе в пространство признаков, при­чем первыми, как правило, должны применяться именно призна­ковые методы. Приведем простейший пример. Необходимо найти изображения, эквивалентные эталону относительно действия группы смещений (рис. 6.17). Для решения этой задачи вначале исполь­зуем признак – площадь носителя изображения. Вычислив при­знаки эталонного и входных изображений, можно сразу отбро­сить изображения г, д. В то же время площади носителей изобра­жений на рис. 6.17, а, б, в совпадают.

Для окончательного решения задачи распознавания приме­ним нормализатор центрирования. Эталон и нормализованное изображение, соответствующее рис. 6.17. в, совпадут, в отличие от центрированного изображения, приведенного на рис. 6.17. б. Та­ким образом, изображение на рис. 6.17. в – единственное, экви­валентное эталону. На практике встречаются и гораздо более сложные примеры, где целесообразно сочетание методов нормали­зации с признаковыми и корреляционными.

Таким образом, хотя процедура нормализации требует по­строения специального множества М0 и оператора F: М М0, для этого необходима только информация о действующей на мно­жестве изображений группы и о самом множестве входных сиг­налов безотносительно к их конкретному виду.

Frame26

При создании систем технического зрения (СТЗ) возникает ряд трудностей и проблем:

  1. Изображения предъявляются на сложном фоне.

  2. Изображения эталона и входные изображения отличаются положением в поле зрения.

  3. Входные изображения не совпадают с эталонами за счет случайных помех.

  4. Отличия входных и эталонных изображений возникает за счет изменения освещенности, подсветки, локальных помех.

  5. Эталоны и изображения могут отличать геометрические преобразования, включая такие сложные как аффинные и проективные.

Для решения задачи в целом и на отдельных ее этапах применяются различные методы.

Классификацию основных методов обработки и распознавания СТЗ изображений приведены на схеме, где указаны основные процедуры и методы обработки от начального этапа восприятия поля зрения посредством датчиков, например, телекамеры до конечного, которым является распознавание.

Основные процедуры и методы распознавания изображений

Операция предобработки применяется практически всегда после снятия информации с видеодатчика и преследует цель снижения помех на изображении, возникших в результате дискретизации и квантования, а также подавления внешних шумов. Как правило, это операции усреднения и выравнивания гистограмм.

Сегментация обычно понимается как процесс поиска однородных областей на изображении. Этот этап весьма трудный и в общем виде не алгоритмизированный до конца для произвольных изображений. Наиболее распространены методы сегментации, основанные на определении однородных яркостей (цветов) или однородностей типа текстур. 

После сегментации возникают помехи в виде как разрозненных изменений изолированных элементов изображения, так и в виде искажений некоторых связных областей. На практике при борьбе с подобными помехами наибольшее распространение получили цифровые фильтры-маски и нелинейные фильтры типа медианных. При этом в случае сегментации путем выделения границ использование усредняющих фильтров-масок невозможно, так как границы при этом не подчеркиваются, а размываются. Для подчеркивания контуров применяются специальные операторы интегрального типа.

Распознавание - чаще всего конечный этап обработки, лежащий в основе процессов интерпретации и понимания. Входными для распознавания являются изображения, выделенные в результате сегментации и, частично, отреставрированные. Они отличаются от эталонных геометрическими и яркостными искажениями, а также сохранившимися шумами.

Для реальных задач распознавания применяются, в основном, четыре подхода, использующие методы: корреляционные, основанные на принятии решений по критерию близости с эталонами; признаковые и синтаксические - наименее трудоемкие и нормализации, занимающие промежуточное положение по объему вычислений.

Каждый из подходов в распознавании имеет право на существование. Более того, в рамках каждого подхода есть свои конкретные алгоритмы, имеющие определенную область применения, которая зависит от характера различий входных и эталонных изображений, от помеховой обстановки в поле зрения, требований к объемам вычислений и скорости принятия решений.

Frame27

  1. Грузман И.С., Киричук В.С., Косых В.П., Перетягин Г.И., Спектор А.А. Цифровая обработка изображений в информационных системах: Учебное пособие.- Новосибисрк: Изд-во НГТУ, 2002.

  2. Ким Н.В. Обработка и анализ изображений в системами технического зрения: Учебное пособие. – М.: МАИ, 2001 – 164с.

  3. Прэтт У. Цифровая обработка изображений. Кн.2. - М.: Мир, 1982.

Frame28

По данной теме предлагается выполнение курсового проекта. Выбранную тематику необходимо согласовать с преподавателем и получить у него задание на проектирование.

Frame29

Предлагается пройти тест для самоконтроля (Тест 6) на усвоение материала. А также ознакомится с программой (Программа 6 «Сегментация изображения») и выполнить предложенное в ней задание. Программа, написанная в среде Delphi, предназначена для получения навыков в создании программного кода по работе с графическими файлами и содержит исходный код с комментариями.

Frame30

7. Границы и линии на изображении

7.1. Преобразование изображений – преобразование Хока

7.2. Математическая морфология и обработка изображений

Операции математической морфологии

НМ-преобразование

Морфологические операции в дискретном пространстве

Вычисление количества связных компонент

Утончение и утолщение

7.3. Ссылки и литература для дальнейшего изучения

7.4. Курсовое проектирование

7.5. Задание

В результате анализа сцен получаются описания объектов, расположенных на наблюдаемой сцене, и определяются взаимосвязи между ними. При этом в процессе анализа используются методы предварительной обработки изображений и распознавания образов.

В процессе анализа сцен, в зависимости от решаемых задач, реализуется множество процедур, в том числе, связанных с описанием линий и форм.

Выделение линий на изображениях во многих случаях удобно проводить на основе преобразований Хока (Hough).