- •(Конспект лекций)
- •Содержание
- •3 Сосудистая оболочка; 4 радужная оболочка; 5 сетчатка;
- •6 Зрительный нерв; 7 центральная ямка (макула?); 8 хрусталик;
- •9 Слепое пятно; 10 зрачок; 11 стекловидное тело.
- •Квантование изображений
- •2.2. Типы представления изображений
- •2.3. Пиксели, разрешение, размер изображения
- •2.4. Цветовая глубина
- •2.5. Типы изображений
- •2.6. Размер растровых изображений
- •2.7. Форматы данных
- •Распространенные форматы файлов растровой графики
- •Файлы bmp
- •Файлы pcx
- •Файлы tiff
- •Файлы gif
- •Файлы png
- •Файлы jpeg
- •Распространенные форматы файлов растровой графики
- •3.1. Улучшение визуального качества изображений путем поэлементного преобразования
- •3.2. Линейное контрастирование изображения
- •3.3. Соляризация изображения
- •3.4. Препарирование изображения
- •3.5. Преобразование гистограмм, эквализация
- •3.6. Применение табличного метода при поэлементных преобразованиях изображений
- •4.1. Введение в Фурье-преобразование
- •4.2. Двумерное дискретное преобразование Фурье
- •5.1. Оптимальная линейная фильтрация. Уравнение Винера-Хопфа
- •5.2. Масочная (оконная) фильтрация изображений
- •Влияние размера выборки
- •5.3. Медианная фильтрация
- •Сравнение алгоритмов фильтрации
- •6.1. Сегментация изображений
- •6.1.1. Основные принципы сегментации изображений
- •6.1.2. Пороговое ограничение
- •6.1.3. Центроидное связывание
- •6.1.4. Алгоритмы слияния-расщепления
- •6.1.5. Алгоритмы разметки точек смешанного типа
- •6.1.6. Раскраска изображений
- •6.1.7. Сегментация путем выделения границ
- •6.1.8. Подавления шумов
- •6.2. Формализация задач распознавания изображений
- •6.2.1. Распознавание с помощью инвариантных признаков
- •6.2.2. Корреляционные алгоритмы распознавания
- •6.2.3. Распознавание с помощью нормализации
- •7.1. Преобразование изображений – преобразование Хока
- •7.2. Математическая морфология и обработка изображений
- •8.1. Основы цветного зрения
- •8.2. Цветовые модели
- •8.3. Основы цветной печати (цветоделение)
- •Вельтмандер п.В.Учебное пособие "Архитектуры графических систем. Машинная графика" Книга 2
- •Роуз а. Зрение человека и электронное зрение./ Перевод с английского под редакцией в.С.Вавилова. - м.: Мир, 1977
- •9.2. Методы сжатия изображений без потерь
- •9.3. Методы сжатия изображений с потерями
- •9.4. Фрактальное и вейвлетное сжатие изображений
- •9.1. Основы сжатия изображений
- •2N2n элементов, а во втором случае – нечетном косинусном преобразовании,
- •Матрицы Хаара
- •Преобразование Уолша – Адамара можно рассматривать как дискретный аналог непрерывного преобразования по базису, составленному из функций Уолша.
- •Результаты статистических исследований ортогональных преобразований
- •Информационное описание поиска и распознавания объектов
- •10.1. Управление процессами обработки и анализа изображений
- •10.2. Современная технология содержательного поиска в электронных коллекциях изображений
- •11. Обработка аудиоинформации
- •11.2. Цифровое представление звука Цифро-аналоговое и аналого-цифровое преобразование
- •11.3. Восприятие звука человеком
- •Клиппирование речевого сигнала
- •Избыточность речевого сигнала. Вокодер
- •Более сложные методы сжатия
- •Некоторые характеристики технологии mpeg
- •Алгоритм кодирования mpeg
- •Уровни mpeg
- •Intensity stereo coding – в высокочастотных подполосах кодируется суммированный из двух каналов сигнал вместо различных сигналов левого и правого каналов.
- •Технология mp3
- •TwinVq-кодирование
- •Сравнение звуковых форматов
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.5. Классификация речевых систем
- •12.6. РЕчевые технологии
- •Рекомендуемая литература Учебная и методическая литература
- •Другие виды литературы
6.2.3. Распознавание с помощью нормализации
В условиях действия групп преобразований важное значение приобретает метод распознавания с помощью нормализации. Одновременное использование инвариантных признаков, корреляционных процедур и нормализации изображений существенно расширяет возможности распознавания изображений.
Суть нормализации заключается в выборе представителя каждого класса эквивалентности относительно действия заданной группы G. Обычно невозможно указать явное разбиение множества М входных сигналов на классы эквивалентности. Однако при известной группе G можно явно описать множество М0 М, состоящее из представителей каждого класса. Точнее, множество М0 должно удовлетворять двум требованиям: для каждого класса эквивалентности должно быть изображение из М0, принадлежащее этому классу; такое изображение должно быть единственным.
Рассмотрим простейший пример, когда G = Gc – группа смещений, М – множество произвольных входных изображений. Указанным требованиям удовлетворяет множество М0, состоящее из изображений, центр носителя которых совпадает с центром поля зрения (т. е. центрированные изображения). Действительно, подходящим смещением любое изображение можно центрировать, значит, множество М0 пересекается с каждым классом эквивалентности. Очевидно и выполнение требования единственности.
Множество М0 можно построить и для других групп преобразований. Однако информация об этом множестве сама по себе мало что дает – необходимо наличие правила, по которому устанавливается соответствие между произвольным входным изображением В и эквивалентным ему изображением из М0. Изображение из множества М0, эквивалентное изображению В, назовем нормализованным. Оператор F(В), переводящий входное изображение в нормализованные, называется нормализатором. Для нахождения нормализаторов разработаны специальные методы.
Вернемся к группе GС. Пусть М0 – множество центрированных изображений. Нормализатором в этом случае будет оператор центрирования входных изображений, обеспечивающий автоматическое совмещение центра носителя изображения с началом координат.
Допустим, что множество М0 и нормализатор F: М М0 известны. Покажем, как с помощью такой информации можно решить задачу об эквивалентности изображений – базовую для различных задач распознавания.
При отсутствии помех (идеальный случай) вопрос об эквивалентности двух изображений B1, B2 решается просто: изображения эквивалентны, если нормализованные изображения совпадают (F(B1) = F (B2)) и неэквивалентны в противном случае. Это утверждение вытекает из свойств множества MQ. При наличии случайных помех необходимым и достаточным условием эквивалентности изображений может служить неравенство |(F(B1), F(B2)) - *| < , где – некоторый коэффициент корреляции, * – его максимально возможное значение, – выбранный порог, определяемый по априорно известному уровню помех.
Отсюда ясно, как использовать множество М0 и нормализатор F для решения задачи распознавания в условиях действия групп. Рассмотрим более сложную задачу классификации входных изображений B1,..., Вт – разбиение этого множества на группы из эквивалентных изображений относительно действия заданной группы преобразований. Информация об эталонах в этой задаче вообще отсутствует.
Для ее решения применим оператор
нормализации F к
каждому входному изображению:
,...,
.
Полученные изображения
,...,
принадлежат в случае отсутствия помех
множеству М0. В первую
группу эквивалентных изображений
отнесем входное изображение В1
и все изображения Bj
такие, что
=
.
Возьмем теперь изображение Br,
не вошедшее в первую группу, и все
изображения Bi
такие, что
=
.
Они в совокупности составят второй
класс эквивалентности. Продолжая эту
процедуру до тех пор, пока все входные
изображения не будут исчерпаны, получим
разбиение на классы эквивалентности.
В случае помех необходимо ввести необходимые пороги и заменить равенство нормализованных изображений оценкой на близость коэффициента корреляции между ними.
Таким образом, нормализация является качественно иным способом решения задач распознавания.
Нахождение нормализованных изображений обычно требует больше вычислительных затрат, чем определение признаков изображения. Однако корреляция существенно расширяет круг задач, в которых возможно надежное распознавание в реальном масштабе времени.
Рис. 6.17. Распознавание в условиях геометрических преобразований:
а – эталонное изображение; б, в, г, д – входные;
///// – область носителя изображения
Метод нормализации при распознавании занимает промежуточное место между корреляционными и признаковыми алгоритмами как по помехозащищенности, так и по быстродействию. В отличие от перехода в пространство признаков при нормализации изображение не «теряется», а только замещается изображением того же класса эквивалентности. В то же время, в отличие от корреляционных алгоритмов, кроме входного изображения рассматривается еще только одно – нормализованное.
Применение для распознавания одних только методов нормализации неэффективно. Оптимальным является их сочетание с методами, основанными на переходе в пространство признаков, причем первыми, как правило, должны применяться именно признаковые методы. Приведем простейший пример. Необходимо найти изображения, эквивалентные эталону относительно действия группы смещений (рис. 6.17). Для решения этой задачи вначале используем признак – площадь носителя изображения. Вычислив признаки эталонного и входных изображений, можно сразу отбросить изображения г, д. В то же время площади носителей изображений на рис. 6.17, а, б, в совпадают.
Для окончательного решения задачи распознавания применим нормализатор центрирования. Эталон и нормализованное изображение, соответствующее рис. 6.17. в, совпадут, в отличие от центрированного изображения, приведенного на рис. 6.17. б. Таким образом, изображение на рис. 6.17. в – единственное, эквивалентное эталону. На практике встречаются и гораздо более сложные примеры, где целесообразно сочетание методов нормализации с признаковыми и корреляционными.
Таким образом, хотя процедура нормализации требует построения специального множества М0 и оператора F: М М0, для этого необходима только информация о действующей на множестве изображений группы и о самом множестве входных сигналов безотносительно к их конкретному виду.
При создании систем технического зрения (СТЗ) возникает ряд трудностей и проблем:
Изображения предъявляются на сложном фоне.
Изображения эталона и входные изображения отличаются положением в поле зрения.
Входные изображения не совпадают с эталонами за счет случайных помех.
Отличия входных и эталонных изображений возникает за счет изменения освещенности, подсветки, локальных помех.
Эталоны и изображения могут отличать геометрические преобразования, включая такие сложные как аффинные и проективные.
Для решения задачи в целом и на отдельных ее этапах применяются различные методы.
Классификацию основных методов обработки и распознавания СТЗ изображений приведены на схеме, где указаны основные процедуры и методы обработки от начального этапа восприятия поля зрения посредством датчиков, например, телекамеры до конечного, которым является распознавание.
Основные процедуры и методы распознавания изображений |
|
Операция предобработки применяется практически всегда после снятия информации с видеодатчика и преследует цель снижения помех на изображении, возникших в результате дискретизации и квантования, а также подавления внешних шумов. Как правило, это операции усреднения и выравнивания гистограмм.
Сегментация обычно понимается как процесс поиска однородных областей на изображении. Этот этап весьма трудный и в общем виде не алгоритмизированный до конца для произвольных изображений. Наиболее распространены методы сегментации, основанные на определении однородных яркостей (цветов) или однородностей типа текстур.
После сегментации возникают помехи в виде как разрозненных изменений изолированных элементов изображения, так и в виде искажений некоторых связных областей. На практике при борьбе с подобными помехами наибольшее распространение получили цифровые фильтры-маски и нелинейные фильтры типа медианных. При этом в случае сегментации путем выделения границ использование усредняющих фильтров-масок невозможно, так как границы при этом не подчеркиваются, а размываются. Для подчеркивания контуров применяются специальные операторы интегрального типа.
Распознавание - чаще всего конечный этап обработки, лежащий в основе процессов интерпретации и понимания. Входными для распознавания являются изображения, выделенные в результате сегментации и, частично, отреставрированные. Они отличаются от эталонных геометрическими и яркостными искажениями, а также сохранившимися шумами.
Для реальных задач распознавания применяются, в основном, четыре подхода, использующие методы: корреляционные, основанные на принятии решений по критерию близости с эталонами; признаковые и синтаксические - наименее трудоемкие и нормализации, занимающие промежуточное положение по объему вычислений.
Каждый из подходов в распознавании имеет право на существование. Более того, в рамках каждого подхода есть свои конкретные алгоритмы, имеющие определенную область применения, которая зависит от характера различий входных и эталонных изображений, от помеховой обстановки в поле зрения, требований к объемам вычислений и скорости принятия решений.
Грузман И.С., Киричук В.С., Косых В.П., Перетягин Г.И., Спектор А.А. Цифровая обработка изображений в информационных системах: Учебное пособие.- Новосибисрк: Изд-во НГТУ, 2002.
Ким Н.В. Обработка и анализ изображений в системами технического зрения: Учебное пособие. – М.: МАИ, 2001 – 164с.
Прэтт У. Цифровая обработка изображений. Кн.2. - М.: Мир, 1982.
По данной теме предлагается выполнение курсового проекта. Выбранную тематику необходимо согласовать с преподавателем и получить у него задание на проектирование.
Предлагается пройти тест для самоконтроля (Тест 6) на усвоение материала. А также ознакомится с программой (Программа 6 «Сегментация изображения») и выполнить предложенное в ней задание. Программа, написанная в среде Delphi, предназначена для получения навыков в создании программного кода по работе с графическими файлами и содержит исходный код с комментариями.
7. Границы и линии на изображении
7.1. Преобразование изображений – преобразование Хока
7.2. Математическая морфология и обработка изображений
Операции математической морфологии
НМ-преобразование
Морфологические операции в дискретном пространстве
Вычисление количества связных компонент
Утончение и утолщение
7.3. Ссылки и литература для дальнейшего изучения
7.4. Курсовое проектирование
7.5. Задание
В результате анализа сцен получаются описания объектов, расположенных на наблюдаемой сцене, и определяются взаимосвязи между ними. При этом в процессе анализа используются методы предварительной обработки изображений и распознавания образов.
В процессе анализа сцен, в зависимости от решаемых задач, реализуется множество процедур, в том числе, связанных с описанием линий и форм.
Выделение линий на изображениях во многих случаях удобно проводить на основе преобразований Хока (Hough).
