- •(Конспект лекций)
- •Содержание
- •3 Сосудистая оболочка; 4 радужная оболочка; 5 сетчатка;
- •6 Зрительный нерв; 7 центральная ямка (макула?); 8 хрусталик;
- •9 Слепое пятно; 10 зрачок; 11 стекловидное тело.
- •Квантование изображений
- •2.2. Типы представления изображений
- •2.3. Пиксели, разрешение, размер изображения
- •2.4. Цветовая глубина
- •2.5. Типы изображений
- •2.6. Размер растровых изображений
- •2.7. Форматы данных
- •Распространенные форматы файлов растровой графики
- •Файлы bmp
- •Файлы pcx
- •Файлы tiff
- •Файлы gif
- •Файлы png
- •Файлы jpeg
- •Распространенные форматы файлов растровой графики
- •3.1. Улучшение визуального качества изображений путем поэлементного преобразования
- •3.2. Линейное контрастирование изображения
- •3.3. Соляризация изображения
- •3.4. Препарирование изображения
- •3.5. Преобразование гистограмм, эквализация
- •3.6. Применение табличного метода при поэлементных преобразованиях изображений
- •4.1. Введение в Фурье-преобразование
- •4.2. Двумерное дискретное преобразование Фурье
- •5.1. Оптимальная линейная фильтрация. Уравнение Винера-Хопфа
- •5.2. Масочная (оконная) фильтрация изображений
- •Влияние размера выборки
- •5.3. Медианная фильтрация
- •Сравнение алгоритмов фильтрации
- •6.1. Сегментация изображений
- •6.1.1. Основные принципы сегментации изображений
- •6.1.2. Пороговое ограничение
- •6.1.3. Центроидное связывание
- •6.1.4. Алгоритмы слияния-расщепления
- •6.1.5. Алгоритмы разметки точек смешанного типа
- •6.1.6. Раскраска изображений
- •6.1.7. Сегментация путем выделения границ
- •6.1.8. Подавления шумов
- •6.2. Формализация задач распознавания изображений
- •6.2.1. Распознавание с помощью инвариантных признаков
- •6.2.2. Корреляционные алгоритмы распознавания
- •6.2.3. Распознавание с помощью нормализации
- •7.1. Преобразование изображений – преобразование Хока
- •7.2. Математическая морфология и обработка изображений
- •8.1. Основы цветного зрения
- •8.2. Цветовые модели
- •8.3. Основы цветной печати (цветоделение)
- •Вельтмандер п.В.Учебное пособие "Архитектуры графических систем. Машинная графика" Книга 2
- •Роуз а. Зрение человека и электронное зрение./ Перевод с английского под редакцией в.С.Вавилова. - м.: Мир, 1977
- •9.2. Методы сжатия изображений без потерь
- •9.3. Методы сжатия изображений с потерями
- •9.4. Фрактальное и вейвлетное сжатие изображений
- •9.1. Основы сжатия изображений
- •2N2n элементов, а во втором случае – нечетном косинусном преобразовании,
- •Матрицы Хаара
- •Преобразование Уолша – Адамара можно рассматривать как дискретный аналог непрерывного преобразования по базису, составленному из функций Уолша.
- •Результаты статистических исследований ортогональных преобразований
- •Информационное описание поиска и распознавания объектов
- •10.1. Управление процессами обработки и анализа изображений
- •10.2. Современная технология содержательного поиска в электронных коллекциях изображений
- •11. Обработка аудиоинформации
- •11.2. Цифровое представление звука Цифро-аналоговое и аналого-цифровое преобразование
- •11.3. Восприятие звука человеком
- •Клиппирование речевого сигнала
- •Избыточность речевого сигнала. Вокодер
- •Более сложные методы сжатия
- •Некоторые характеристики технологии mpeg
- •Алгоритм кодирования mpeg
- •Уровни mpeg
- •Intensity stereo coding – в высокочастотных подполосах кодируется суммированный из двух каналов сигнал вместо различных сигналов левого и правого каналов.
- •Технология mp3
- •TwinVq-кодирование
- •Сравнение звуковых форматов
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.5. Классификация речевых систем
- •12.6. РЕчевые технологии
- •Рекомендуемая литература Учебная и методическая литература
- •Другие виды литературы
6.1.8. Подавления шумов
Шумы проявляются как разрозненные изменения изолированных элементов изображения. Подавление шумов имеет смысл проводить до применения алгоритмов разметки точек. В случае сегментации путем выделения границ предварительное подавление шумов неприменимо, так как границы не подчеркиваются, а размываются.
Разработаны различные методы борьбы с шумами. При известной спектральной характеристике шума оптимальными являются винеровские фильтры и их модификации. Однако на практике отсутствуют модели шумовых процессов и при реализации в СТЗ классических методов встречаются и различные другие трудности. Это большие объемы вычислений и габаритно-массовые показатели при аппаратурной реализации. Распространение получили сравнительно простые методы, основанные на усреднении и логических процедурах.
6.2. Формализация задач распознавания изображений
Предположим, что в результате сегментации получены изображения отдельных объектов H1,..., Hs. Необходимо установить соответствие между ними и эталонными изображениями W1,..., Wk (вообще говоря, ks).
В общем виде задачу распознавания можно рассматривать как задачу классификации, т. е. разбиения множества {Н1,...,Hs} на классы T1,..., Tk таким образом, чтобы из принадлежности HjTi следовало соответствие изображения Hj эталонному изображению Wi (i = 1, ..., s, i = 1, ..., k). При k > s отдельные классы могут быть «пустыми», т. е. не содержать изображений. В качестве частных случаев задачи классификации целесообразно рассмотреть следующие:
нахождение эталона, соответствующего данному входному изображению объекта (при этом s = 1, k > 1). Такая задача необходима, например, для определения типа детали, для оценки характеристик продукции при укладке в тару;
нахождение тех объектов, которые соответствуют фиксированному эталону (k = 1, s > 1). Такая задача необходима, например, для нахождения на рабочем столе деталей данного типа.
Остановимся подробнее на понятии соответствия изображения объекта Hi и эталона Wj. Определить понятие соответствия с помощью равенства Hi = Wj невозможно из-за неточной сегментации (ошибок в формировании изображения Hi) и ввиду геометрических или яркостных преобразований. Рассмотрим несколько идеализированную ситуацию, когда ошибки сегментации отсутствуют. Пусть при этом известна группа G, действие которой обусловливает геометрические трансформации и яркостные преобразования. Тогда соответствие изображений Hi и Wj можно определить следующим образом: изображение Hi соответствует эталонному изображению Wj тогда и только тогда, когда существует элемент g группы G, для которого gWj=Hi (заметим, что равносильное определение получится, если потребовать равенства hHi = Wj для некоторого элемента h G, тогда h = g-1).
Рис. 6.15. Разбиение на классы эквивалентности: 1-3 – номер класса
Тем самым, в условиях действия группы, эвристическое понятие «соответствие» можно заменить строгим математическим понятием эквивалентности изображений относительно действия заданной группы.
Будем говорить, что изображения В1, В2, принадлежащие входному множеству изображений М, эквивалентны относительно действия группы преобразований G, если найдется преобразование g G такое, что gB1 = B2. Поскольку G – группа, то справедливы следующие свойства:
Если изображение В1 эквивалентно изображению В2, то и изображение B2 эквивалентно изображению В1.
Если изображение В1 эквивалентно изображению В2, а изображение В2 эквивалентно изображению В3, то изображения В1 и В3 эквивалентны.
Каждое изображение эквивалентно самому себе.
Введем обозначение для эквивалентности: запись В1 В2 означает эквивалентность изображений В1, В2. Подчеркнем, что эквивалентность изображений определяется выбором группы преобразований, поэтому мы будем подчеркивать, относительно какой группы имеет место эквивалентность (или не эквивалентность), если это не будет автоматически ясно из изложения.
Разобьем множество входных изображений
М на классы эквивалентности
относительно указанного отношения
эквивалентности. Это означает
представление
,
где М
– подмножества М, состоящие
из эквивалентных изображений,
при ≠.
Параметр или
пробегает некоторое множество индексов.
Это множество конечно тогда и только
тогда, когда существует только конечное
число попарно неэквивалентных
изображений из М. Если множество М
конечно (М = {H1,...,Hn}),
то разбиение на классы эквивалентности
можно произвести конструктивно: в первое
подмножество включить все изображения
из М, эквивалентные первому изображению
В1, затем найти
изображение, не вошедшее в первое
подмножество, и т. д., пока не исчерпаем
все элементы М. В этом случае индекс
пробегает конечное
число значений (не превосходящее n).
На рис. 6.15 показано разбиение множества
из шести изображений на классы
эквивалентности относительно группы
Gc
m .
Множество входных сигналов М не обязательно конечно, но разбиение на классы эквивалентности существует всегда. Индекс , нумерующий подмножества М, может пробегать как конечное, так и бесконечное множество значений.
Эталонные изображения W1,...,Wk отвечают разным объектам и обычно не эквивалентны между собой. Поэтому при разбиении множества М на классы эквивалентных изображений они попадают в разные классы. Пусть Mj – класс эквивалентных изображений, содержащих эталон Wj (j = 1, ..., k). Указанную выше задачу классификации сформулируем следующим образом: для каждого j = 1, ..., k из множества входных изображений H1,..., Hs необходимо выделить подмножество, принадлежащее классу Mj. В частном случае нахождение объектов, соответствующих фиксированному эталону Wi, означает нахождение изображений, попавших в соответствующий класс эквивалентности Mi. Несколько отличается задача нахождения эталона, соответствующего данному входному изображению. Для ее решения возможны два пути. Первый путь – проверка включения Н Mi для входного изображения Н и набора индексов i = 1,..., k. Другая возможность – проверка включения Wi МH i = 1,..., k, где МH – класс эквивалентности, содержащий изображение H.
Следует заметить, что решение любой из указанных задач будет тривиальным, если удастся построить разбиение множества входных изображений на классы эквивалентности. Однако практически осуществить такое разбиение невозможно при бесконечном числе элементов множества М, а при конечном М процедура разбиения на классы возможна, но не рациональна. Независимо от мощности множества М существуют подходы, позволяющие построить разбиение на классы в «неявном виде», которого, однако, достаточно для решения задач распознавания изображений в условиях действия групп преобразований. Такие подходы основаны на построении инвариантных признаков, нормализующих операторов, а также на корреляционных принципах слежения.
Эти подходы неравноценны. Как правило, корреляционные методы, которые больше соответствуют описанному конструктивному разбиению, самые трудоемкие, но отличаются высокой помехозащищенностью. Методы, основанные на инвариантных признаках, реализуются достаточно просто, однако обладают невысокой достоверностью. Распознавание с применением нормализации занимает чаще всего промежуточное положение по объемам вычислений.
В настоящее время еще не сложилось универсального подхода к распознаванию изображений в условиях действия преобразований. Каждый из трех подходов обладает своими достоинствами и недостатками, а эффективность их применения зависит от сложности допустимых преобразований входных изображений, помеховой обстановки и требований к реализации. Более того, в рамках каждого подхода существуют конкретные методы и алгоритмы, обладающие рациональной областью применения. Чтобы обоснованно применять те или иные алгоритмы, в том числе иерархические и комбинированные, целесообразно произвести более детальный анализ каждого подхода.
