- •(Конспект лекций)
- •Содержание
- •3 Сосудистая оболочка; 4 радужная оболочка; 5 сетчатка;
- •6 Зрительный нерв; 7 центральная ямка (макула?); 8 хрусталик;
- •9 Слепое пятно; 10 зрачок; 11 стекловидное тело.
- •Квантование изображений
- •2.2. Типы представления изображений
- •2.3. Пиксели, разрешение, размер изображения
- •2.4. Цветовая глубина
- •2.5. Типы изображений
- •2.6. Размер растровых изображений
- •2.7. Форматы данных
- •Распространенные форматы файлов растровой графики
- •Файлы bmp
- •Файлы pcx
- •Файлы tiff
- •Файлы gif
- •Файлы png
- •Файлы jpeg
- •Распространенные форматы файлов растровой графики
- •3.1. Улучшение визуального качества изображений путем поэлементного преобразования
- •3.2. Линейное контрастирование изображения
- •3.3. Соляризация изображения
- •3.4. Препарирование изображения
- •3.5. Преобразование гистограмм, эквализация
- •3.6. Применение табличного метода при поэлементных преобразованиях изображений
- •4.1. Введение в Фурье-преобразование
- •4.2. Двумерное дискретное преобразование Фурье
- •5.1. Оптимальная линейная фильтрация. Уравнение Винера-Хопфа
- •5.2. Масочная (оконная) фильтрация изображений
- •Влияние размера выборки
- •5.3. Медианная фильтрация
- •Сравнение алгоритмов фильтрации
- •6.1. Сегментация изображений
- •6.1.1. Основные принципы сегментации изображений
- •6.1.2. Пороговое ограничение
- •6.1.3. Центроидное связывание
- •6.1.4. Алгоритмы слияния-расщепления
- •6.1.5. Алгоритмы разметки точек смешанного типа
- •6.1.6. Раскраска изображений
- •6.1.7. Сегментация путем выделения границ
- •6.1.8. Подавления шумов
- •6.2. Формализация задач распознавания изображений
- •6.2.1. Распознавание с помощью инвариантных признаков
- •6.2.2. Корреляционные алгоритмы распознавания
- •6.2.3. Распознавание с помощью нормализации
- •7.1. Преобразование изображений – преобразование Хока
- •7.2. Математическая морфология и обработка изображений
- •8.1. Основы цветного зрения
- •8.2. Цветовые модели
- •8.3. Основы цветной печати (цветоделение)
- •Вельтмандер п.В.Учебное пособие "Архитектуры графических систем. Машинная графика" Книга 2
- •Роуз а. Зрение человека и электронное зрение./ Перевод с английского под редакцией в.С.Вавилова. - м.: Мир, 1977
- •9.2. Методы сжатия изображений без потерь
- •9.3. Методы сжатия изображений с потерями
- •9.4. Фрактальное и вейвлетное сжатие изображений
- •9.1. Основы сжатия изображений
- •2N2n элементов, а во втором случае – нечетном косинусном преобразовании,
- •Матрицы Хаара
- •Преобразование Уолша – Адамара можно рассматривать как дискретный аналог непрерывного преобразования по базису, составленному из функций Уолша.
- •Результаты статистических исследований ортогональных преобразований
- •Информационное описание поиска и распознавания объектов
- •10.1. Управление процессами обработки и анализа изображений
- •10.2. Современная технология содержательного поиска в электронных коллекциях изображений
- •11. Обработка аудиоинформации
- •11.2. Цифровое представление звука Цифро-аналоговое и аналого-цифровое преобразование
- •11.3. Восприятие звука человеком
- •Клиппирование речевого сигнала
- •Избыточность речевого сигнала. Вокодер
- •Более сложные методы сжатия
- •Некоторые характеристики технологии mpeg
- •Алгоритм кодирования mpeg
- •Уровни mpeg
- •Intensity stereo coding – в высокочастотных подполосах кодируется суммированный из двух каналов сигнал вместо различных сигналов левого и правого каналов.
- •Технология mp3
- •TwinVq-кодирование
- •Сравнение звуковых форматов
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.5. Классификация речевых систем
- •12.6. РЕчевые технологии
- •Рекомендуемая литература Учебная и методическая литература
- •Другие виды литературы
6.2.2. Корреляционные алгоритмы распознавания
Выше проанализированы корреляционные процедуры в задачах сегментации, которые при наличии информации об эталоне можно применять и для распознавания в условиях действия помех и преобразований.
Рассмотрим задачу распознавания входных изображений, соответствующих фиксированному эталону. Применение инвариантных признаков может не привести к окончательному решению задач. Пусть В0 – эталонное изображение с носителем Е в поле зрения D; В1, В2, ..., Вт – набор входных изображений. В условиях действия группы преобразований G проверка эквивалентности изображений В0 и Bi равносильна сравнению изображений gB0 и Bi при всевозможных элементах группы g G.
Через Еg обозначим область, полученную из области Е преобразованием g. В зависимости от вида группы G области Е и Eg могут отличаться координатами центра, площадью, ориентацией и другими параметрами. Пусть g (В0, Bi) – мера близости изображений В0 и Bi в области Еg. Для вычисления меры близости можно применить один из коэффициентов корреляции.
Следует заметить, что не при всех g G функция g(B0, Bi) определена, поскольку область Eg может находиться за пределами поля зрения D. Поэтому для оптимизации функции g(В0, Bi) следует рассмотреть подмножество элементов группы GE G такое, что Eg D при любых g GE.
Физически GE соответствует множеству тех элементов g G, которые не выводят эталонное изображение за пределы поля зрения D. Например, если G – группа смещений Gc, то GE состоит из смещений с такими параметрами (l, m), для которых – r1 l r2 – r3 m r4. Ограничивающие положительные числа r1, r2, r3, r4 зависят от площади и ориентации области E и от координат центра Е в поле зрения.
Пусть * – максимальное
значение g
(B0, Bi)
на множестве g
GE.
Через
обозначим значение меры в идеальном
случае совпадения изображений (в
зависимости от алгоритма это будет 1
или 0). Сравнив величину | i*
–
|
с заранее выбранным порогом, можно
сделать вывод об эквивалентности или
неэквивалентности изображений В0
и Bi
относительно действия группы G.
Объем вычислений корреляционных алгоритмов зависит от области определения оптимизируемой функции g(B0, Bi). Если G – k-параметрическая группа, то можно считать, что функция g(B0, Bi) есть функция k-аргументов, определенная на множестве GE.
Специфика функции g(В0, Bi) не позволяет применить для ее оптимизации обычные быстродействующие алгоритмы типа градиентных. Наиболее распространенный способ оптимизации – непосредственный полный перебор значений функции по параметрам k множества GE. Такой перебор осуществим только на дискретном подмножестве параметров. Надежность распознавания зависит от того, насколько точно непрерывное множество значений параметров k приближено дискретным множеством их значений.
Для реальных изображений при многопараметрической группе G перебор столь велик, что непосредственное применение корреляционных алгоритмов невозможно в реальном масштабе времени. Для простейших групп, типа группы смещений, корреляционные алгоритмы применимы, но на порядок уступают признаковым алгоритмам по быстродействию.
Время реализации корреляционных процедур распознавания можно существенно уменьшить, если предварительно воспользоваться признаковыми методами. Тогда можно оптимизировать функции g(B0, Bi) не для всех i = 1, ..., m, а только для тех значений i, для которых признаки изображений В0 и Bi совпадают, т. е. для изображений, «подозрительных» на эквивалентность.
Отметим, что любая задача распознавания в условиях действия группы преобразований может быть сведена к задаче проверки эквивалентности фиксированных изображений В1, В2. Для ее решения можно воспользоваться и инвариантными признаками и корреляционными алгоритмами (для этого одно из изображений следует считать эталоном).
