- •(Конспект лекций)
- •Содержание
- •3 Сосудистая оболочка; 4 радужная оболочка; 5 сетчатка;
- •6 Зрительный нерв; 7 центральная ямка (макула?); 8 хрусталик;
- •9 Слепое пятно; 10 зрачок; 11 стекловидное тело.
- •Квантование изображений
- •2.2. Типы представления изображений
- •2.3. Пиксели, разрешение, размер изображения
- •2.4. Цветовая глубина
- •2.5. Типы изображений
- •2.6. Размер растровых изображений
- •2.7. Форматы данных
- •Распространенные форматы файлов растровой графики
- •Файлы bmp
- •Файлы pcx
- •Файлы tiff
- •Файлы gif
- •Файлы png
- •Файлы jpeg
- •Распространенные форматы файлов растровой графики
- •3.1. Улучшение визуального качества изображений путем поэлементного преобразования
- •3.2. Линейное контрастирование изображения
- •3.3. Соляризация изображения
- •3.4. Препарирование изображения
- •3.5. Преобразование гистограмм, эквализация
- •3.6. Применение табличного метода при поэлементных преобразованиях изображений
- •4.1. Введение в Фурье-преобразование
- •4.2. Двумерное дискретное преобразование Фурье
- •5.1. Оптимальная линейная фильтрация. Уравнение Винера-Хопфа
- •5.2. Масочная (оконная) фильтрация изображений
- •Влияние размера выборки
- •5.3. Медианная фильтрация
- •Сравнение алгоритмов фильтрации
- •6.1. Сегментация изображений
- •6.1.1. Основные принципы сегментации изображений
- •6.1.2. Пороговое ограничение
- •6.1.3. Центроидное связывание
- •6.1.4. Алгоритмы слияния-расщепления
- •6.1.5. Алгоритмы разметки точек смешанного типа
- •6.1.6. Раскраска изображений
- •6.1.7. Сегментация путем выделения границ
- •6.1.8. Подавления шумов
- •6.2. Формализация задач распознавания изображений
- •6.2.1. Распознавание с помощью инвариантных признаков
- •6.2.2. Корреляционные алгоритмы распознавания
- •6.2.3. Распознавание с помощью нормализации
- •7.1. Преобразование изображений – преобразование Хока
- •7.2. Математическая морфология и обработка изображений
- •8.1. Основы цветного зрения
- •8.2. Цветовые модели
- •8.3. Основы цветной печати (цветоделение)
- •Вельтмандер п.В.Учебное пособие "Архитектуры графических систем. Машинная графика" Книга 2
- •Роуз а. Зрение человека и электронное зрение./ Перевод с английского под редакцией в.С.Вавилова. - м.: Мир, 1977
- •9.2. Методы сжатия изображений без потерь
- •9.3. Методы сжатия изображений с потерями
- •9.4. Фрактальное и вейвлетное сжатие изображений
- •9.1. Основы сжатия изображений
- •2N2n элементов, а во втором случае – нечетном косинусном преобразовании,
- •Матрицы Хаара
- •Преобразование Уолша – Адамара можно рассматривать как дискретный аналог непрерывного преобразования по базису, составленному из функций Уолша.
- •Результаты статистических исследований ортогональных преобразований
- •Информационное описание поиска и распознавания объектов
- •10.1. Управление процессами обработки и анализа изображений
- •10.2. Современная технология содержательного поиска в электронных коллекциях изображений
- •11. Обработка аудиоинформации
- •11.2. Цифровое представление звука Цифро-аналоговое и аналого-цифровое преобразование
- •11.3. Восприятие звука человеком
- •Клиппирование речевого сигнала
- •Избыточность речевого сигнала. Вокодер
- •Более сложные методы сжатия
- •Некоторые характеристики технологии mpeg
- •Алгоритм кодирования mpeg
- •Уровни mpeg
- •Intensity stereo coding – в высокочастотных подполосах кодируется суммированный из двух каналов сигнал вместо различных сигналов левого и правого каналов.
- •Технология mp3
- •TwinVq-кодирование
- •Сравнение звуковых форматов
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.5. Классификация речевых систем
- •12.6. РЕчевые технологии
- •Рекомендуемая литература Учебная и методическая литература
- •Другие виды литературы
6.1.5. Алгоритмы разметки точек смешанного типа
Ранее были рассмотрены два принципиально различных метода разметки точек: порогового ограничения и метод наращивания областей. В конкретных условиях часто имеет смысл частично применять алгоритмы как одного, так и другого подходов. Проведем анализ некоторых возможностей в этом направлении.
Как было отмечено выше полная сегментация методом порогового отсечения возможна лишь при определенных условиях, накладываемых на интервалы изменения яркости в точках объектов и фона. Эти условия на практике выполняются редко, так что пороговым отсечением чаще можно добиться грубой или многозначной разметки точек. Для построения окончательной разметки необходимо пороговое отсечение дополнить локальным алгоритмом типа наращивания областей. Если пороговое отсечение дает грубую разметку, то окончательная сегментация осуществляется раскраской бинарного изображения, в котором черные точки соответствуют точкам области объектов. Остановимся подробнее на том случае, когда пороговым отсечением можно получить многозначную разметку точек. Пусть M – оператор многозначной разметки. В соответствии с используемыми обозначениями, M – правило, по которому каждой точке (i, j) сопоставляется подмножество M (i, j) множества индексов {1,..., s}, (i, j) – число, на единицу меньшее, чем число индексов множества M (i, j) (показатель неоднозначности разметки). Через D0 обозначим множество точек (i, j) для которых (i, j) = 0, т. е. разметка в точке (i, j) однозначная.
Очевидно, множество D0 имеет смысл выбрать в качестве множества стартовых точек для алгоритма центроидного связывания. Разметка точек D0 определена отображением M. Разметка остальных точек осуществляется тем же способом, что и при обычном применении алгоритмов центроидного связывания, c той лишь разницей, что учитывается информация о построенном многозначном отображении M.
Следует отметить, что информация о многозначной разметке существенно повышает как надежность, так и быстродействие алгоритма центроидного связывания.
Указанный способ комбинирования различных методов разметки эффективен, если имеется некоторая информация о яркости объектов в поле зрения D. Можно привести ряд других способов комбинирования алгоритмов порогового ограничения и алгоритмов наращивания областей, в том числе таких, когда первыми применяются алгоритмы наращивания областей. С помощью алгоритма cлияния-расщепления удается получить достаточно однородную по яркости область Q D причем площадь Q сравнима с площадью D. Если известно, что в изображении преобладает фон, то информацию о яркости точек Q можно преобразовать в информацию, необходимую для реализации метода порогового ограничения, чтобы получить грубую сегментацию. Таким образом, указанный подход заключается в применении трех алгоритмов – сначала локального алгоритма слияния-расщепления, затем глобального алгоритма порогового ограничения и, наконец, локального алгоритма раскраски.
Другое применение локальных алгоритмов для повышения эффективности метода порогового ограничения заключается в «локальном» анализе гистограммы. Изображение в поле зрения D разбивается на фрагменты, для каждого из фрагментов строится своя гистограмма и выбирается порог, разделяющий яркости объектов и фона. Пусть (i1, j1), ..., (i, j) – центры фрагментов. Построим функцию Т(i, j), определяя ее в точках (ik, jk), k = 1,…, значениями найденных порогов, а в остальных точках (i, j) D – с помощью двумерной интерполяции. Значения Т(i, j) могут при этом не совпадать даже в близких точках. После построения функции Т(i, j) алгоритм порогового ограничения совсем прост – точка (i, j) принадлежит области объектов в том и только в том случае, если ее яркость меньше Т(i, j) (или больше Т(i, j), когда фон темнее объектов).
Укажем еще один интересный прием, позволяющий повысить эффективность алгоритмов центроидного связывания с помощью информации о распределении яркости. Важно, что для его реализации не требуется никаких априорных сведений о соотношении яркостей объектов и фона.
Идея подхода заключается в анализе поведения специальной функции f(i, j, n). Пусть (i, j) D – фиксированная точка, и необходимо определить, относится она к фону или к области объектов (для грубой сегментации). Значение f(i, j, n) равно числу точек связной области, содержащей точку (i, j) для которых яркость не превышает n. Если (i, j) принадлежит области некоторого объекта, то f(i, j, n) как функция n носит ярко выраженный ступенчатый характер.
Рассмотрим распределение яркости на рис. 6.10. а. Зафиксируем точку (i, j) яркость в которой равна 7. Поскольку любое связное множество, содержащее точку (i, j), имеет точки с яркостью выше, чем 6, то f(i, j, n) = 0 при n 6. Связное множество, содержащее точку (i, j) и обладающее тем свойством, что яркость в его любой точке не выше 7, состоит, очевидно, из девяти точек, так что f(i, j, 7) = 9. Аналогично f(i, j, 8) = 18, f(i, j, 9) = 27, f(i, j, 10) = 36. Теперь ясно, что при любом n 10 связное множество, содержащее точку (i, j) состоит из всех точек, представленных на рис. 6.10. а, с ненулевой яркостью. Рост функции f(i, j, n) прекращается: f(i, j, n) = 36 при любом n 10 (рис. 6.10. б).
Рис. 10. Вид функции f(i, j, n) для модельного изображения
Для нахождения локального порога определяется значение n0, при котором прекращается резкий рост f(i, j, n). Зная n0 можно найти сразу всю область объекта, содержащего точку (i, j) – это связное множество точек, яркость в которых не превышает n0. Указанный алгоритм удачно сочетает достоинства локальных и глобальных методов при отсутствии дополнительной априорной информации, легко реализуется на практике в связи с простым алгоритмическим построением функции f(i, j, n).
Конечно, существуют и другие подходы для построения алгоритмов смешанного типа, однако приведенные алгоритмы, вероятно, наиболее перспективны в задачах, связанных с СТЗ роботов.
Основным критерием для выбора алгоритма сегментации является, в конечном счете, надежность, определяемая вероятностью правильной сегментации. Для данного класса изображений надежность зависит в первую очередь от правильности и полноты учета априорной информации. К сожалению, накоплено слишком мало опыта по сравнению алгоритмов на различных изображениях. Хотелось бы уметь производить разбиение класса входных изображений М на подклассы М = М1 U ... U Мk так, чтобы для подкласса Мj, j = 1, ..., k алгоритм с номером j (при некоторой нумерации) был оптимален по тому или иному критерию – надежности, времени реализации, объему требуемой памяти. Такое разбиение в настоящее время еще проблематично, и соответствующая идеология не разработана.
Кроме возможности объективной оценки алгоритмов существует еще субъективный подход, выражающий личную точку зрения ряда разработчиков, основанную на опыте и некоторых плохо формализуемых предпосылках. В рамках такого субъективного подхода перспективными можно считать двухэтапные алгоритмы, которые на первом шаге «устраняют» фон, а на втором шаге области идентифицируют объекты с помощью раскраски бинарного изображения. Это мнение основано на том, что алгоритмы раскраски бинарных изображений, вероятно, единственные алгоритмы сегментации, не основанные на эвристических соображениях.
