- •(Конспект лекций)
- •Содержание
- •3 Сосудистая оболочка; 4 радужная оболочка; 5 сетчатка;
- •6 Зрительный нерв; 7 центральная ямка (макула?); 8 хрусталик;
- •9 Слепое пятно; 10 зрачок; 11 стекловидное тело.
- •Квантование изображений
- •2.2. Типы представления изображений
- •2.3. Пиксели, разрешение, размер изображения
- •2.4. Цветовая глубина
- •2.5. Типы изображений
- •2.6. Размер растровых изображений
- •2.7. Форматы данных
- •Распространенные форматы файлов растровой графики
- •Файлы bmp
- •Файлы pcx
- •Файлы tiff
- •Файлы gif
- •Файлы png
- •Файлы jpeg
- •Распространенные форматы файлов растровой графики
- •3.1. Улучшение визуального качества изображений путем поэлементного преобразования
- •3.2. Линейное контрастирование изображения
- •3.3. Соляризация изображения
- •3.4. Препарирование изображения
- •3.5. Преобразование гистограмм, эквализация
- •3.6. Применение табличного метода при поэлементных преобразованиях изображений
- •4.1. Введение в Фурье-преобразование
- •4.2. Двумерное дискретное преобразование Фурье
- •5.1. Оптимальная линейная фильтрация. Уравнение Винера-Хопфа
- •5.2. Масочная (оконная) фильтрация изображений
- •Влияние размера выборки
- •5.3. Медианная фильтрация
- •Сравнение алгоритмов фильтрации
- •6.1. Сегментация изображений
- •6.1.1. Основные принципы сегментации изображений
- •6.1.2. Пороговое ограничение
- •6.1.3. Центроидное связывание
- •6.1.4. Алгоритмы слияния-расщепления
- •6.1.5. Алгоритмы разметки точек смешанного типа
- •6.1.6. Раскраска изображений
- •6.1.7. Сегментация путем выделения границ
- •6.1.8. Подавления шумов
- •6.2. Формализация задач распознавания изображений
- •6.2.1. Распознавание с помощью инвариантных признаков
- •6.2.2. Корреляционные алгоритмы распознавания
- •6.2.3. Распознавание с помощью нормализации
- •7.1. Преобразование изображений – преобразование Хока
- •7.2. Математическая морфология и обработка изображений
- •8.1. Основы цветного зрения
- •8.2. Цветовые модели
- •8.3. Основы цветной печати (цветоделение)
- •Вельтмандер п.В.Учебное пособие "Архитектуры графических систем. Машинная графика" Книга 2
- •Роуз а. Зрение человека и электронное зрение./ Перевод с английского под редакцией в.С.Вавилова. - м.: Мир, 1977
- •9.2. Методы сжатия изображений без потерь
- •9.3. Методы сжатия изображений с потерями
- •9.4. Фрактальное и вейвлетное сжатие изображений
- •9.1. Основы сжатия изображений
- •2N2n элементов, а во втором случае – нечетном косинусном преобразовании,
- •Матрицы Хаара
- •Преобразование Уолша – Адамара можно рассматривать как дискретный аналог непрерывного преобразования по базису, составленному из функций Уолша.
- •Результаты статистических исследований ортогональных преобразований
- •Информационное описание поиска и распознавания объектов
- •10.1. Управление процессами обработки и анализа изображений
- •10.2. Современная технология содержательного поиска в электронных коллекциях изображений
- •11. Обработка аудиоинформации
- •11.2. Цифровое представление звука Цифро-аналоговое и аналого-цифровое преобразование
- •11.3. Восприятие звука человеком
- •Клиппирование речевого сигнала
- •Избыточность речевого сигнала. Вокодер
- •Более сложные методы сжатия
- •Некоторые характеристики технологии mpeg
- •Алгоритм кодирования mpeg
- •Уровни mpeg
- •Intensity stereo coding – в высокочастотных подполосах кодируется суммированный из двух каналов сигнал вместо различных сигналов левого и правого каналов.
- •Технология mp3
- •TwinVq-кодирование
- •Сравнение звуковых форматов
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.1. Проблемы, возникающие при распознавании речи
- •12.2. Обзор алгоритмов распознавания речи
- •12.3. Синтез речи
- •12.5. Классификация речевых систем
- •12.6. РЕчевые технологии
- •Рекомендуемая литература Учебная и методическая литература
- •Другие виды литературы
6.1.7. Сегментация путем выделения границ
Рассмотрим принципиально иной (по сравнению с методом разметки точек) способ сегментации – сегментацию путем выделения границ объектов. При таком способе сегментации объекты представляются их границами. Выделение границ объектов можно рассматривать и как самостоятельную практическую задачу, не связанную непосредственно с сегментацией. Границы – основа формирования различных признаков и грамматик при распознавании изображений. Выделению границ и анализу контуров посвящены многочисленные работы, однако не все из них находят применение в робототехнике. Ограничивающим критерием является объем вычислений.
Понятие границы объекта так же, как и понятие самого объекта, невозможно точно формализовать в терминах цифрового изображения В(i, j). Из эвристических соображений граничные точки ищут как точки резкого перепада функции яркости.
Рассмотрим непрерывную модель изображения. Для этого заменим растр D на прямоугольную область в плоскости (x, у) и определим изображение как функцию В (х, у). Для этого (абстрактного) изображения будем считать, что В (х, у) – дифференцируемая функция своих аргументов. Перепад яркости в точке (x0, у0) определяется в этом случае как норма градиента функции В (х, у) в точке (x0, y0), т. е. норма вектора
Норму вектора можно определить различными способами, например:
(6.14)
(6.15)
(6.16)
Однако в силу дискретности поля зрения D непосредственное вычисление В(х, у) невозможно. Чтобы воспользоваться дифференцированием для определения перепада яркости в точке, необходимо выбрать один из двух путей:
с помощью интерполяции перейти от функции В (i, j) к функции В (х, у), заданной в прямоугольной области плоскости (х, y), содержащей все точки растра D;
воспользоваться методами численного дифференцирования, т. е. дифференцирования таблично заданной функции.
Первый путь получил название метода функциональной аппроксимации. Он связан с большими вычислительными затратами и в задачах робототехники не получил большого распространения. Наиболее распространенным является второй путь, называемый градиентным методом, методом контрастирования, или методом пространственного дифференцирования. Существует еще один метод выделения границ, не связанный с дифференцированием, – метод высокочастотной фильтрации.
Алгоритмы пространственного дифференцирования основаны на вычислении градиента функции яркости В (i, j) с помощью одной из численных формул. Выбор формулы дискретного дифференцирования является главным отличием одного алгоритма от другого.
Вычислив в каждой точке (i, j) D норму градиента G (i, j), переходим от исходного изображения В (i, j) к «изображению градиентов». Изображение G (i, j) отличается от В (i, j) подчеркнутыми перепадами яркости. Переход В (i, j) G (i, j) обычно называют контрастированием изображения.
Контрастирование является только частью задачи выделения границ. Для выделения границ следует сформировать критерий принадлежности точки (i, j) границе области объектов. Для формирования такого критерия выбирают некоторый порог Т и точку (i, j) D считают граничной, если G (i, j) > Т. При отсутствии априорной информации для выбора порога Т его находят путем анализа гистограммы изображения G (i, j) примерно тем же путем, что и порог, разделяющий яркость объектов и фона.
Формулы численного дифференцирования для перехода к изображению G (i, j) могут быть самыми различными. Приведем их главные характеристики:
– число точек в окрестности точки (i0, j0), значения яркости в которых влияют на значение G(i0, j0);
– тот или иной вид нормы;
– вид дифференцирования (одномерное или двумерное).
Рис. 6.13. Окна размерами 33 (а) и 55 (б)
Остановимся подробнее на этих характеристиках. Определим «окно» с центром в точке (i, j) как множество точек (i, j) + (т, n), где – q m, n q, q – параметр окна, от которого зависит его размер [окно содержит (2q + 1)2 точек]. Окно с параметром q = 1 приведено на рис. 6.13. а, с параметром q = 2 – на рис. 6.13. б. Окно с центром в точке (i, j) = 1 и параметром q будем обозначать Oi, j (q).
Допустим, что для вычисления G (i, j) используется информация о яркости в некоторых точках окна Oi, j (q). Пусть R Oi, j (q) – множество этих точек. Если все точки из R принадлежат одной горизонтали, вертикали или диагонали растра, то контрастирование называется одномерным, в противном случае – двумерным.
В случае выбора нормы (6.16) имеет место линейное контрастирование, при норме (6.14) или (6.15) – нелинейное.
Значение G(i, j) может отличаться от приближенного значения В(i, I) на постоянный [не зависящий от точки (i, j)] множитель.
Для вычисления G (i, j) удобно ввести так называемые маски, каждая из которых связана с окном определенного размера. Маска Hq, соответствующая окну с параметром q, имеет вид матрицы размером (2q + 1) (2q + 1). Для каждого изображения В (i, j) и маски Hq определим свертку
.
Например, для окна 3x3 и маски
свертка
(B*H1)i,j = B(i - 1, j - 1) + B(i, j - 1) +
+ B(i + 1, j -1) – B(i - 1, j + 1) – B(i, j + 1) – B(i + 1, j + 1)
Большинство используемых вычислительных формул основаны на применении масок размером 33. Основными являются операторы Робертса, Собела, Превитта, Кирша, разностный оператор, имеющие общий вид:
G(i, j) = || d1(i, j), d2(i, j) || ;
d1(i, j) B*H1(1) ; d2(i, j) B*H1(2).
Эти маски отвечают двумерному дифференцированию. Для вычисления нормы ||d1(i, j), d2(i, j)|| можно применить любую из формул (6.14) – (6.16). Отметим, что маска, используемая для дифференцирования, должна обладать тем свойством, что сумма всех элементов соответствующей матрицы равна 0.
Рис. 6.14, Пример контрастирования:
а – исходное изображение; б, в – контрастированное изображение и его гистограмма (0, 10, 20 – яркость)
Точки (i, j) вблизи границы самого растра D могут быть такими, что окно Oi, j (k) выходит за пределы растра. В таких точках можно положить G (i, j) = 0.
Одномерное дифференцирование предполагает использование простейших масок. Примерами являются операторы
и др.
Используя указанные операторы двумерного дифференцирования, можно найти ориентацию контура. Если (i, j) – контурная точка, то угол ориентации контура равен arctg [d2(i, j) /d1 (i, j) ].
Использование масок размера большего, чем 3x3, существенно увеличивает объем вычислений, в то время как степень контрастирования возрастает незначительно. В связи с этим маски размером 33 являются наиболее распространенными.
Остановимся подробнее на вопросе о выборе порога Т, необходимого для выделения границ после перехода к изображению G(i, j). Допустим, что отсутствует информация, позволяющая выбрать значение Т до контрастирования. В этом случае следует подвергнуть анализу гистограмму изображения G (i, j). Она носит бимодальный характер (имеет кроме глобального ярко выраженный локальный максимум). Экстремумы гистограммы G (i, j) выделить проще, чем экстремумы гистограммы исходного изображения В (i, j). В идеальном случае при использовании, например, оператора Робертса получаем изображение G (i, j) (рис. 6.14). В качестве нормы выбрана сумма модулей, растр имеет размеры 8x8, объект 4x4.
Порог Т соответствует значению, расположенному между точками глобального и локального максимумов, при котором достигается минимум гистограммы G (i, j). Однако для реальных изображений результаты пороговой обработки градиентного поля часто неудовлетворительны – выделяемые края содержат разрывы, появляются ложные границы. Степень несоответствия полученной картины реальным границам во многом определяется качеством предварительной фильтрации – сглаживания помех. Поэтому часто алгоритмы выделения границ применяются параллельно с алгоритмами фильтрации. После выделения границ неотфильтрованные помехи проявляются более явно. Возникает необходимость применения специальных алгоритмов повторной обработки. После повторной обработки в случае нескольких объектов можно приступить к идентификации контуров.
Наиболее простые и распространенные операторы дифференцирования носят имена Робертса и Собела, которые подробно исследовали возможность их применения к реальным картинам.
Широкое распространение получили методы контрастирования, в которых используется оператор Лапласа. Они основаны на эвристическом предположении о том, что вблизи границы объектов наблюдается рост скорости возрастания функции яркости. Реально оператор Лапласа определяется вычислением приближенных оценок вторых производных, В наиболее распространенных случаях оператор Лапласа заменяется сверткой изображения с одной из масок:
или с помощью масок больших размеров, например
Алгоритмы, основанные на свертке с такими масками, не позволяют получить ориентацию контура. В этом случае необходимы некоторые модификации. Главным достоинством алгоритмов, основанных на вычислении оператора Лапласа, является простота их технической реализации.
Интересен подход, в котором набор 3 3 масок Н(1),..., Н(9) интерпретируется как базис пространства матриц. В каждой точке (i, j) D рассматривается область из девяти элементов разложения, соответствующая окну Оi, j . Ее можно рассматривать как матрицу В размером 3 3. Далее определяется близость В к подпространствам, натянутым на определенную часть базисных матриц. Степень близости определяется с помощью выбранного скалярного произведения в пространстве 3 3 матриц.
Полученная информация позволяет определить для контурной точки (i, j) не только ориентацию контура, но и другие его качественные характеристики. Особое значение придается возможности повторной обработки изображения для удаления ложных границ и восстановления ненайденных частей истинных.
Следует отметить, что в задачах промышленной робототехники на границах объектов обычно имеет место резкий перепад яркости, поэтому к ним применимы наиболее простые алгоритмы контрастирования. Более сложные алгоритмы контрастирования обычно носят специальный характер и применяются для сложных сцен.
Из алгоритмов, основанных на функциональной аппроксимации, следует выделить алгоритм Хюккеля, который в определенном смысле оптимален по помехоустойчивости в широком классе алгоритмов. Однако для его реализации требуется свыше 20 арифметических операций на один элемент изображения, что превышает трудоемкость основных методов пространственного дифференцирования, получивших распространение в робототехнике. Наряду с ними для выделения границ широко применяют простейшие логические операции. В ряде задач после выделения границ остается необходимость определить всю область объекта, т. е. указать правило, позволяющее узнать, лежит данная точка вне или внутри области с заданной границей. Такое правило формируется на основе теоремы Жордана: точка лежит внутри области тогда и только тогда, когда луч с началом в этой точке пересекает границу области нечетное число раз.
