Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка_2010.doc
Скачиваний:
0
Добавлен:
07.02.2020
Размер:
23.45 Mб
Скачать

Вейвлет-анализ

Вейвлет-анализ в отличие от Фурье-анализа опирается на специальные «малые волны» (вейвлеты), ограниченные во времени (в случае изображений – в пространстве). Это позволяет в вейвлет-представлении сразу иметь и частотную и пространственную информацию. Вейвлет-анализ предназначен, прежде всего, для одновременного анализа изображения в нескольких масштабах, который получил название кратномасштабного анализа.

Пирамида изображений

Исторически первой структурой для анализа изображений в различных масштабах являлась так называемая пирамида изображений.

Изображение сцены может быть представлено в различных пространственных масштабах. При этом крупные детали сцены лучше видны на изображениях с мелким (грубым) разрешением. Мелкие детали сцены проявляются только на изображениях с высоким разрешением. Информативность участков изображения также зависит от разрешения. Изображение, представленное в нескольких масштабах в дальнейшем называется пирамидой.

Использование пирамидальной структуры данных в алгоритмах обработки изображений имеет две основные цели:

  • сокращение времени обработки изображений;

  • определение более точных начальных приближений для обработки нижних уровней по результатам обработки верхних уровней.

Принцип построения пирамиды изображений показан на рис. 3.3.29.

@Рис. 3.3.29. Принцип построения пирамиды изображений

Пирамида изображений представляет собой последовательность N изображений, причем каждое последующее изображение получается из предыдущего путем прореживания в два раза

Если позволяют вычислительное ресурсы, то для подавления высокочастотных шумов при прореживании рекомендуется перед прореживанием использовать низкочастотную линейную фильтрацию. В качестве ядра линейного фильтра обычно выбирают функцию Гаусса. В этом случае пирамида называется Гауссовой. Согласно теореме Котельникова сжатие в Гауссовой пирамиде происходит с минимальной потерей информации.

Изображение fN(x,y) представляет собой уменьшенную копию исходного изображения f1(x,y). Размер пикселя изображения уровня N равен

pN = 2N–1

Для координат пикселей изображений двух произвольных уровней пирамиды с номерами n и m справедливы следующие соотношения

2n–1xn = 2m–1xm , 2n–1yn = 2m–1ym

Помимо гауссовых пирамид изображений, часто рассматриваются также пирамиды лапласианов. Для построения такой пирамиды выполняется следующая операция: на каждом уровне Гауссовой пирамиды выше нулевого текущее изображение увеличивается в два раза по каждой координате (при этом его размер становится равен размеру изображения на предыдущем уровне пирамиды), после чего вычисляется его разность с предыдущим уровнем. Получившийся результат также представляет собой пирамиду изображений, эквивалентную результату применения оператора Лапласа соответствующего масштаба (см. описание оператора Лапласа ниже в разделе 3.4).

Вейвлет-преобразование

Вейвлет-преобразование это математический инструмент для иерархической декомпозиции функций. С помощью вейвлетов функции представляются как композиция грубой низкочастотной аппроксимации и уточняющих компонент (деталей), представляющих отсутствующие в аппроксимации элементы графика функции. Вне зависимости от вида функции (изображение, кривая, поверхность) вейвлет представляет функцию как иерархию уровней отображения с различной точностью детализации. В процедурах предобработки изображений, вейвлет преобразование используется для уменьшения уровня шумов, анализа текстур, выделения контуров объектов и сжатия изображений.

Для одномерного случая любая произвольная интегрируемая функция может быть представлена в виде линейной комбинации ортогональных функций

где φ – базисная функция, а ciвесовые коэффициенты.

Коэффициенты этого представления определяются из соотношения

,

где

есть квадрат нормы или энергия базисной функции φ(t).

Такое представление называется обобщенным рядом Фурье. Обобщенный ряд Фурье при заданной системе базисных функций и конечном числе слагаемых N обеспечивает наилучший синтез по критерию минимума среднеквадратической ошибки. Так как базисные функции в разложении фиксированы, то вся информация о функции f(x) содержится в весовых коэффициентах.

В своей простейшей форме базисные функции могут быть представлены как смещённые вдоль пространственной или временной оси единичные импульсные функции. Такое отображение даёт представление о локальных (пространственных или временных) параметрах функции. Если в качестве базисной функции выбрана синусоида, то получается известное преобразование Фурье – дающее информацию о поведении частотных (спектральных) компонент функции f(x). Однако во многих приложениях, включая обработку изображений, необходимо одновременно иметь информацию и о пространственных и спектральных характеристиках функции f(x).

Вейвлет преобразование сигнала – это его представление в виде обобщенного ряда Фурье или интеграла Фурье по системе базисных функций, локализованных как в пространственной, так и в частотной областях. Примером такой базисной функции может служить вейвлет Хаара, который определяется выражением

Графически вейвлет Хаара представляется следующим образом (рис. 3.3.30):

@Рис. 3.3.30. Вейвлет Хаара

Однако пространственные (временные) и частотные характеристики не могут быть одновременно измерены со сколь угодно высокой точностью. Точность измерения пространственных характеристик x и частотных характеристик  ограниченна снизу неравенством Гейзенберга

Рассмотрим процесс разложения сигнала F(t) в системе базисных функций Хаара. Первая базисная функция, в отличие от всех последующих, представляет собой прямую линию. В случае нормированного базиса {n(t)} свертка первой базисной функции с исходным сигналом будет определять его среднее значение. Последующие базисные функции разложения Хаара представляют собой масштабируемые по степени 2, сдвинутые «ступеньки», представленные выше на рис. 3.3.30. Таким образом система базисных функций Хаара в дискретном пространстве должна задаваться двумя параметрами: сдвига и частоты (масштаба):

,

где a – масштаб базисной функции; b – сдвиг. В дискретном случае параметр масштаба a = 2m, где m – любое целое положительное число, параметр сдвига b = k2m. Таким образом, все множество базисных функций можно записать как

Ниже, на рис. 3.3.31, представлен вид базисных функций Хаара для различных масштабов.

@Рис. 3.3.31. Вид базисных функций Хаара для различных масштабов

В результате разложения исходный сигнал точно описывается коэффициентами вейвлет-преобразования Хаара.

Для вейвлет преобразования также как и для ДПФ существует алгоритм быстрого преобразования. Рассмотрим преобразование Хаара. Из рис. 3.3.31. видно, что функции с малым масштабным коэффициентом a используют те же отсчеты сигнала для вычисления коэффициентов, что и функции с большим масштабным коэффициентом. При этом операция суммирования одних и тех же отсчетов повторяется неоднократно. Следовательно, для уменьшения объема вычислений целесообразно вычислять Вейвлет-преобразование с самого малого масштабного коэффициента. В результате получаем вейвлет-коэффициенты, представляющие собой средние значения и разности .Для коэффициентов повторяем данную процедуру. При этом усреднение коэффициентов будет соответствовать усреднению четырех отсчетов сигнала, но при этом расходуется одна операция умножения и одна операция умножения и одна операция сложения. Процесс разложения повторяется до тех пор, пока не будут вычислены все коэффициенты спектра.

Двумерное вейвлет преобразование строится по тому же принципу, что и двумерное преобразование Фурье, то есть сначала вычисляются одномерные преобразования строк, и по полученной матрице коэффициентов вычисляются вейвлет преобразования столбцов.

На рисунке 3.3.32 представлены исходное изображение, а на рис. 3.3.33 – четыре компоненты вейвлет-образа. Размер каждой компоненты в два раза меньше соответствующего линейного размера исходного изображения.

@Рис. 3.3.32. Исходное изображение

@Рис. 3.3.33. Пример двумерного вейвлет-преобразования Хаара

Возможности вейвлет преобразований по локализации частотно-пространственных особенностей исходного сигнала используются для алгоритмов подавления шумов и сжатия. При этом производится подавление малых коэффициентов разложения, что позволяет восстанавливать сигналы с высокой степенью подобия к исходному сигналу, однако при этом уменьшается влияние слабых шумовых сигналов и снижается объем информации необходимый для представления сигнала. На основе вейвлет преобразования разработан самый современный на сегодня стандарт сжатия изображений JPEG2000.

1.5. ВЫДЕЛЕНИЕ КОНТУРНЫХ ТОЧЕК (КОНТУРОВ) НА ПОЛУТОНОВЫХ ИЗОБРАЖЕНИЯХ. ЭВРИСТИЧЕСКИЕ МЕТОДЫ ВЫДЕЛЕНИЯ КОНТУРОВ. МЕТОДЫ, ОСНОВАННЫЕ НА ВЫЧИСЛЕНИИ ПРОИЗВОДНЫХ. КУСОЧНО-ПОСТОЯННАЯ И КУСОЧНО-ЛИНЕЙНАЯ МОДЕЛЬ ИЗОБРАЖЕНИЯ. ДВА ТИПА "КРАЕВ". ОПЕРАТОРЫ РОБЕРТСА, СОБЕЛА, ПРЕВИТТА, ЛАПЛАСА. ОПЕРАТОР МАРРА. ОБЩИЙ ПОДХОД К ЗАДАЧЕ ДИФФЕРЕНЦИРОВАНИЯ ЦИФРОВОГО ИЗОБРАЖЕНИЯ. РЕГУЛЯРИЗАЦИЯ. ОПТИМАЛЬНЫЕ ОПЕРАТОРЫ ВЫДЕЛЕНИЯ КОНТУРОВ.

СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЙ. ВЫДЕЛЕНИЕ ОБЛАСТЕЙ. КРИТЕРИИ ОДНОРОДНОСТИ. ГИСТОГРАММНАЯ СЕГМЕНТАЦИЯ. СЕГМЕНТАЦИЯ ПО ЦВЕТУ. МЕТОДЫ СЛИЯНИЯ/РАЗБИЕНИЯ.

Задача выделения контурных точек

Выделение контурных точек на бинарном изображении – задача вполне тривиальная. Здесь контурной точкой является любая точка, такая что в ее ближайшей окрестности (среди ее ближайших соседей) имеется хотя бы одна точка, значение которой отличается от значения данной точки.

Рассмотрим задачу выделения краев на полутоновом изображении. Пусть полутоновое изображение представляет собой двумерную функцию яркости (интенсивности сигнала) f(x,y), определенную на ограниченной прямоугольной области X, называемой «кадром». Традиционно рассматриваются две модели «края»: «ступенька» и «излом». «Ступенька» предполагает скачкообразное изменение яркости вдоль некоторого контура на изображении. Точки контура типа «ступенька» являются, таким образом, точками разрыва для функции f(x,y). Край типа «излом» – это совокупность точек разрыва первой производной функции f(x,y). Если же считать, что функция яркости непрерывна и два раза непрерывно дифференцируема во всех своих точках, то «ступенчатым» краевым точкам соответствуют точки смены знака второй производной (максимума первой производной), а «изломным» краевым точкам – точки смены знака первой производной (локальные максимумы яркостной функции). Рис. 3.4.1. иллюстрирует эти идеи для случая одномерной функции (например, профиля строки или столбца).

@Рис. 3.4.1. Идея определения краевых перепадов интенсивности типа «ступенька»:

а) функция интенсивности на границе перепада; б) первая производная функции;

в) вторая производная функции.