Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Обработка изображений / Лекции по обработке изображений Ч 2

.pdf
Скачиваний:
275
Добавлен:
25.04.2015
Размер:
6.34 Mб
Скачать

использованием таких фильтров H u1 ,u2 ;m может быть записана следующим образом:

 

 

 

 

N 1

N 1

 

 

 

 

 

gT j1 , j2 ; a T 1 j1 , j2 ;u1 , u2 FT u1 , u2 H u1 , u2 ; m ,

(4.42)

 

 

 

 

u1 0 u2 0

 

 

 

 

 

где gT j1 , j2 ;a – результат фильтрации, FT u1 ,u2 – унитарное преобразование

матрицы изображения

 

f j1 ,

j2 ,

u1 ,u2

– обобщенные

пространственные

частоты, T 1 j , j

2

;u ,u

2

 

ядро

обратного унитарного

преобразования.

1

1

 

 

 

 

 

 

 

Осуществим суммирование обеих частей последнего равенства по индексу m параметра a

M 1

N 1 N 1

j1 , j2 ;u1 , u2 FT u1 , u2

M 1

gT

j1 , j2 ; m T 1

H u1 , u2 ; m . (4.43)

m 0

u1 0 u2 0

 

 

 

m 0

Если для фильтров H u1 ,u2 ;m выполняется условие

 

 

M 1

 

 

 

 

 

H u1 ,u2 ; m c ,

(4.44)

 

m 0

 

 

 

 

где c – некоторая константа не равная нулю, то

 

 

 

 

1

M 1

 

 

f j1 , j2

 

gT j1 , j2 ; m .

(4.45)

 

 

 

 

 

c m 0

 

Данное равенство будем рассматривать как декомпозицию исходного изображения f j1 , j2 на M изображений gT j1 , j2 ;m с помощью унитарного

преобразования с ядром T j1 , j2 ;u1 ,u2 .

Важно отметить, что двумерные дискретные функции gT j1 , j2 ;m не

являются изображениями, поскольку принимают как положительные, так и

отрицательные значения. Прибавим

 

к каждой из

функций gT j1 , j2 ;m

постоянную составляющую, равную

 

min gT j1 , j2 ;m

 

,

тем самым получим

 

 

серию смоделированных изображений, сумма которых, нормированная на диапазон изменения изображения, даст исходное изображение f j1 , j2 .

Данные фильтры применялись для моделирования изображений на

основе рассмотренных выше унитарных преобразований. Установлено, что при

моделировании

с

использованием

фильтров

Н1 u,m,n, M , N

( n 1, M 16, N 512 )

для изображений

n j1 , j2

«белого»

шума ошибка

 

 

 

 

 

 

 

N 1 N 1

 

M 1

j1 , j2 , m n j1 , j2

 

 

 

 

1/ N 2

 

gT

0.003, т.е.

меньше величины уровня

j1 0 j2 0

 

m 0

 

 

 

 

 

 

 

 

 

 

 

 

 

квантования для 8-разрядных изображений. С ростом n и М ошибка

уменьшается,

например,

при n 20 ,

M 256 ,

10 6 .

Для фильтров

H

2

u, m, M , N

ошибка

0.003 при

M 28, N 512 и

10 6 , если

 

 

 

 

 

 

 

M 128, N 512.

На практике результат моделирования обычно должен быть представлен 2 – 4 изображениями. Поэтому декомпозиция должна выполняться с использованием фильтров вида

71

m k

 

H u1 , u2 ; i, k H u1 , u2 ; m ,

(4.46)

m i

 

где i, k, k i – целые числа, которые задают диапазон изменения параметра m фильтра для получения одного из результатов моделирования. Кроме того, частотные характеристики (4.43) должны быть плавными, чтобы минимизировать артефакты, характерные для полосовой циклической фильтрации. Вычислительные эксперименты показали, что смоделированные изображения тренда, НЧ и ВЧ компонент обычно хорошо согласуются с психофизическим восприятием человека, если моделирование осуществляется

на

основе косинусного преобразования с использованием фильтров

H1

u,m,n, M , N (1 n 4 ). Для определения диапазонов параметра m в (4.43)

может быть использована априорная информация, например, о частотной характеристике системы формирования изображения.

На рис. 4.8, а показано высокоразрешающее электронномикроскопическое изображение образца аморфного сплава, находящегося на ранней стадии кристаллизации, и результат моделирования изображений тренда (рис. 4.8, б), НЧ изображения (рис. 4.8, в) и ВЧ изображения (рис. 4.8, г) полученных с использованием фильтров H1 u,m,n, M , N ( n 2, M 16 ) и

косинусного преобразования.

Контраст на исходном изображении определяется суперпозицией трех типов контрастов и обусловлен: поглощением электронов на относительно больших по толщине участках образца (тренд, рис. 4.8, б); упруго рассеянными электронами, которые отсекаются апертурной диафрагмой микроскопа (НЧ изображение, рис. 4.8, в); фазовой модуляцией электронной волны (ВЧ изображение, рис. 4.8, г, на котором хорошо просматриваются решетки микрокристаллов). Зная частотную характеристику микроскопа, для каждого из данных типов контраста несложно определить диапазоны изменения параметра m фильтров (4.36), и по результатам моделирования разделить изображения с различной природой контраста.

В общем случае для определения диапазонов изменения параметра m предлагается использовать скалограммы GT m унитарных преобразований

N 1 N 1

 

 

 

 

GT m

 

FT

u1 , u2

 

2 H 2 u1 , u2 ; m .

(4.47)

 

 

u1 0 u2 0

 

 

 

 

Фактически скалограммы представляют собой спектральные характеристики, получаемые из обобщенного спектра суммированием энергии в кольцевых

зонах, ширина которых растет с увеличением обобщенной частоты. На рис. 4.9,

a, показана скалограмма

GС

m изображения,

приведенного

на рис. 4.8, а.

Скалограмма

получена

с

использованием

фильтров

H1 u,m,n, M , N

( n 2, M 16 );

на оси абсцисс отмечены значения m для границ диапазонов

при моделировании, показанном на рис. 4.8. Для определения этих границ также могут использоваться координаты локальных минимумов скалограммы, координаты диапазонов, энергия скалограммы в которых одинакова, и т. д.

72

а) б)

в) г)

Рис. 4.8. Моделирование изображений тренда (б), НЧ (в) и ВЧ (г) компонент микроскопического изображения (а)

Очевидно, что скалограммы GT m могут применяться для анализа

изображений и выделения признаков. При решении этих задач необходимое разрешение в скалограммах можно получить либо увеличивая значения n для фильтров H1 u,m,n, M , N , либо используя фильтры H2 u, m, M , N .

 

На рис. 4.9, б- г для изображения (рис. 4.8, а) представлены скалограммы:

GС

m

(фильтры

H1 u,m,n, M , N ,

n 20,

M 512 ),

GС m

(фильтры

H2

u, m, M , N , M 512 ) и ИЧХ lnV k . Видно, что скалограммы GС m имеют

более высокое разрешение в области больших масштабов, а их значения сосредоточены в относительно небольшом диапазоне (по сравнению с ИЧХ). Это обстоятельство позволяет отдать предпочтение скалограммам GT m в

исследованиях длинноволновых неоднородностей структуры по микроскопическим изображениям.

При анализе микроскопических изображений, если скалограмма имеет пик при m m0 , то характерный пространственный масштаб неоднородностей

на изображении определяется как

d T0 / 2 m0 / u , где u

зависящая от

вида вейвлета константа.

Множитель 1/ 2 появляется

из-за того,

определяется не период, а масштаб неоднородностей. В этом смысле синус, например, имеет две элементарные детали на периоде. Для многих вейвлетов

73

константа u может быть вычислена аналитически и примерно равна 2 .

Распространяя результат на произвольный пространственный сигнал (изображение), даже не гармонический, мы предполагаем, что положение максимума скалограммы GT m любого унитарного преобразования (т.е.

выявленный масштаб) можно интерпретировать как средний размер неоднородностей, вносящих основной вклад в энергию анализируемого процесса.

Из существования для вейвлет-преобразования аналога равенства Парсеваля следует, что в пространстве действительных функций полная энергия сигнала может быть записана через амплитуды вейвлет-преобразования, где плотность энергии сигнала характеризует энергетические уровни. Для анализа изображений можно использовать две характеристики, определяемые через плотность энергии – мера локальной перемежаемости и мера контрастности анализируемого изображения. Эти характеристики можно использовать для описания рассмотренных выше скалограмм GT m унитарных

преобразований.

а) б)

в)

г)

Рис. 4. 9. Скалограммы микроскопических изображений

74

Мера локальной перемежаемости

IT

(m)

GT (m)

 

(4.48)

GT

m

 

 

 

m

является мерой локальных отклонений от среднего скалограммы унитарного преобразования изображения при заданном виде вейвлета; она позволяет определить степень неравномерности распределения энергии по масштабам (угловыми скобками здесь обозначено усреднение). Равенство IT (m) 1 при всех m означает, что энергия для такого унитарного

преобразования при заданном виде вейвлета распределена равномерно по всем масштабам; IT (m0 ) означает, что вклад компоненты масштаба m0 в

раз превосходит вклад усредненного масштаба. Мера контрастности

 

(m)

GT

(m)

 

(m)

m m

 

dm

 

 

CT

 

(4.49)

 

 

 

 

(m)

, GT

GT m

 

 

 

 

 

m mmax

 

 

 

 

 

 

GT

 

 

 

 

 

 

позволяет определить даже малые изменения в скалограмме на фоне глобальной структуры распределения энергии.

Программные средства, разработанные в данной работе для моделирования и анализа изображений на основе непрерывного вейвлет - преобразования, позволяют проектировать вейвлет – фильтры для обобщенной декомпозиции на основе используемых в программе унитарных преобразований, осуществлять анализ скалограмм и анизотропии изображений.

4.4.2. Моделирование и анализ изображений на основе дискретного вейвлет-преобразования. При рассмотрении дискретного вейвлет – преобразования будем использовать вейвлеты Добеши 2,4,8, вейвлеты Симлета

– 4, Коифлетса – 2, а также биортогональные вейвлеты Добеши – 9/7 . В случае применения дискретного вейвлет-преобразования обрабатываемое изображение в плоскости (x, y) анализируется по горизонталям, вертикалям и диагоналям с

одинаковым разрешением. Для изображения размером М x N элементов каждая итерация дискретного вейвлет-преобразования реализуется в два этапа. Сначала с помощью низкочастотного и высокочастотного вейвлет-фильтров выполняются одномерные преобразования по всем строкам матрицы изображения, в результате получаются две матрицы, состоящие из низкочастотных и высокочастотных компонент размером (М/2) х N каждая. На втором этапе с помощью этих же фильтров выполняют преобразования столбцов обеих матриц полученных изображений. В итоге после выполнения первой итерации вейвлет-преобразования получается изображение размером М х N, условно разбитое на четыре квадранта:

LP1-LP1 – квадрант, представляющий собой уменьшенную и сглаженную по строкам и столбцам версию изображения – оригинала;

LP1-HP1 – квадрант, содержащий дифференциальную информацию об исходном изображении в горизонтальном направлении;

HP1-LP1 – квадрант, содержащий дифференциальную информацию об

75

исходном изображении в вертикальном направлении; НР1-НР1 – квадрант, содержащий дифференциальную информацию об

исходном изображении в диагональном направлении. Пример 3-ех уровневой декомпозиции микроскопического изображения аморфной пленки по базису биортогональных вейвлетов Добеши – 9/7 приведен на рис. 4.10.

Рис. 4.10. Декомпозиция на 3 уровня микроскопического изображения на основе вейвлет – преобразования Добеши – 9/7

Большая и важнейшая часть информации, необходимая для восстановления исходного изображения, сконцентрирована в квадранте LP1-LP1. Дифференциальные квадранты содержат локальную информацию о высокочастотном заполнении оригинала. Данное свойство вейвлет-преобразования определяет его основное преимущество перед фурье-аналогом. Вейвлетпреобразование изображения содержит не только частотную информацию об исходном сигнале, но и пространственную, допуская тем самым локализацию различных свойств исходного изображения.

На рис. 4.11 представлен результат моделирования изображений тренда, НЧ изображения и ВЧ изображения, полученных при декомпозиции микроскопического изображения на 3 уровня с помощью ортогонального вейвлет – преобразования Добеши – 4. Декомпозиция на основе непрерывного вейвлет-преобразования более согласованна с психофизическим восприятием

76

AD m

данной процедуры человеком. Для исследования результатов декомпозиции изображений на основе ортогональных вейвлетов предлагается использовать распределение энергии E m (скалограммы) в зависимости от уровня

декомпозиции m и распределение анизотропии A m на каждом уровне

декомпозиции, определяемое как отношение суммарной энергии в квадранте LP-HP к суммарной энергии в квадранте HP-LP. На рис. 4.12 показаны ED m и

при декомпозиции изображения (рис. 4.10) на 9 уровней с

использованием вейвлет-преобразования изображения Добеши – 9/7.

Распределения ED m

и

AD m

позволяют проводить экспресс анализ

скалограмм и анизотропии.

Рис. 4.11. Моделирование изображений тренда, НЧ и ВЧ компонент

Можно для моделирования и анализа изображений на основе дискретного вейвлет-преобразования осуществлять прямое и обратное преобразование с использованием разлитчных вейвлетов Добеши 2,4,8, Симлета – 4, Коифлетса – 2, биортогональных вейвлетов Добеши – 9/7 и др. Для фильтрации проектируются фильтры, выделяющие компоненты

77

различного уровня и направления. Реализованы алгоритмы работы блока предварительной обработки изображений: сглаживающий фильтр и алгоритм повышения резкости. В первом случае обнуляются высокочастотные составляющие вейвлет-спектра изображения, а затем выполняется обратное вейвлет-преобразование. Во втором случае пропорционально усиливаются высокочастотные составляющие вейвлетспектра изображения.

Рис. 4.14. Графики распределения энергии ED m и анизотропии AD m

Можно использовать (скалограмм) и средства для анализа скалограмм E m

средства для построения распределений анализа анизотропности изображений. Для и анизотропии A m , как и в случае

непрерывного вейвлет-преобразования, строятся меры локальной перемежаемости:

I E

(m)

E (m)

 

,

E

m

 

 

 

m

 

 

 

 

и меры контрастности:

CE

(m)

E

(m)

 

 

 

 

(m)

, E

 

 

E

 

CA

(m)

A

(m)

 

 

 

, A

 

 

A

(m)

 

I A (m)

 

A (m)

 

,

 

A m

 

 

 

 

m

 

 

 

 

 

 

m m

 

m dm ,

(m)

E

 

m mmax

 

 

 

 

m m

 

m dm .

(m)

A

m mmax

(4.50)

(4.51)

(4.52)

Кроме того, в качестве спектральных характеристик вычисляются распределения энергии в квадрантах LP-HP, HP-LP, НР-НР в зависимости от уровня декомпозиции m.

78

5. Cтруктурно-морфологический анализ изображений

5.1. Основные понятия математической морфологии

Традиционные методы обработки изображений, основанные на принципах и теории линейных систем и преобразовании Фурье, не дают прямого ответа на вопрос, каким образом численно описать форму или геометрическую структуру объектов на изображении. Например, спектральный анализ изображений в большинстве случаев позволяет количественно описать только упорядочения и анизотропию во взаимном расположении объектов. Дать строгое количественное описание многих особенностей геометрической структуры объектов в виде, согласуемом с интуицией и восприятием человека, позволяет математическая морфология, фундамент которой составляют теория множеств, интегральная геометрия, анализ выпуклых функций, стереология и геометрическая теория вероятностей. Основу методов математической морфологии составляют теоретико-множественные принципы, нелинейная суперпозиция сигналов и класс нелинейных систем, которые называются морфологическими системами. Несмотря на многие приложения математической морфологии, ее глубокую и изящную математическую структуру, она лишь недавно стала областью интереса академических исследований, и широта и общность этого метода еще не получили достойного признания.

Основой морфологического подхода к обработке изображений является представление изображений и систем обработки на языке множеств и их преобразований. Бинарные изображения наиболее простым способом могут быть представлены с помощью множеств. В этом случае области, где значения яркости изображения равны 0, могут быть рассмотрены, например, как области черного фона, а области, где значения яркости изображения равны 1, как области белого фона. Ясно, что изображение может быть представлено множеством Х точек, соответствующих белому фону. Преобразования изображений в математической морфологии осуществляются с помощью нелинейных операторов, которые локально модифицируют геометрические характеристики изображений.

Пусть R и Z представляют соответственно множества действительных и целых чисел, и пусть E представляет двумерное непрерывное пространство R 2

или дискретное пространство Z 2 .

Рассмотрим

вначале

случай

бинарных

изображений. Пусть

X E есть

множественное

представление

бинарного

входного

изображения

и пусть B E

есть компактное

множество малого

размера

и простой

формы (например, круг). Множество B

называется

структурирующим

элементом.

Пусть

X b {x b : x X}

выражает

векторный перенос

X

на ± b E . Фундаментальными

морфологическими

операторами для множеств являются наращение и эрозия X с помощью

B , которые определяются как

 

 

 

 

 

 

X B X b {x b : x X ,b B},

 

(5.1)

 

 

 

b B

 

 

 

 

 

 

 

 

 

 

 

 

 

79

X B X b {(z : (B z) X }.

(5.2)

b B

 

Выход оператора наращения представляет собой множество перенесенных точек такое, что перенос отраженного структурирующего элемента

B { b : b B} образует непустое пересечение с входным множеством, т. е.

X B {z : (B z) X Ø}. Аналогично, выход оператора эрозии представляет собой множество перенесенных точек, такое, что перенесенный структурирующий элемент содержится во входном множестве.

Другие операторы могут быть определены как комбинации эрозии и наращения. Например, два дополнительных фундаментальных оператора –

paзмыкание ◦ и замыкание • X с помощью B определяются как

 

X B ( X B) B ,

(5.3)

X B ( X B) B .

(5.4)

Представленный выше набор морфологических операторов может быть разными способами обобщен на полутоновые изображения, представляемые действительными положительно определенными функциями. Бинарные изображения часто получают в результате пороговой селекции полутоновых изображений, и пороговая селекция часто используется для того, чтобы представить полутоновые изображения через бинарные, т. е. с помощью множеств. Полутоновое изображение f x , где x означает двумерный вектор, можно представить с помощью ансамбля его двумерных пороговых множеств, определяемых как

X a ( f ) {x : f (x) a},

0 a ,

(5.5)

где амплитуда a полностью перекрывает R или Z, в зависимости от того, имеет ли изображение f непрерывный или квантованный диапазон значений. У пороговых множеств есть два важных свойства. Они линейно упорядочены,

поскольку если

a b, то X a X b ,

что позволяет однозначно восстановить

изображение f x , так как

 

 

 

f (x) max{a : x X a ( f )}, x .

 

(5.6)

Таким образом, пороговые бинарные изображения, соответствующие

пороговым множествам, для которых

fa (x) =1, если

f (x) a [т. е. x X a ( f ) ] и

fa (x) 0, если

f (x) a [x X a ( f )], причем

a перекрывает

диапазон

изменения f (x) .

Очевидно, что пороговые изображения fa (x) несут ту же

информацию, что и пороговые множества X a ( f ) .

 

 

Часто используется представление двумерной функции f (x)

набором ее

пороговых множеств (5.6). При этом операция наращения всех пороговых

множеств функции

f

x с помощью одного и того же компактного множества

В дает множества

X a ( f ) B , которые являются пороговыми множествами

нового изображения

f B , называемого наращением изображения f с

помощью В. Подобно этому операция эрозии всех пороговых множеств функции f с помощью одного и того же множества В и суперпозиции всех

80