Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1 / Salmon_sjatie_dannyh_izobrajeniy_i_zvuka[torrents.ru]

.pdf
Скачиваний:
24
Добавлен:
05.06.2015
Размер:
7.92 Mб
Скачать

Глава 4- Вейвлетные методы

В итоге в левом верхнем квадранте будут стоять средние четы­ рех квадрантов исходного образа, а в остальных квадрантах будут находиться соответствующие полуразности. Шаги 3 и 4 опериру­ ют со строками и столбцами, в результате чего средние величины будут сконцентрированы в левой верхней подматрице (одной шест­ надцатой всей исходной таблицы). Эти пары шагов применяются к все более и более маленьким подматрицам, до тех пор пока в верх­ нем левом углу не будет стоять среднее всей исходной матрицы, а все остальные пикселы преобразуются в разности в соответствии с ходом алгоритма. Весь процесс показан на рис. 4.5.

Преобразования, описанные в § 3.5, являются ортогональными. Они преобразуют пикселы изображения во множество чисел, из ко­ торых некоторые числа будут большими, а остальные - маленьки­ ми. Вейвлетные преобразования, подобные преобразованию Хаара, работают иначе, они являются поддиапазонными. Они разбивают образ на подобласти, из которых одна область содержит большие числа (средние значения в случае преобразования Хаара), а другие области состоят из малых чисел (разностей в нашем случае). Од­ нако эти области, называемые поддиапазонами^ не просто являются семействами больших и малых чисел. Они отражают различные гео­ метрические свойства трансформируемого образа. Чтобы пояснить эту особенность, изучим маленькое равномерное изображение, со­ держащее вертикальную и горизонтальную линию. На рис. 4.4а по­ казан такой образ размера 8 х 8, в котором все пикселы равны 12 за исключением одной вертикальной строки с пикселами, равными 14, и одной горизонтальной строки, где пикселы равны 16.

12

12

12

12

14

12

12 12

12

12

13

12

0

0

2 0

12 12 13 12

0

0

2 0

12

12

12

12

14

12

12 12

12

12

13

12

0

0

2 0

12

12 13

12

0

0

2 0

12

12

12

12

14

12

12

12

12

12

13

12

0

0

2 0

14 14 14

14

0

0

0 0

12

12

12

12

14

12

12 12

12

12

13

12

0

0

2 0

12

12 13 12

0

0

2 0

12

12

12

12

14

12

12

12

12

12

13

12

0

0

2 0

0

0

0

0 0

0

0 0

16

16

16

16

14

16

16

16

16

16

15

16

0

0

2 0

0

0

0

0 0

0

0 0

12

12

12

12

14

12

12

12

12

12

13

12

0

0

2 0

4

4

2

4 0

0

4 0

12

12

12

12

14

12

12

12

12

12

13

12

0

0

2 0

0

0

0

0 0

0

0 0

 

 

 

(а)

 

 

 

 

 

 

(Ь)

 

 

 

 

 

 

(с)

 

 

 

Рис. 4.4. Образ 8 X 8 и его поддиапазонное разложение.

На рис. 4.4Ь приведен результат применения одного шага пре­ образования Хаара ко всем строкам матрицы. Правая часть пре­ образованной матрицы (содержащая разности) в основном состоит

4.1. Вычисление средних и полуразностей 221

из нулей. В этом отражается равномерность образа. Однако след от вертикальной линии вполне заметен (подчеркнутые числа обозна­ чают отрицательные разности).

procedure NStdCalc(a:array of real, n:int);

 

а:=а/д/п

comment: деление всего массива

j : = n ;

 

 

 

 

 

 

while j > 2

do

 

 

 

 

for

r = l

to j do NWTstep(row

r of a, j);

 

endfor;

 

 

 

 

 

for c=j

to 1 do comment: обратный

цикл

NWTstep(col с of a, j);

 

 

 

endfor;

j : = j / 2 ;

 

 

 

 

endwhile;

 

 

 

 

 

end;

 

 

 

 

 

 

procedure

NStdReconst(a:array

of real,

n:int);

j : = 2 ;

 

 

 

 

 

 

while j < n

do

 

 

 

 

for c=j to 1 do comment: обратный

цикл

N W T R s t e p ( c o l c o f

a, j);

 

 

 

endfor;

 

 

 

 

 

for

r = l

to j do

 

 

 

 

NWTRstep(row r of a, j);

 

 

 

endfor;

j:=2j;

 

 

 

 

endwhile

 

 

 

 

 

а:=а^/п; comment: умножение всего массива

end;

 

 

 

 

 

 

Исходный

 

 

 

 

образ

 

 

 

 

 

 

i

 

 

 

 

 

 

 

LL

LH

h r

LH

L

Н

r

 

 

 

 

 

 

 

 

HL

HH

HL

 

HH

 

 

 

 

 

 

LH

 

 

 

 

HL

 

HH 1

Р и с . 4 . 5 . Пирамидальное разложение образа.

Глава 4- Вейвлетные методы

На рис. 4.4с изображен результат применения того же преобра­ зования к столбцам матрицы (Ь). Верхний правый поддиапазон со­ держит след от вертикальной линии, а в нижнем левом поддиапазо­ не отчетливо виден след от горизонтальной линии. Обозначим эти поддиапазоны HL и LH, соответственно (см. рис. 4.35, хотя име­ ется некоторое разночтение в использовании обозначений разными авторам). Нижний правый поддиапазон обозначим НН, на котором отражаются диагональные особенности образа (в нашем случае от­ сутствующие). Самым интересным остается верхний левый поддиа­ пазон, целиком состоящий из средних величин (он обозначается LL). Этот квадрант, являющийся уменьшенной копией исходного образа с пониженным качеством, содержит следы от обеих линий.

Рис. 4.6 иллюстрирует влияние диагональных особенностей образа на поддиапазон НН. На рис. 4.6а показана матрица равномерного образа с диагональной полосой чуть выше главной диагонали мат­ рицы. На рис. 4.6b,с даны результаты двух первых шагов пирами­ дального преобразования. Видно, что преобразованные коэффици­ енты левого нижнего поддиапазона (НН) отражают диагональные особенности исходного образа, лежащие именно выше главной диа­ гонали матрицы. Ясно также, что верхний левый поддиапазон (LL) является копией исходного изображения, но с более низким разре­ шением.

12

16

12

12

12

12

12

12

14

12

12 12

4

0

0 0

13 13

12 12

2

2 0 0

12

12

16

12

12

12

12

12

12

14

12 12

0

4

0 0

12 13

13 12

0

2 2 0

12

12

12

16

12

12

12

12

12

14

12 12

0

4

0 0

12 12

13

13

0

0 2 2

12

12

12

12

16

12

12

12

12

12

14

12

0

0

4 0

12

12

12 13

0

0 0 2

12

12

12

12

12

16

12

12

12

12

14 12

0

0

4 0

2

2

0

0 4

4 0 0

12

12

12

12

12

12

16

12

12

12

12

14

0

0

0 4

0

2

2

0 0

4 4 0

12

12

12

12

12

12

12

16

12

12

12

14

0

0

0 4

0

0

2

2 0

0 4 4

12

12

12

12

12

12

12

12

12

12

12

12

0

0

0 0

0

0

0

2 0

0 0 4

 

 

 

(а)

 

 

 

 

 

 

(Ь)

 

 

 

 

 

 

(с)

 

 

Рис. 4.6. Поддиапазонное разложение диагональной линии.

На рис. 4.35 изображены четыре уровня поддиапазонов, где первый уровень содержит подробные детали исходного изображения (ко­ торый называется уровнем высокочастотных коэффициентов вы­ сокого разрешения), а верхний, четвертый уровень, содержит гру­ бые детали изображения (низкочастотные коэффициенты низкого разрешения). Очевидно, коэффициенты четвертого уровня можно квантовать достаточно грубо без существенных потерь качества

4-1. Вычисление средних и полуразностей

изображения, в то время как высокочастотные коэффициенты сле­ дует квантовать очень слабо или совсем не трогать. Структура под­ диапазонов - вот базис любого метода сжатия, основанного на вейвлетных преобразованиях.

На рис. 4.7 показан типичный результат пирамидального вейвлетного преобразования. Исходное изображение дано на рис 4.7а. На рис. 4.7с показана общая схема пирамидального разложения этого образа. Рисунок выбран состоящим в основном из горизонтальных, вертикальных и наклонных линий, чтобы были заметны особен­ ности пирамидального преобразования. Четыре квадранта на рис. 4.7с передают уменьшенную копию этого изображения. Верхний ле­ вый поддиапазон, содержащий средние значения, подобен исходно­ му образу, а три остальных квадранта (поддиапазона) показывают детали изображения. Верхний правый поддиапазон отражает вер­ тикальные детали изображения, нижний левый - горизонтальные, а нижний правый содержит детали наклонных линий. На рис. 4.7Ь показана последовательность итераций этого преобразования. Все изображение трансформируется в последовательность поддиапазо­ нов, отражающих особенности по горизонталям, вертикалям и диа­ гоналям, а самый верхний левый квадратик, содержащий усреднен­ ное изображение, стягивается в один единственный пиксел.

Независимо от метода (стандартного или пирамидального) в ре­ зультате преобразования получается одно большое среднее число в верхнем левом углу матрицы образа, а все остальные элементы ма­ трицы являются малыми числами, разностями или средними разно­ стей. Теперь этот массив чисел можно подвергнуть сжатию с по­ мощью подходящей комбинации методов RLE, кодирования Хаффмана или других известных алгоритмов (см. [Salomon 2000]). Если допустима частичная потеря информации, то наименьшие разности можно дополнительно квантовать или просто обнулить. Этот шаг даст длинные серии нулей, к которым метод RLE можно применить с еще большей эффективностью.

Цветные изобралсения. До этого момента предполагалось, что пикселы образа состоят из одиночных чисел (то есть, рассматри­ валось изображение из одной компоненты, представляющей различ­ ные оттенки одного цвета, обычно, серого). Любой метод сжатия таких изображений легко переносится на цветные образы, состоя­ щие из трех компонентов. Для этого достаточно разделить образ на три подобраза и каждый независимо сжать. Если разрешает­ ся потеря информации, то имеет смысл сначала сделать преобра­ зование исходного цветового пространства, которое обычно явля-

, 224 Глава i. Вейвлетные методы

А

1^^

LJ I I

г

|ш|

1

1[Г

 

 

1 ш

(Ь)

Рис. 4.7. Пример пирамидального разложения образа.

4-1. Вычисление средних и полуразностей

ется пространством RGB, в пространство YIQ. В новом цветовом представлении компонента Y - это светимость, а компоненты I и Q отвечают за цветность (см. [Salomon 99]). Преимущество этого представления состоит в том, что глаз человека имеет наибольшую чувствительность к изменениям светимости (Y), а наименьшую - к изменениям компоненты цветности Q. Поэтому метод с потерей данных должен отдельно сжимать компоненту У почти без потерь, удалять часть информации из компоненты I, а из компоненты Q удалять еще больше данных. Тогда удастся добиться значительно­ го сжатия изображения без заметных для глаза потерь качества и мелких деталей. В § 3.7.1 приведены более подробные сведения о цветовых пространствах и компонентах светимости и цветности.

Интересно отметить, что американский стандарт для передачи цветного телевизионного сигнала также учитывает преимущества представления YIQ. В общей полосе частот сигнала компонента Y занимает 4 MHz, на компоненту I приходится 1.5 MHz, а компонен­ те Q отведено всего 0.6 MHz.

4Л.2. Свойства преобразования

Хаара

Примеры из этого параграфа иллюстрируют некоторые важные свой­ ства вейвлетного преобразования Хаара, а также общих вейвлетных преобразований. На рис. 4.8 показан высоко коррелированный образ размера 8 х 8 и его преобразование Хаара. Даны числовые значение

преобразованных коэффициентов и их графическое представление в виде квадратиков различных серых оттенков. Из-за высокой сте­ пени корреляции исходных пикселов, вейвлетные коэффициенты в основном малы по абсолютному значению и многие из них равны нулю.

Замечание. При первом взгляде на рис. 4.8 последнее утверж­ дение кажется ложным. Приведенные коэффициенты вейвлетного преобразования достаточно велики по сравнению с исходными зна­ чениями пикселов. Нам известно, что верхний левый элемент матри­ цы коэффициентов преобразования Хаара должен быть равен сред­ нему значению всех пикселов образа. Поскольку эти пикселы имеют примерно равномерное распределение на интервале [0,255], то это среднее должно быть около 128 (на самом деле, точное значение равно 131.375). А в приведенной таблице это число равно 1051 (что равно 131.375 х 8). Причина заключается в том, что программа, вы­ полнявшая эти вычисления использовала \/2 вместо 2 (см. функцию individ(n) на рис. 4.12).

Глава 4- Вейвлетные методы

При дискретном вейвлетном преобразовании большинство полу­ чающихся коэффициентов (разностей) отвечают за детали изобра­ жения. Детали нижнего уровня представляют мелкие особенности исходного образа. При перемещении на более высокие под диапазон­ ные уровни обнаруживаются более грубые детали данного изобра­ жения. Рис. 4.9а поясняет эту концепцию. Показано изображение, равномерно гладкое слева, у которого наблюдается некоторая «ше­ роховатость» справа (то есть, соседние пикселы начинают разли­ чаться). На рисунке (Ь) дано графическое представление преобра­ зования Хаара этого образа. Поддиапазоны низкого уровня (отве­ чающий точным деталям) имеют ненулевые коэффициенты справа, там, где наблюдается «шероховатость» изображения. Поддиапазо­ ны высокого уровня (грубые детали) выглядят похоже, и их коэф­ фициенты также имеют ненулевые коэффициенты слева, поскольку изображение не полностью белое слева.

 

255

224

192

159

127

95

63

32

 

О

 

32

64

159

127

159

191

223

 

255

224

192

159

127

95

63

32

 

О

 

32

64

159

127

159

191

223

 

255

224

192

159

127

95

63

32

 

О

 

32

64

159

127

159

191

223

 

255

224

192

159

127

95

63

32

 

О

 

32

64

159

127

159

191

223

)51

34.0

-44.5

-0.7

-1.0

-62

0

-1.0

0

0.0

 

0.0

0.0

0.0

0

0

0.0

0

0.0

 

0.0

0.0

0.0

0

0

0.0

0

0.0

 

0.0

0.0

0.0

0

0

0.0

48

239.5

112.8

90.2

31.5

64

32

31.5

48

239.5

112.8

90.2

31.5

64

32

31.5

48

239.5

112.8

90.2

31.5

64

32

31.5

48

239.5

112.8

90.2

31.5

64

32

31.5

Рис. 4.8. Образ 8 x 8 , реконструированный на рис. 4.11 и его преобразование Хаара.

Преобразование Хаара является простейшим вейвлетным пре­ образованием, однако уже на этом простом примере обнаружива­ ются замечательные свойства этих преобразований. Оказывается, что поддиапазоны низкого уровня состоят из несущественных осо­ бенностей изображения, поэтому их можно смело квантовать и даже отбрасывать. Это дает хорошее сжатие с частичной потерей инфор­ мации, которая, однако не отразится на качестве восстановленно-

4.1. Вычисление средних и полуразностей

го образа. Реконструкция образа делается очень быстро при мини­ мальной потери качества. На рис 4.11 показаны три реконструкции исходного образа размера 8x8 из рис. 4.8. Они получены с помощью, соответственно, 32, 13 и 5 вейвлетных коэффициентов.

(а)

Рис. 4.9. (а) Образ 128 х 128 пикселов с «шероховатостью» справа.

(Ь) Его преобразование.

Рис. 4.10 является аналогичным примером. В части (а) дан двух­ уровневый черно-белый образ, полностью восстановленный с помо­ щью всего 4% коэффициентов (653 коэффициентов из 128 х 128 по­ казаны на рис. (Ь)).

(а)

(Ь)

Рис. 4.10. Восстановление простого образа 128 х 128 пикселов из 4% его коэффициентов.

Мой ЛИЧНЫЙ опыт подсказывает, что лучший способ понять вейвлетные преобразования - это как следует поэкспериментировать с изображениями с различными корреляциями и «шероховатостями»

Глава 4- Вейвлетные методы

пикселов. Подходящее программное обеспечение позволит легко вво­ дить изображения в компьютер и проверять различные особенно­ сти дискретных вейвлетных преобразований для разных парамет­ ров. В помощь читателю на рис. 4.12 приведена программа паке­ та Matlab, которая считывает файл с изображением, вычисляет его преобразование Хаара, отбрасывает заданный процент наименьших коэффициентов преобразования и делает обратное преобразование для восстановления изображения.

(а)

(Ь)

(с)

Рис. 4.11. Три реконструкции образа из 8 х 8 пикселов.

4.1. Вычисление средних и полуразностей

Вейвлетное сжатие изображений пренебрегает частью коэффи­ циентов, поэтому следует определить величину, называемую коэф­ фициентом прореэюивания, равную доли отбрасываемых коэффи­ циентов. Она определяется, как отношение числа ненулевых вейвлетных коэффициентов к числу коэффициентов, оставшихся после отбрасывания. Чем выше коэффициент прореживания, тем меньше вейвлетных коэффициентов было оставлено. Высокий коэффициент прореживания означает сильное сжатие, но с возможным ухудшени­ ем качества изображения. Коэффициент прореживания отдаленно напоминает фактор сжатия, который был определен во введении к этой книге.

В строке «f ilename='lenal28'; dim=128;» записаны имя фай­ ла с изображением и его размер. Файл, использованный автором, был представлен в «сыром» виде. Он состоял из пикселов различ­ ных оттенков серого размера в 1 байт каждый. В файле не было никакого заголовка, не было даже разрешения образа (то есть, чи­ сла строк и столбцов). Тем не менее, Matlab читает любые файлы. Образ предполагался квадратным, а параметр dim должен быть сте­ пенью 2. Присваивание «thresh =» задает процент коэффициентов, которые следует удалить. Это позволяет легко экспериментировать с вейвлетным сжатием.

Файл «harmatt.m» содержит две функции, которые вычисляют преобразование Хаара в матричной форме (см. § 4.2.1).

(Техническое замечание: файлы Matlab с расширением «.т» мо­ гут содержать или последовательность команд, или функции, но не одновременно команды и функции. Однако допускается несколько функций в одном файле, при условии, что только самая верхняя функция будет вызываться извне этого файла. Все остальные функ­ ции должны вызываться только из этого файла. В нашем случае функция harmatt(dim) вызывает функцию individ(n).)

Пример: Программа из рис. 4.12 используется для вычисления преобразования Хаара изображения «Lena». Затем это изображе­ ние реконструируется три раза с отбрасыванием все большего и большего числа коэффициентов деталей. На рис. 4.13 показаны ре­ зультаты восстановления исходного изображения с помощью 3277, 1639 и 820 вейвлетных коэффициентов, соответственно. Несмотря на сильное прореживание коэффициентов, обнаруживается слабая потеря качества картинки. Полное число вейвлетных коэффициен­ тов, конечно, равно разрешению образа, то есть, 128 х 128 = 16384.

Соседние файлы в папке 1