Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курсова Стиснення зображення.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
7.16 Mб
Скачать

1.5.3. Вейвлет-кодування

Як і всі методи трансформаційного кодування, розглянуті в попередньому розділі, вейвлет-кодування засноване на тій же ідеї, що коефіцієнти перетворення, що здійснюють декорреляцію значень елементів на зображенні, можуть бути стиснуті більш ефективно, ніж вихідні значення пікселів. Якщо базисні функції перетворення - в даному випадку вейвлети - упаковують більшу частину візуальної важливої ​​інформації в невелике число коефіцієнтів, то залишилися коефіцієнти можуть бути грубо квантовані або обнулені з мінімальними спотвореннями зображення.

На Рис. 1.39 показана типова система вейвлет-кодування. Щоб закодувати зображення розмірами , вибираються вейвлет аналізу і мінімальний рівень розкладання , які використовуються для обчислення дискретного вейвлет-перетворення. Якщо вейвлет має відповідну масштабовану функцію , то може застосовуватися швидке вейвлет-перетворення.

 Рис. 1.38. Ліва колонка: Наближення зображення на Рис. 1.23 при використанні ДКП та масиву коефіцієнтів нормалізації на Рис. 1.37 (6). Правая колонка: Аналогічні результати для масштабованих в 4 рази коефіцієнтів нормалізації. 

а)

б)

Рис. 8.39. Система вейвлет-кодування: (а) кодер, (б) декодер.

У будь-якому випадку, що обчислюється перетворення трансформує значну частину вихідного зображення в горизонтальні, вертикальні і діагональні коефіцієнти розміщення з нульовим середнім і розподілом, близьким розподілу Лапласа. Оскільки багато з обчислених коефіцієнтів несуть малу візуальну інформацію, то вони можуть бути квантованими і стиснуті для зменшення міжкоефіцієнтної і кодової надмірності. Більш того, при квантуванні може враховуватися кореляція позиціонування на Р рівнях розкладання (міжрівневі зв'язки). На останньому кроці кодування символів може використовуватися один або декілька методів кодування без втрат, з числа розглянутих в Розділі 1.4, таких як кодування довжин серій, коди Хаффмана, арифметичне кодування, або кодування бітових площин. Декодування здійснюється інвертуванням операцій кодування - за винятком квантування, яке не є оборотньою операцією.

Принципова відмінність системи вейвлет-кодування на Рис. 1.39 від системи трансформаційного кодування на Рис. 1.28 полягає у відсутності етапу формування окремих блоків. Оскільки вейвлет-перетворення ефективно з точки зору обчислень, і одночасно з цим по суті локально (тобто його базисні функції є просторово обмежені), то не потрібно додаткового розбиття початкового зображення. Як буде видно на наступному прикладі, відсутність такого кроку дозволяє позбутися від блокових спотворень, характерних для методів, заснованих на ДКП, при високих коефіцієнтах стиснення.

Приклад 1.23. Порівняння способів кодування, заснованих на вейвлет-перетворенні та ДКП.

На Рис. 1.40 представлені два наближення напівтонового зображення Рис. 1.23, отримані за допомогою вейвлет-перетворення. Зображення на Рис. 1.40 (а) було відновлено після стиснення 34:1, а 1.40 (6) - після стиснення 67:1. Оскільки ці значення збігаються з коефіцієнтами стиснення в Прикладі 1.22, то зображення на Рис. 1.40 (а) - (е) ​​можуть порівнюватися як якісно, ​​так і кількісно із зображеннями на Рис. 1.38 (а) - (е). Візуальне порівняння показує значне скорочення помилок при вейвлет-кодуванні. Кількісне порівняння показує, що для зображення на Рис. 1.40 (а) стандартне відхилення помилки становить 2,29 рівнів яскравості, в порівнянні з 3,42 рівнів яскравості для зображення на Рис. 1.38 (а). Аналогічні оцінки для зображень на Рис. 1.40 (6) і Рис. 1.38 (6) становлять, відповідно, 6,33 і 2,96. Ці оцінки показують перевагу результатів, заснованих на вейвлет-кодуванні, для обох рівнів стиснення.

Крім зменшення помилок відновлення при використаних рівнях стиснення, вейвлет-кодування - див. Рис. 1.40 (д) і (е) - відмінно покращує (у суб'єктивному змісті) візуальну якість зображення. Це добре видно на Рис. 1.40 (е). Зауважимо повну відсутність блокових спотворень, що домінують на аналогічному фрагменті на Рис. 1.38 (е), стисненим блоковим варіантом трансформаційного кодування.

При збільшенні ступеня стиснення більш ніж 67:1, максимального з використаних в попередніх прикладах, помітним стає пропажа фактури на плаття жінки і розмивання контурів очей. Обидва ефекти видно на Рис. 1.41 (а) і (б), що є результатами відновлення зображення на Рис. 1.23, стисненого вейвлет-кодуванням з коефіцієнтами 108:1 і 167:1. Збільшення розмитості особливо помітно на фрагментах, наведених на Рис. 1.41 (д) і (е). Стандартні відхилення помилок склали 3,72 і 4,73 рівнів яскравості. Суб'єктивна оцінка обох зображень показує їх очевидну перевагу перед результатом стиснення 67:1 на Рис. 1.38 (6), виконаного за допомогою ДКП, стандартне відхилення помилки якого 6,33 рівнів яскравості. Таким чином, при коефіцієнті стиснення більш ніж удвічі вище, рівень помилки у зображенні, стисненого вейвлет-кодуванням, на 25% нижче, ніж у зображення, стиснутого з ДКП; до того ж, перше з них має безсумнівну перевагу в якості. Закінчуючи обговорення стиснення на основі вейвлет-кодування, зробимо короткий огляд основних факторів, що впливають на кодову складність, продуктивність і помилки відновлення.

а) б)

в) г)

д) е)

Рис. 1.40. (а), (в), (д) ​​Результати вейвлет-кодування - порівняйте з результатами кодування із застосуванням ДКП на Рис. 1.38 (а), (в), (д); та (б), (г), (е) аналогічні результати для порівняння з Рис. 1.38 (6), (г), (е).

 

а) б)

в) г)

д) е)

Рис. 1.41. (а), (в) (д) Результати вейвлет-кодування з стисненням 108:1; та (б), (г), (е) аналогічні результати при стисненні 167:1.

Вибір вейвлета

Вейвлети, обрані в якості базису прямого і зворотного перетворень (див. Рис. 1.39), впливають на всі аспекти системи вейвлет-кодування, включаючи як структурну схему, так і ефективність. Від них прямо залежить обчислювальна складність перетворень, і, непрямим чином, можливості системи в відповідність стиснення і відновлення зображень при прийнятному рівні спотворень. Якщо вейвлет-функція, що задає перетворення, має супутню масштабується функцію, то перетворення може бути реалізовано як послідовність операцій цифрової фільтрації. При цьому довжини фільтрів дорівнюють довжинам послідовностей для вейвлет-функції і масштабованої функції. Характеристики стиснення і відновлення зображень з допомогою вейвлет-перетворення визначаються можливостями останнього упаковувати інформацію в мале число коефіцієнтів перетворення.

Найбільш широко використовуваними системами функцій розподілу для стиснення на основі вейвлет-перетворення є системи вейвлетів Добеши і біортогональних вейвлетів. Цифрові фільтри, що відповідають останній системі, володіють рядом корисних властивостей, таких як гладкість, відносно мала довжина і деяке число нульових моментів, які важливі для розкладання та наступного відновлення.

Приклад 1.24. Вейвлет-базис в вейвлет-кодуванні.

Рис. 1.42 містить чотири дискретних вейвлет-перетворення зображення жінки на Рис. 1.23. Зображення на Рис. 1.42 (а) отриманого з використанням вейвлетів Хаара в якості функцій розподілу (базисних функцій), які є єдиними розривними вейвлетами з розглянутих тут. Зображення на Рис. 1.42 (6) отримано з використанням вейвлетів Добеши, що відносяться до числа вейвлетів, найбільш популярних в обробці зображення. Зображення на Рис. 1.42 (в) - з використанням сімлетов (симетричних вейвлетів), що є розширенням вейвлетів Добеши з додатковою симетрією. Для зображення на Рис. 1.42 (г) застосовувалися вейвлети Коена-Добеши-Фово, включені сюди для ілюстрації можливостей біортогональних вейвлетів. Як і раніше на аналогічних прикладах, щоб підвищити наочність виникаючих структур, всі зображення коефіцієнтів були піддані масштабованому градаційному перетворенню, при якому значення 0 відповідає рівень яскравості 128.

а) б)

в) г)

Рис. 1.42. Вейвлет-перетворення зображення на Рис. 1.23 з використанням: (а) вейвлетів Хаара, (б) вейвлетів Добеши, (в) сімлетов, і (г) біортогональних вейвлетів Коена-Добеши-Фово.

Як можна бачити з Таблиці 1.12, для перетворень, поданих на Рис. 1.42, число необхідних операцій множення і склалося на коефіцієнт (для кожного рівня розкладання) збільшується з 4 (для зображення на Рис. 1.42 (а)) до 28 (для зображення на Рис. 1.42 (г)). Всі чотири перетворення виконувалися з використанням швидкого вейвлет-перетворення (тобто блоку фільтрів). Відмітим, що здатність до упаковки інформації зростає зі збільшенням обчислювальної складності (тобто числа ненульових коефіцієнтів фільтрів). При використанні вейвлетів Хаара і усіканням коефіцієнтів деталей на рівні значення 1,5, обнуляються 46% коефіцієнтів перетворення. При використанні більш складних біортогональних вейвлетів, число обнуляємих коефіцієнтів виростає до 55%, збільшуючи при цьому потенціал стиснення на 10%.

Таблиця 1.12. Довжини (кількість ненульових коефіцієнтів) фільтрів вейвлет-перетворення і частка обнуляємих коефіцієнтів при усіканні перетворений на Рис. 1.42 на рівні 1.5.

Вибір рівня розкладання

Іншим важливим чинником, що впливає на обчислювальну складність і рівень помилок відновлення вейлет-кодування, є число рівнів розкладання перетворення. Оскільки Р-масштабне швидке вейвлет-перетворення вимагає Р ітерацій блоку фільтрів, число операцій при обчисленні прямого і зворотного перетворень зростає зі збільшенням числа рівнів розкладання. Більш того, квантування коефіцієнтів зменшуваних масштабів, що вимагає більшого числа рівнів розкладання, впливає на все більшу область відновлюваного зображення. У багатьох додатків, таких як пошук по базі даних зображень чи передача зображень для поступового відновлення, число рівнів перетворення визначається дозволом збережених або передавааних зображень, а також масштабом найменшою з використовуємих копій.

Приклад 1.25. Рівні розкладання в вейвлет-кодуванні.

Таблиця 1.13 ілюструє ефект впливу вибору рівня розкладання на результат кодування зображення на Рис. 1.23 з фіксованим глобальним порогом, рівним 25. Як і в попередніх прикладах використання вейвлет-кодування, усіканню піддалися лише детальні коефіцієнти. У таблиці наведені, як частка обнулених коефіцієнтів, так і результуючі стандартні відхилення помилок відновлення. Зауважимо, що основне стиснення відбувається при початкових розкладаннях. При збільшенні числа рівнів розкладання більше трьох, число обнуляємих коефіцієнтів змінюється мало.

Таблиця 1.13. Вплив рівня розкладання на вейвлет-кодування зображення розмірами 512x512, представленого на Рис. 1.23.

Розрахунок квантувача

Найважливішим фактором, що впливає на коефіцієнт стиснення і точність відновлення зображення у вейвлет-кодуванні, є квантування коефіцієнтів. Хоча найчастіше для різних рівнів застосовуються однакові квантувачі, ефективність квантування може бути помітно підвищена одним з наступних методів: (1) введенням збільшеного інтервалу квантування навколо нуля, названого «мертвою зоною», або (2) узгодження розмірів інтервалу квантування з масштабом. У будь-якому випадку обрані інтервали квантування повинні бути передані декодеру разом з кодованим потоком даних. Самі інтервали можуть визначатися як в ручну, так і автоматично на основі аналізу стислого зображення. Наприклад, глобальний поріг для коефіцієнтів може обчислюватися як медіана модулів детальних коефіцієнтів першого рівня, або ж, як функція числа відкинутих нулів і кількості енергії, яке залишається в відновлюваному зображенні.

Приклад 1.26. Вибір інтервалу «мертвої зони» в вейвлет-кодуванні.

На Рис. 1.43 ілюструється вплив розміру інтервалу «мертвої зони» на частку усікаються детальних коефіцієнтів для трьохрівневого вейвлет-кодування зображення жінки на Рис. 1.23. З збільшення розміру «мертвої зони» число обнуляємих коефіцієнтів також зростає. Вище зламу кривої (тобто більше 4,5) приріст малий; це є наслідком того, що гістограма детальних коефіцієнтів має яскраво виражений пік поблизу нуля. Стандартні відхилення помилок відновлення, відповідні порогу «мертвої зони» на Рис. 1.43, зростають від 0 до 1,77 рівня яскравості при порозі 4,5, і до 2,79 при порозі 18, де число нулів досягає вже 96,43%. Якщо видалити всі детальні коефіцієнти, що збільшить частку нулів приблизно на 1,5%, то помилка відновлення зросте до 7,6 рівнів яскравості.

Рис. 1.43. Вплив розміру інтервалу «мертвої зони» в вейвлет-кодуванні.