Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Теорія цифрового зображення (Лекції 1-3)

.pdf
Скачиваний:
140
Добавлен:
23.02.2016
Размер:
3.02 Mб
Скачать

ТЕОРІЯ ЦИФРОВИХ ЗОБРАЖЕНЬ

Вступ

Інтерес до методів цифрової обробки зображень виростає із двох основних сфер її застосування, якими є підвищення якості зображень для поліпшення його візуального сприйняття людиною і обробка зображень для їх зберігання, передавання і представлення в автономних системах машинного зору.

Зображення можна визначити як двовимірну функцію f(х, у), де х і у - координати в просторі (конкретно, на площині), і значення f в будь-якій точці, що задається парою координат (х, у), називається інтенсивністю або рівнем сірого зображення в цій точці. Якщо величини х, y і f приймають кінцеву кількість дискретних значень, то говорять про цифрове зображення. Цифровою обробкою зображень називають обробку цифрових зображень за допомогою цифрових обчислювальних машин (комп’ютерів). Відмітимо, що цифрове зображення складається з кінцевої кількості елементів, кожен з яких розташований в конкретному місці і набуває певного значення. Ці елементи називають елементами зображення або пікселями. Найчастіше для елементів цифрового зображення використовується термін «піксель».

Одне з перших застосувань цифрових зображень було апробовано в газетній справі для передачі ілюстрацій крізь трансокеанський підводний кабель між Лондоном і Нью-Йорком. На початку 1920-х років була впроваджена система «Бартлейн» для передавання зображень по кабелю, що дозволило зменшити час доставки ілюстрацій через Атлантику із звичайної тижневої затримки до менш ніж трьох годин. На рис. 1 показано зображення, передане таким чином і роздруковане потім на телеграфному друкувальному апараті із спеціальним шрифтом, що імітує різні рівні почорніння.

Рис. 1. Цифрове зображення, отримане в 1921 р. з кодової стрічки на телеграфному апараті з особливим шрифтом.

У всьому діапазоні від обробки зображень до машинного зору немає чітких меж, проте, можна розрізняти комп'ютеризовані процеси низького, середнього і високого рівня. Процеси низького рівня торкаються тільки примітивних операції попередньої обробки з метою зменшення шуму,

підвищення контрасту або поліпшення різкості зображень. Для низькорівневих процесів характерний той факт, що на вході і на виході присутніми є зображення. Обробка зображень на середньому рівні охоплює такі завдання, як сегментація (розподіл зображення на області або виділення на ньому об'єктів), опис об'єктів і стиснення їх у зручну для комп’ютерної обробки форму, а також класифікація (розпізнавання) окремих об’єктів. Для процесів середнього рівня характерна наявність зображень тільки на вході, на вихід же поступають ознаки і атрибути, що витягнуті з цих зображень (наприклад, границі областей, лінії контурів, відмінні ознаки конкретних об’єктів). Нарешті, високорівнева обробка передбачає «осмислення» набору розпізнаних об’єктів, тобто здійснення пізнавальних функцій, які прийнято пов’язувати із зором.

Основні стадії цифрової обробки зображень

Було б корисно розділити викладений в наступних лекціях матеріал на дві великі категорії: методи в яких на вході і на виході є зображення, і методи, де на вхід поступають зображення, а на виході виникають ознаки і атрибути, виділені на підставі цих зображень. Така організація матеріалу зведена в схему, зображену на рис. 2.

Рис. 2. Основні стадії цифрової обробки зображень

Реєстрація зображень – перший із процесів, що показаний на рис. 1.2. Відмітимо, що реєстрація зображення може виявитися гранично простою, у випадку, коли початкове зображення вже представлене в цифровій формі. У загальному випадку стадія реєстрації зображення включає деяку попередню обробку, наприклад, масштабування.

Покращення зображення входить до числа найбільш простих і вражаючих областей цифрової обробки зображень. По суті, методи покращення зображень спрямовані виявлення погано помітних деталей або

просто підкреслення потрібних характеристик на початковому зображенні. Відомим прикладом покращення є посилення контрасту зображення, тому що в результаті «воно виглядатиме краще». Важливо мати на увазі, що покращення якості – дуже суб’єктивна область в обробці зображень.

Відновлення зображень – це область, також пов’язана з підвищенням візуальної якості зображення, проте, на відміну від власне покращення, критерії якого суб’єктивні, відновлення зображення є об’єктивним в тому сенсі, що методи відновлення зображень спираються на математичні або ймовірні моделі спотворень (перекручень) зображення.

Обробка кольорових зображень отримала особливу важливість у зв’язку зі значним розширенням використання кольорових зображень в Інтернеті. Розглядається ряд фундаментальних понять, що відносяться до колірних моделей і основних видів цифрових перетворень кольорів.

Вейвлети утворюють фундамент для представлення зображень з декількома мірами роздільної здатності одночасно. Зокрема, цей апарат використовується стосовно стиснення даних зображення, а також для побудови пірамідального представлення, за якого зображення поетапно розбивається на все дрібніші фрагменти.

Стиснення, як випливає з самої назви, належить до методів зменшення об’єму пам’яті, необхідного для зберігання зображення, або звуження смуги пропускання каналу, потрібної для його передавання.

Морфологічна обробка пов’язана з інструментами для отримання таких компонент зображення, які можуть бути корисні для представлення та опису форми.

Сегментація розділяє зображення на складові частини або об’єкти. В цілому автоматична сегментація належить до найважчих завдань цифрової обробки зображень. Надмірно дробова сегментація відводить процес рішення задачі обробки зображення на складний шлях, якщо вимагається ідентифікувати об’єкти окремо. З іншого боку, недостатньо детальна або ж помилкова сегментація майже неминуче приведе до виникнення помилок на фінальній стадії обробки. Загалом, чим точніше сегментація, тим більше шансів на успіх під час розпізнавання.

Представлення й опис майже завжди відбуваються безпосередньо за етапом сегментації, на виході якого зазвичай є лише необроблені дані про пікселі, які або утворюють границю області, або представляють усі точки самих областей. У обох випадках необхідно перетворити дані у форму, необхідну для комп’ютерної обробки. Перше рішення, яке слід прийняти, – чи повинні ці дані представлятися у формі границь областей або областей цілком.

Розпізнавання є процесом, який привласнює деякому об'єкту ідентифікатор (наприклад, «транспортний засіб») на підставі його описів.

Компоненти системи обробки зображень

На рис. 3 наведені основні компоненти, з яких складається типова універсальна система цифрової обробки зображень, а нижче по черзі обговорюються функцій кожного з її компонентів.

Рис. 3. Компоненти універсальної системи обробки зображень

Що стосується реєстрації, то для отримання цифрових зображень в загальному випадку потрібно два елементи. Перший з них – це чутливий елемент (сенсор), тобто фізичний пристрій, що володіє чутливістю до того виду випромінюваної об’єктом енергії, який ми хочемо відобразити. Другий елемент, цифровий перетворювач, це пристрій, що перетворює аналоговий вихідний сигнал чутливого елементу в цифрову форму. Наприклад, в цифровій відеокамері елементи світлочутливої матриці виробляють електричний сигнал, пропорційний силі світла. Цифровий перетворювач трансформує ці сигнали в цифрові дані.

Спеціалізовані пристрої для обробки зображень зазвичай включають вищезгаданий цифровий перетворювач, а також устаткування, за допомогою якого виконуються інші елементарні операції, як, наприклад, арифметикологічний пристрій (АЛП), який дозволяє виконувати арифметичні і логічні операції паралельно для усього зображення. Один з варіантів використання АЛП – локальне усереднювання зображень одночасно із оцифровуванням – може бути корисний для зниження рівня шуму. Устаткування такого типу іноді називають підсистемою попередньої обробки (або препроцесором); її відмінною характеристикою є висока швидкість роботи. Інакше кажучи, цей блок виконує функції обробки даних, що вимагають високої продуктивності

(наприклад, оцифровування і усереднювання відеозображень зі швидкістю 25 кадрів в секунду), з чим не може впоратися типовий комп’ютер керуючої системи.

Під комп’ютером в системі обробки зображень розуміють універсальну ЕОМ в діапазоні від звичайного персонального комп'ютера (ПК) до суперкомп’ютера. У спеціалізованих додатках для досягнення необхідної продуктивності іноді використовуються комп'ютери спеціальної конструкції. У таких системах практично будь-який добре оснащений ПК придатний для вирішення завдань обробки зображень, що не вимагають роботи в реальному масштабі часу.

Програмне забезпечення для обробки зображень складається зі спеціалізованих модулів, що виконують конкретні операції. У розвинених пакетах програм є також засоби, що дозволяють користувачеві самостійно розробляти програми, які, як мінімум, запускають в роботу спеціалізовані модулі системи. Складніші програмні пакети дозволяють комбінувати виклик цих модулів із звичайними операторами універсальних мов програмування.

Наявність масової пам’яті великого об’єму обов’язкова для практичних завдань обробки зображень. Для зберігання зображення розміром 1024×1024 пікселів, в яких яскравість кожного пікселя представляється 8-бітовою величиною, потрібний один мегабайт пам’яті, якщо не використовуються засоби стиснення зображень. При роботі з тисячами або навіть мільйонами зображень наявність достатньої зовнішньої пам’яті в системі обробки зображень може виявитися проблематичною. Цифрові запам’ятовуючі пристрої для завдань обробки зображень діляться на три основні категорії:

(1)тимчасова пам’ять для короткострокового використання в ході обробки,

(2)зовнішня пам’ять, що володіє відносно коротким часом звернення, і (3) архівна пам'ять, для якої характерні рідкі звернення.

До пристроїв отримання твердих копій належать лазерні і струменеві принтери, пристрої термодруку, плівкові фотокамери і цифрові пристрої, наприклад, оптичні диски. Максимальна роздільна здатність досягається при виведенні на плівку, проте для письмових і друкарських матеріалів природнішим носієм є папір.

З’єднання з телекомунікаційною мережею вже стало майже основною функцією в будь-якій сьогоднішній комп’ютерній системі. Враховуючи великі об’єми даних, пов’язані із завданнями обробки зображень, найважливішим чинником для передавання зображень є пропускна спроможність мережі. У локальних мережах і на виділених каналах телекомунікації труднощів зазвичай не виникає, проте обмін інформацією з віддаленими пунктами через інтернет далеко не завжди виявляється ефективним. На щастя, в результаті розвитку оптоволоконних мереж і інших технологій широкосмугового зв’язку положення в цій сфері швидко виправляється.

Тема 1. Основи цифрового представлення зображень

Лекція 1. Електромагнітний спектр і реєстрація цифрових зображень

Мета: Метою даної лекції є формування знань про світло та електромагнітний спектр, способи реєстрації зображень, а також модель формування цифрового зображення.

План: 1. Світло і електромагнітний спектр; 2. Реєстрація зображення з допомогою одиночного сенсора, лінійні сенсорів, матриці сенсорів; 3. Проста модель формування цифрового зображення.

1. Світло і електромагнітний спектр

У 1666 р. сер Ісаак Ньютон зробив відкриття, що при проходженні променя сонячного світла крізь скляну призму виникає світловий пучок, який має не білий колір, а складається з неперервного кольорового спектру, колір якого змінюється від фіолетового до червоного. Як видно з Рис. 1.1, діапазон кольорів, які ми сприймаємо як видиме світло, становить дуже малу частину спектра електромагнітного випромінювання. На одному кінці цього спектра знаходяться радіохвилі, довжина яких в мільярди разів перевищує довжини хвиль видимого світла, а на іншому кінці - гамма-промені, довжина хвилі яких у мільйони разів менше довжини світлових хвиль. Компоненти електромагнітного спектра можна виражати в термінах довжини хвилі, частоти коливань або енергії. Довжина хвилі ( ) і частота (v ) пов’язані співвідношенням

c

(1.1)

v

 

де с - швидкість світла (2,998-108

м/с). Енергія складової

електромагнітного спектру визначається виразом

 

E hv

(1.2)

де h - постійна Планка. Довжина хвилі вимірюється в метрах, але часто в якості одиниць виміру вживають мікрон (1 мкм = 10-6 м) і нанометр (1 нм = 10-9 м). Частота вимірюється в герцах (Гц); 1 Гц відповідає коливанню з частотою один період в секунду. Загальновживаною одиницею вимірювання енергії фотонів є електрон-вольт (еВ).

Електромагнітні хвилі можна трактувати як синусоїдальні коливання з довжиною хвилі (Рис. 1.2), а можна - як потік частинок з нульовою масою, що рухаються зі швидкістю світла. Кожна така частинка не має маси, але володіє певною енергією і називається квантом випромінювання (фотоном). Зі співвідношення (1.2) видно, що енергія пропорційна частоті, тому електромагнітні коливання більш високої частоти (тобто з коротшою довжиною хвилі) мають більшу енергією фотонів.

Рис. 1.1. Спектр електромагнітних коливань. Видимий спектр показаний в розтягнутому вигляді, але слід підкреслити, що він займає досить вузьку ділянку всього електромагнітного спектру

Рис. 1.2. Графічне представлення довжини хвилі коливань

Таким чином, радіохвилі характеризуються малою енергією фотона, у мікрохвиль енергія більше, у інфрачервоного випромінювання ще більше, далі енергія фотона послідовно зростає для діапазонів видимого спектру, ультрафіолетового випромінювання, рентгенівських променів і, нарешті, гамма-променів, що володіють найбільшою енергією. Саме з цієї причини гамма-випромінювання таке небезпечне для живих організмів.

Світло є особливим видом електромагнітного випромінювання, яке сприймається людським оком. Видимий спектр наведено на рис. 1.1 в розтягнутому вигляді. Цей видимий (колірний) діапазон електромагнітного спектра охоплює діапазон довжин хвиль приблизно від 0,43 мкм (фіолетовий колір) до 0,79 мкм (червоний колір).

Для зручності колірний спектр ділять на сім широких смуг (кольорів): фіолетовий, синій, блакитний, зелений, жовтий, помаранчевий і червоний; але це розмежування не різке, а, швидше, один колір плавно переходить в інший, як показано на Рис. 1.1., подібно до будь-якої іншої складової електромагнітного спектру.

Кольори предметів, що розрізняються зором людини визначаються характером світла, відбитого від цих предметів. Тіло, яке відбиває світло приблизно однаково у всьому видимому діапазоні хвиль, представляється спостерігачеві білим, тоді як тіло, що відбиває світло в певному обмеженому діапазоні довжин хвиль, сприймається з деяким колірним відтінком. Наприклад, зелений предмет в основному відбиває світло з довжинами хвиль 500-570 нм, поглинаючи більшість енергії в інших інтервалах довжин хвиль.

Світло, позбавлене колірного забарвлення (відтінку), називається

ахроматичним або монохроматичним. Єдиним параметром такого освітлення є його інтенсивність, або яскравість. Для опису монохроматичної яскравості також використовується термін рівень сірого, оскільки яскравість змінюється від чорного до білого, з проміжними сірими відтінками. Довжини хвиль електромагнітного випромінювання для хроматичного світла, як уже зазначалося, знаходяться в інтервалі приблизно від 0,43 мкм до 0,79 мкм. Хроматичні джерела світла характеризуються трьома основними величинами: енергетичним потоком, світловим потоком і (суб’єктивної) яскравістю. Енергетичний потік - це загальна кількість енергії, що випромінюється джерелом світла, зазвичай вимірюється у ватах (Вт). Світловий потік, що вимірюється в люменах (лм), характеризує кількість енергії, яку спостерігач сприймає від світлового джерела. Наприклад, світлове джерело, що працює в дальньому інфрачервоному діапазоні, може давати значний енергетичний потік, але спостерігач його практично не відчуває, оскільки світловий потік такого джерела майже нульовий. Нарешті яскравість описує суб’єктивне сприйняття світла і практично не піддається вимірюванню. Вона уособлює поняття інтенсивності в ахроматичному випадку і є одним з ключових чинників під час опису колірного відчуття.

Продовжуючи обговорення рис. 1.1, зауважимо, що короткохвильова область спектра електромагнітного випромінювання представлена гамма- і рентгенівськими променями. Жорстке (з високою енергією) рентгенівське випромінювання використовується для отримання зображень в промисловості. Для отримання рентгенівських зображень грудної клітини використовується верхня (короткохвильова) ділянка діапазону м’якого рентгенівського випромінювання, а в стоматології застосовується нижня ділянка цього діапазону (з меншою енергією). М’які рентгенівські промені плавно переходять в ближній ультрафіолетовий діапазон, довгохвильова

ділянка якого, в свою чергу - у видимий спектр. Рухаючись далі в бік збільшення довжин хвиль, ми зустрінемо інфрачервоний діапазон, в якому випромінюється тепло, що робить його корисним для отримання зображень на основі теплової картини об’єкта. Ділянка інфрачервоного діапазону, що межує з видимим спектром, називається ближнім інфрачервоним діапазоном, а протилежна ділянка - дальнім інфрачервоним діапазоном. Останній плавно переходить у мікрохвильовий діапазон, добре відомий завдяки кухонним мікрохвильовим печам, але також використовується у багатьох інших цілях, в тому числі, для зв’язку та радіолокації.

Нарешті, в діапазоні радіохвиль здійснюється телета радіомовлення, а в області високих енергій цього діапазону проводяться астрономічні спостереження радіосигналів, що випромінюються деякими зоряними тілами.

В принципі, якщо сконструювати чутливий елемент, здатний виявляти випромінювану енергію в деякому діапазоні електромагнітного спектра, то можна отримати необхідне зображення цього діапазону. Проте важливо зауважити, що довжина електромагнітних хвиль, що використовуються для «спостереження» деякого об’єкта, повинна бути менше його розміру. Наприклад, розмір молекули води дорівнює близько 10 10 м, тому для дослідження цих молекул необхідно застосовувати джерело випромінювання в діапазонах ультрафіолетового або м’якого рентгенівського випромінювання. Подібні обмеження, поряд з фізичними властивостями матеріалу, з якого виготовлений чутливий елемент, визначають фізичні межі можливостей сенсорів, що застосовуються для реєстрації зображень, зокрема, оптичних, інфрачервоних або інших.

Хоча переважна більшість отримуваних цифрових зображень заснована на енергії випромінювання електромагнітних хвиль, це не єдиний спосіб генерації зображень. Наприклад відбиті від об’єктів звукові хвилі можуть використовуватися для побудови ультразвукових зображень. Інші важливі джерела цифрових зображень – електронні пучки, що застосовуються в електронній мікроскопії, і комп’ютерний синтез, що використовується для візуалізації та в комп’ютерній графіці.

2. Зчитування та реєстрація зображень

Зображення, яке ми розглядаємо, є двовимірним відображенням спостережуваної сцени (як правило, двоабо тривимірної), що виникає як результат реєстрації променистої енергії, що випромінюється з спостережуваної сцени, за допомогою деякого пристрою - сенсора (або сукупності сенсорів одночасно). Ми припускаємо, що зареєстрований сенсором сигнал виникає в результаті взаємодії джерела «освітлення» з елементами зображуваної «сцени» в умовах ефектів віддзеркалення і поглинання енергії цього джерела. Ми беремо слова освітлення і сцена в лапки, щоб підкреслити той факт, що вони носять значно більш загальний характер, ніж у звичній ситуації, коли джерело видимого світла освітлює звичайну тривимірну побутову сцену. Наприклад, освітлення не тільки може

породжуватися джерелом іншого діапазону електромагнітного випромінювання, наприклад, радіолокаційним, інфрачервоним або рентгенівським, але й надходити з менш традиційних джерел, наприклад, ультразвукового або навіть віртуального, синтезованого комп’ютерною програмою. У ролі елементів сцени можуть виступати знайомі предмети, але цілком можуть бути і молекули, структури підземних пластів або мозок людини. Можна також уявити собі зображення тільки самих джерел, наприклад, знімки Сонця або зірок. Залежно від природи джерела та особливостей сцени, енергія освітлення відбивається від об'єктів сцени або проходить крізь них. Прикладом першого виду може бути світло, відбите від поверхні предметів. Другий вид взаємодії має місце, наприклад, при пропусканні рентгенівських променів крізь тіло пацієнта для отримання діагностичного рентгенівського знімка на плівці.

Енергія, що випромінюються, відбивається, або пропускається елементами сцени, фіксується за допомогою спеціального пристрою реєстрації, чутливого до випромінюваної сценою енергії. У деяких прикладних задачах відбита або пропущена енергія спрямовується на фотоперетворювач (наприклад, екран, вкритий фосфором або іншим фосфоресцуючим матеріалом), який перетворює цю енергію у видиме світло. Такий підхід звичний для електронної мікроскопії і іноді також застосовується при реєстрації зображень в гамма-променях.