Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пiдручник_РСПЗ_03_11.doc
Скачиваний:
30
Добавлен:
08.05.2019
Размер:
3.48 Mб
Скачать

1.3.3 Бінаризація зображень

У випадку коли у якості зчитувального пристрою використовується світлочутлива кольорова матриця, отримане з її допомогою зображення підлягає попередній обробці. Одним із етапів попередньої обробки зображень є бінаризація, яка найбільш широко використовується в системах оптичного розпізнавання символів (ОРС). В процесі бінаризації вхідне зображення в градаціях сірого перетворюється в чорно-біле зображення, яскравості пікселів якого приймають два значення – 0 або 1

Розглянемо основні алгоритми та методи бінаризації півтонових зображень. Історично першим методом бінаризації є метод глобального порогу. Якщо яскравість пікселу менша порогу то йому привласнюється значення 0 (чорний колір), а якщо більше, то 1 (білий колір). Поріг обирається на підґрунті аналізу гістограми яскравості зображення. Для побудови гістограми обчислюється або кількість пікселів, що мають однакову яскравість, або частоти

, (1.16)

де - це кількість пікселів з рівнем яскравості , - загальна кількість пікселів у зображенні.

На практиці ці частоти можуть визначатися не тільки для рівнів яскравості з проміжку 0...255, але і для обраних діапазонів яскравості. На рис. 1.13 наведено приклад гістограми яскравості для деякого півтонового зображення.

Рисунок 1.13 – Бімодальна гістограма

Характерною особливістю цієї гістограми є її бімодальність (тобто вона має два максимуми). При чому один з максимумів відповідає об’єкту, а другий фону. Слід зазначити, що бінаризація з глобальним порогом дає якісні результати лише у випадку коли зображення має чітко виражену бімодальну гістограму. Значення глобального порогу підбирається, на підґрунті аналізу певної множини схожих за контекстом зображень, так щоб воно знаходилось між максимуми гістограми. Після цього бінаризація зображення здійснюється шляхом по елементної заміни значень яскравості на бінарні в результаті порівняння яскравості пікселя пороговим значенням :

(1.17)

де – бінарне значення пікселів вихідного зображення. Піксель зображення для якого виконується умова називатиметься пікселем об’єкту, а в іншому випадку – пікселем фону.

Відзначимо, що коли об'єкт та фон на зображенні займають приблизно однакову площу, то у якості порогу можна обрати середнє значення яскравості зображення. У тому випадку, коли площа, яку займає об'єкт, менша ніж площа фону у якості порогу краще обрати пів суму яскравостей, що відповідають максимумам бімодальної гістограми.

Розглянемо приклад бінаризації поштового індексу з глобальним порогом. На рис. 1.14 наведене зображення індексу у градаціях сірого.

Рисунок 1.14 – Зображення у градаціях сірого

У якості глобального порогу оберемо середнє значення яскравості

(1.18)

де та розмір зображення у пікселах. Згідно з формулою (1.3.6) перевизначимо значення яскравості кожного елементу зображення. У результаті отримаємо бінаризоване зображення поштового індексу

Рисунок 1.15 – Бінаризоване зображення

Як видно з рис. 1.15 значення порогу обрано невдало, останню цифру не вдасться виділити та розпізнати. Необхідно підібрати інше значення порогу, на підставі аналізу результатів бінаризації певної множини поштових індексів. Значення порогу, що дає більш кращі результати таке . На рис. 1.16 наведено результат бінаризації з уточненим значенням порогу.

Рисунок 1.16 – Зображення бінаризоване з підібраним порогом

Існують метод які дозволяють обрати оптимальне значення глобального порогу бінаризації для кожного зображення. Одним з таких методів є метод глобальної бінаризації з вибором оптимального значення порогу – метод Отса. Він полягає в наступному. Зображення поділяється на два класи: – з рівнями яскравості в діапазоні , та - з рівнями яскравості в діапазоні , де – максимальне значення яскравості. Рівень яскравості – початкове наближення порогу, яке обирається як середнє значення яскравості зображення

, (1.19)

Для кожного класу розраховують частоти та , де – кількість пікселів у класах та , відповідно, а –загальна кількість пікселів у зображенні. При цьому . Обчислимо середні значення яскравості у кожному з класів:

, (1.20)

, (1.21)

Для того щоб встановити оптимальне значення глобального порогу розраховується дисперсія між цими класами

. (1.22)

Тоді оптимальне значення порогу буде визначатися з умови максимізації

. (1.23)

Більш простим у реалізації методом глобальної бінаризації є поділ зображення на два кластери за допомогою алгоритму К–середніх. Кластеризацію здійснюють таким чином, щоб мінімізувати середньоквадратичне відхилення

, (1.24)

де – центр кластеру, або центроїд; – яскравість пікселу, що належить -му кластеру. Якщо взяти похідну по від цього виразу, то отримаємо

. (1.25)

Звідси

, (1.26)

тобто, мінімум середньоквадратичного відхилення досягається якщо – середнє значення яскравості в межах кластеру ( – кількість пікселів що належать -му кластеру). В загальних рисах алгоритм К-середніх полягає в наступному. У якості початкових наближень обирають два центороіди: один з мінімальною яскравістю, а другий з максимальною. Будемо вважати, що на множині яскравостей існує функція, яка має властивості відстані , та будемо використовувати у якості відстані або Евклідову метрику або метрику Манхетена. Розподілимо піксели зображення по кластерам, за принципом найменшої відстані, тобто, наприклад, піксел , якщо .

Після того як буде кластеризоване все зображення уточнюються значення центрів кластерів за формулою

, (1.27)

де - номер ітерації. Вважається, що після поточної ітерації значення центрів кластерів будуть не змінюватись, або досягнута задана точність кластеризації , якщо виконується умова

. (1.28)

Після цього всім пікселам кластеру привласнюють значення яскравості 0, а пікселам кластеру – одиниця, та отримують бінаризоване зображення.