- •Принципи побудови систем розпізнавання графічних зображень
- •1.1. Загальні відомості
- •1.2 Перетворення зображень у цифрову форму
- •1.2.1 Дискретизація та квантування зображень
- •1.2.2 Бінарний спосіб подання цифрових зображень в пам’яті еом
- •1.3 Попереднє оброблення зображень
- •1.3.1 Редагування яскравості
- •1.3.2 Фільтрація зображень
- •1.3.3 Бінаризація зображень
- •1.3.2 Способи видалення завад на бінаризованих зображеннях
- •1.4. Мінімізація поворотів поштових відправлень у системах розпізнавання поштових індексів
- •Побудова мінімальної послідовності поворотів конвертів (карток)
- •Побудова мінімальної послідовності поворотів посилок
- •1.5 Пошук та захоплення поштового індексу
- •Контрольні питання
- •Список рекомендованої літератури
- •2. Системи розпізнавання стилізованих цифр
- •2.1. Загальні відомості
- •2.1.1 Характеристика систем оптичного розпізнавання символів
- •2.1.2 Характеристики стилізованих цифр
- •2.2. Виділення і запис ознак стилізованих цифр
- •2.3. Класифікація стилізованих цифр
- •Контрольні питання
- •Список рекомендованої літератури
- •3. Системи розпізнавання нормалізованих цифр
- •3.1. Загальні відомості
- •3.2. Виділення і запис ознак нормалізованих цифр
- •3.3. Класифікація нормалізованих цифр
- •Контрольні питання
- •Список рекомендованої літератури
- •4. Системи розпізнавання штрихових кодів
- •4.1. Загальні відомості
- •4.2. Засоби зчитування штрихових кодів
- •За конструктивним виконанням портативний сканер може являти собою олівець, пістолет або пзз-сканер.
- •4.3. Декодування штрихових кодів
- •Контрольні питання
- •Список рекомендованої літератури
- •5. Адаптація алгоритмів розпізнавання до афінних спотворень графічних зображень
- •5.1. Загальна характеристика афінних спотворень графічних зображень
- •5.2. Визначення параметрів афінних спотворень графічних зображень
- •5.3. Урахування параметрів афінних спотворень в алгоритмах розпізнавання графічних зображень
- •Контрольні питання
- •Список рекомендованої літератури
- •6. Оптимізація показників якості розпізнавання графічних зображень
- •6.1. Показники якості розпізнавання графічних зображень
- •6.2. Застосування критерію мінімального ризику при розпізнаванні графічних зображень рукописних цифр
- •6.3. Приклад застосування критерію мінімального ризику при розпізнаванні графічних зображень
- •Контрольні питання
- •Список рекомендованої літератури
- •7. Організація автоматизованого оброблення поштових відправлень на базі розпізнавальних систем поштового зв’язку
- •7.1. Організація автоматизованого сортування поштових відправлень
- •7.2. Організація автоматизованого обліку і контролю пересилання поштових відправлень
- •7.3. Забезпечення розпізнавання поштових індексів у реальному часі
- •Контрольні питання
- •Список рекомендованої літератури
- •8. Від розпізнавання адреси до розпізнавання поштового відправлення
- •8.1. Розширення можливостей розпізнавання конфігурацій шрифтів від надрукованих до рукописних
- •8.2. Збільшення кількості рядків зчитування та розпізнавання
- •8.3. Перехід від розпізнавання адрес на листах до всіх видів пошти
- •8.4. Перехід від розпізнавання тільки адрес до розпізнавання та інтерпретації всіх зображень, позначок та текстів на поштових відправленнях
- •8.5. Перехід від розпізнавання алфавіту однієї мови до багатомовного
- •8.6. Перехід від розпізнавання на одній сортувальній машині до об’єднаної обчислювальної системи сортувальних центрів
- •8.7 Удосконалення баз даних поштових адрес
- •8.8 Удосконалення систем відеокодування
- •8.9. Нові поштові коди та засоби ідентифікації
- •8.10 Перехід від позначення розпізнаного листа штриховим кодом до запам"ятовування образу листа як його ідентифікатора для подальшої обробки
- •8.11. Слідкування за проходженням поштових відправлень на кожному етапі від приймання до вручення та удосконалення розрахунків
1.3.3 Бінаризація зображень
У випадку коли у якості зчитувального пристрою використовується світлочутлива кольорова матриця, отримане з її допомогою зображення підлягає попередній обробці. Одним із етапів попередньої обробки зображень є бінаризація, яка найбільш широко використовується в системах оптичного розпізнавання символів (ОРС). В процесі бінаризації вхідне зображення в градаціях сірого перетворюється в чорно-біле зображення, яскравості пікселів якого приймають два значення – 0 або 1
Розглянемо основні алгоритми та методи бінаризації півтонових зображень. Історично першим методом бінаризації є метод глобального порогу. Якщо яскравість пікселу менша порогу то йому привласнюється значення 0 (чорний колір), а якщо більше, то 1 (білий колір). Поріг обирається на підґрунті аналізу гістограми яскравості зображення. Для побудови гістограми обчислюється або кількість пікселів, що мають однакову яскравість, або частоти
,
(1.16)
де
- це кількість пікселів з рівнем яскравості
,
-
загальна кількість пікселів у зображенні.
На практиці ці частоти можуть визначатися не тільки для рівнів яскравості з проміжку 0...255, але і для обраних діапазонів яскравості. На рис. 1.13 наведено приклад гістограми яскравості для деякого півтонового зображення.
Рисунок
1.13 – Бімодальна гістограма
Характерною
особливістю цієї гістограми є її
бімодальність (тобто вона має два
максимуми). При чому один з максимумів
відповідає об’єкту, а другий фону. Слід
зазначити, що бінаризація з глобальним
порогом дає якісні результати лише у
випадку коли зображення має чітко
виражену бімодальну гістограму. Значення
глобального порогу
підбирається, на підґрунті аналізу
певної множини схожих за контекстом
зображень, так щоб воно знаходилось між
максимуми гістограми. Після цього
бінаризація зображення здійснюється
шляхом по елементної заміни значень
яскравості на бінарні в результаті
порівняння яскравості
пікселя пороговим значенням
:
(1.17)
де
– бінарне значення пікселів вихідного
зображення. Піксель зображення для
якого виконується умова
називатиметься пікселем об’єкту, а в
іншому випадку – пікселем фону.
Відзначимо,
що коли об'єкт та фон на зображенні
займають приблизно однакову площу, то
у якості порогу
можна обрати середнє значення яскравості
зображення. У тому випадку, коли площа,
яку займає об'єкт, менша ніж площа фону
у якості порогу
краще обрати пів суму яскравостей, що
відповідають максимумам бімодальної
гістограми.
Розглянемо приклад бінаризації поштового індексу з глобальним порогом. На рис. 1.14 наведене зображення індексу у градаціях сірого.
Рисунок
1.14 – Зображення у градаціях сірого
У якості глобального порогу оберемо середнє значення яскравості
(1.18)
де
та
розмір зображення у пікселах. Згідно з
формулою (1.3.6) перевизначимо значення
яскравості кожного елементу зображення.
У результаті отримаємо бінаризоване
зображення поштового індексу
Рисунок
1.15 – Бінаризоване зображення
Як
видно з рис. 1.15 значення порогу обрано
невдало, останню цифру не вдасться
виділити та розпізнати. Необхідно
підібрати інше значення порогу, на
підставі аналізу результатів бінаризації
певної множини поштових індексів.
Значення порогу, що дає більш кращі
результати таке
.
На рис. 1.16 наведено результат бінаризації
з уточненим значенням порогу.
Рисунок
1.16 – Зображення бінаризоване з підібраним
порогом
Існують
метод які дозволяють обрати оптимальне
значення глобального порогу бінаризації
для кожного зображення. Одним з таких
методів є метод глобальної бінаризації
з вибором оптимального значення порогу
– метод Отса. Він полягає в наступному.
Зображення поділяється на два класи:
– з рівнями яскравості в діапазоні
,
та
- з рівнями яскравості в діапазоні
,
де
– максимальне значення яскравості.
Рівень яскравості
– початкове наближення порогу, яке
обирається як середнє значення яскравості
зображення
, (1.19)
Для
кожного класу розраховують частоти
та
,
де
– кількість пікселів у класах
та
,
відповідно, а
–загальна
кількість пікселів у зображенні. При
цьому
.
Обчислимо середні значення яскравості
у кожному з класів:
,
(1.20)
, (1.21)
Для того щоб встановити оптимальне значення глобального порогу розраховується дисперсія між цими класами
. (1.22)
Тоді
оптимальне значення порогу буде
визначатися з умови максимізації
. (1.23)
Більш простим у реалізації методом глобальної бінаризації є поділ зображення на два кластери за допомогою алгоритму К–середніх. Кластеризацію здійснюють таким чином, щоб мінімізувати середньоквадратичне відхилення
, (1.24)
де
–
центр кластеру, або центроїд;
– яскравість пікселу, що належить
-му
кластеру. Якщо взяти похідну по
від цього виразу, то отримаємо
. (1.25)
Звідси
, (1.26)
тобто,
мінімум середньоквадратичного відхилення
досягається якщо
– середнє значення яскравості в межах
кластеру (
– кількість пікселів що належать
-му
кластеру). В загальних рисах алгоритм
К-середніх полягає в наступному. У якості
початкових наближень обирають два
центороіди: один з мінімальною яскравістю,
а другий з максимальною. Будемо вважати,
що на множині яскравостей існує функція,
яка має властивості відстані
,
та будемо використовувати у якості
відстані або Евклідову метрику або
метрику Манхетена. Розподілимо піксели
зображення по кластерам, за принципом
найменшої відстані, тобто, наприклад,
піксел
,
якщо
.
Після того як буде кластеризоване все зображення уточнюються значення центрів кластерів за формулою
, (1.27)
де
- номер ітерації. Вважається, що після
поточної ітерації
значення центрів кластерів будуть не
змінюватись, або досягнута задана
точність кластеризації
,
якщо виконується умова
. (1.28)
Після цього всім
пікселам кластеру
привласнюють значення яскравості 0, а
пікселам кластеру
– одиниця, та отримують бінаризоване
зображення.
