
- •Принципи побудови систем розпізнавання графічних зображень
- •1.1. Загальні відомості
- •1.2 Перетворення зображень у цифрову форму
- •1.2.1 Дискретизація та квантування зображень
- •1.2.2 Бінарний спосіб подання цифрових зображень в пам’яті еом
- •1.3 Попереднє оброблення зображень
- •1.3.1 Редагування яскравості
- •1.3.2 Фільтрація зображень
- •1.3.3 Бінаризація зображень
- •1.3.2 Способи видалення завад на бінаризованих зображеннях
- •1.4. Мінімізація поворотів поштових відправлень у системах розпізнавання поштових індексів
- •Побудова мінімальної послідовності поворотів конвертів (карток)
- •Побудова мінімальної послідовності поворотів посилок
- •1.5 Пошук та захоплення поштового індексу
- •Контрольні питання
- •Список рекомендованої літератури
- •2. Системи розпізнавання стилізованих цифр
- •2.1. Загальні відомості
- •2.1.1 Характеристика систем оптичного розпізнавання символів
- •2.1.2 Характеристики стилізованих цифр
- •2.2. Виділення і запис ознак стилізованих цифр
- •2.3. Класифікація стилізованих цифр
- •Контрольні питання
- •Список рекомендованої літератури
- •3. Системи розпізнавання нормалізованих цифр
- •3.1. Загальні відомості
- •3.2. Виділення і запис ознак нормалізованих цифр
- •3.3. Класифікація нормалізованих цифр
- •Контрольні питання
- •Список рекомендованої літератури
- •4. Системи розпізнавання штрихових кодів
- •4.1. Загальні відомості
- •4.2. Засоби зчитування штрихових кодів
- •За конструктивним виконанням портативний сканер може являти собою олівець, пістолет або пзз-сканер.
- •4.3. Декодування штрихових кодів
- •Контрольні питання
- •Список рекомендованої літератури
- •5. Адаптація алгоритмів розпізнавання до афінних спотворень графічних зображень
- •5.1. Загальна характеристика афінних спотворень графічних зображень
- •5.2. Визначення параметрів афінних спотворень графічних зображень
- •5.3. Урахування параметрів афінних спотворень в алгоритмах розпізнавання графічних зображень
- •Контрольні питання
- •Список рекомендованої літератури
- •6. Оптимізація показників якості розпізнавання графічних зображень
- •6.1. Показники якості розпізнавання графічних зображень
- •6.2. Застосування критерію мінімального ризику при розпізнаванні графічних зображень рукописних цифр
- •6.3. Приклад застосування критерію мінімального ризику при розпізнаванні графічних зображень
- •Контрольні питання
- •Список рекомендованої літератури
- •7. Організація автоматизованого оброблення поштових відправлень на базі розпізнавальних систем поштового зв’язку
- •7.1. Організація автоматизованого сортування поштових відправлень
- •7.2. Організація автоматизованого обліку і контролю пересилання поштових відправлень
- •7.3. Забезпечення розпізнавання поштових індексів у реальному часі
- •Контрольні питання
- •Список рекомендованої літератури
- •8. Від розпізнавання адреси до розпізнавання поштового відправлення
- •8.1. Розширення можливостей розпізнавання конфігурацій шрифтів від надрукованих до рукописних
- •8.2. Збільшення кількості рядків зчитування та розпізнавання
- •8.3. Перехід від розпізнавання адрес на листах до всіх видів пошти
- •8.4. Перехід від розпізнавання тільки адрес до розпізнавання та інтерпретації всіх зображень, позначок та текстів на поштових відправленнях
- •8.5. Перехід від розпізнавання алфавіту однієї мови до багатомовного
- •8.6. Перехід від розпізнавання на одній сортувальній машині до об’єднаної обчислювальної системи сортувальних центрів
- •8.7 Удосконалення баз даних поштових адрес
- •8.8 Удосконалення систем відеокодування
- •8.9. Нові поштові коди та засоби ідентифікації
- •8.10 Перехід від позначення розпізнаного листа штриховим кодом до запам"ятовування образу листа як його ідентифікатора для подальшої обробки
- •8.11. Слідкування за проходженням поштових відправлень на кожному етапі від приймання до вручення та удосконалення розрахунків
1.3.2 Фільтрація зображень
Реальні зображення наряду з корисною інформацією можуть містити різні види завад. Джерелами завад є власні шуми оптичних зчитувачів, погана якість оригіналу, шуми каналів зв'язку тощо.
Найбільш розповсюдженою завадою є так званий адитивний білий шум. Його вплив на зображення полягає в адитивному спотворенні кольору або яскравості. Для ахроматичного зображення (зображення у градаціях сірого) вплив білого шуму можна описати за допомогою формули
(1.11)
Тут
– «ідеальне зображення»,
– зображення з завадами,
– білий шум,
– розміри зображення.
Крім білого шуму ще однією з поширених завад є імпульсна завада, або як її називають – завада «сіль – перець». Ця завада проявляється у виді окремих пікселів колір яких суттєво відрізняється від кольору пікселів з найближчого оточення.
Найпростішими методами боротьби з завадами є застосування локальних маскових фільтрів. Найбільш поширеним фільтрами є усереднюючий, гаусівський та медіанний.
При
фільтрації растрових зображень у якості
маски використовується квадратні
матриці розміру
,
тобто з непарною кількістю рядків та
стовпчиків. У випадку маски
,
ця матриця має вид:
(1.12)
Коефіцієнт
та значення елементів матриці
обираються в залежності від виду фільтру
та характеру завад. Елементи цієї
матриці, за певних умов, повинні
задовольняти умові інваріантності
відносно обертань на 900
або 450.
Для
визначення кольору центрального пікселу
використовується згортка матриці
з квадратною частиною (маскою) зображення
такого ж розміру. Нехай маска зображення
має вид
. (1.13)
Тоді згортка цих матриць буде обчислюватись за формулою
(1.14)
де
– значення кольору пікселу на обробленому
зображенні.
Для того щоб відфільтрувати зображення обробляються всі його пікселі.
Для усереднюючого фільтру використовуються наступні матриці
Усереднюючий фільтр використовується у випадку наявності на зображення адитивного білого шуму. Слід зазначити що використання цього фільтру на ряду з видаленням шуму згладжує контури об’єктів.
Наведемо результати використання такого типу фільтрів для покращення якості зображення (див. рис. 1.9). Слід зазначити, що при використанні цього фільтру у випадку наявності імпульсного (зображення на рис зліва знизу) шуму приводить до появи практично білого шуму на зображенні. Взагалі не існує формальних методів за допомогою яких можна визначити, який з фільтрів слід використовувати, для того щоб видалити всі завади. Як правило для конкретного типу зображень з завадами обирають той фільтр, який дає найкращий результат.
Рисунок
1.9 – Використання усереднюючого фільтру
(зліва – зображення з завадами, справа
– оброблені фільтром)
У випадку наявності імпульсного шуму найкращі результати дає використання медіанної фільтрації.
Медіанний
фільтр реалізується наступним чином.
Зображення з маски зчитується в
одновимірний масив
,
кількість елементів якого дорівнює
.
Елементи цього масиву впорядковуються
у порядку зростання. Значення яскравості
пікселу, наприклад,
,
що розташований у центрі маски замінюється
значенням
,
тобто медіаною.
Наприклад,
якщо
,
то після впорядкування він буде мати
вид
,
відповідно
.
На рис. 1.10 наведено результат застосування медіанного фільтру до зображення з імпульсним шумом.
Рисунок
1.10 – Фільтрація імпульсного шуму
медіанним фільтром
Якщо порівняти результати фільтрації цього ж зображення, то можна дійти висновку, застосування медіанного фільтру дає більш якісні результати у порівнянні з усереднюючим фільтром.
Гаусівський фільтр визначається з використанням функції двовимірного розподілу щільності ймовірності Гауса з нульовим середнім значенням
, (1.15)
де
– координати,
– дисперсія.
На рис.
1.11 наведено графік двовимірної
функції Гауса з дисперсією
та нульовим середнім значенням.
Рисунок
1.11 – Двовимірна функція
Гауса.
Для того щоб
побудувати гаусівський фільтр обирають
розмір маски та значення дисперсії.
Розглянемо це на прикладах побудови
гаусівського фільтра з масками
та
.
Для маски
координати її чарунок будуть мати
наступні значення
-
1 (1)
2 (0)
3 (-1)
1 (1)
1,1
1,0
1,-1
2 (0)
0,1
0,0
0,-1
3 (-1)
-1,1
-1,0
-1,-1
Оберемо
та обчислимо значення функції Гауса
Таблиця 1.1 – Значення функції Гауса для маски
-
1
0
-1
1
0,05857953
0,09658132
0,05857953
0
0,09658132
0,15923567
0,09658132
-1
0,05857953
0,09658132
0,05857953
На практиці використовуються цілі значення функції Гауса, для цього помножимо кожне значення на 20, тоді отримаємо, що
Аналогічним чином для маски при значенні множника 400 отримаємо
.
Розглянемо результати фільтрації зображень з використанням побудованих гаусівських фільтрів.
а) б) в)
Рисунок 1.12 – Результати обробки вхідного зображення (а) гаусівськими фільтрами з маскою 3×3 – б) та 5×5 – в)
Як видно з наведених рисунків збільшення розміру маски приводить до більшого розмивання границь об’єктів на зображенні.