- •Принципи побудови систем розпізнавання графічних зображень
- •1.1. Загальні відомості
- •1.2 Перетворення зображень у цифрову форму
- •1.2.1 Дискретизація та квантування зображень
- •1.2.2 Бінарний спосіб подання цифрових зображень в пам’яті еом
- •1.3 Попереднє оброблення зображень
- •1.3.1 Редагування яскравості
- •1.3.2 Фільтрація зображень
- •1.3.3 Бінаризація зображень
- •1.3.2 Способи видалення завад на бінаризованих зображеннях
- •1.4. Мінімізація поворотів поштових відправлень у системах розпізнавання поштових індексів
- •Побудова мінімальної послідовності поворотів конвертів (карток)
- •Побудова мінімальної послідовності поворотів посилок
- •1.5 Пошук та захоплення поштового індексу
- •Контрольні питання
- •Список рекомендованої літератури
- •2. Системи розпізнавання стилізованих цифр
- •2.1. Загальні відомості
- •2.1.1 Характеристика систем оптичного розпізнавання символів
- •2.1.2 Характеристики стилізованих цифр
- •2.2. Виділення і запис ознак стилізованих цифр
- •2.3. Класифікація стилізованих цифр
- •Контрольні питання
- •Список рекомендованої літератури
- •3. Системи розпізнавання нормалізованих цифр
- •3.1. Загальні відомості
- •3.2. Виділення і запис ознак нормалізованих цифр
- •3.3. Класифікація нормалізованих цифр
- •Контрольні питання
- •Список рекомендованої літератури
- •4. Системи розпізнавання штрихових кодів
- •4.1. Загальні відомості
- •4.2. Засоби зчитування штрихових кодів
- •За конструктивним виконанням портативний сканер може являти собою олівець, пістолет або пзз-сканер.
- •4.3. Декодування штрихових кодів
- •Контрольні питання
- •Список рекомендованої літератури
- •5. Адаптація алгоритмів розпізнавання до афінних спотворень графічних зображень
- •5.1. Загальна характеристика афінних спотворень графічних зображень
- •5.2. Визначення параметрів афінних спотворень графічних зображень
- •5.3. Урахування параметрів афінних спотворень в алгоритмах розпізнавання графічних зображень
- •Контрольні питання
- •Список рекомендованої літератури
- •6. Оптимізація показників якості розпізнавання графічних зображень
- •6.1. Показники якості розпізнавання графічних зображень
- •6.2. Застосування критерію мінімального ризику при розпізнаванні графічних зображень рукописних цифр
- •6.3. Приклад застосування критерію мінімального ризику при розпізнаванні графічних зображень
- •Контрольні питання
- •Список рекомендованої літератури
- •7. Організація автоматизованого оброблення поштових відправлень на базі розпізнавальних систем поштового зв’язку
- •7.1. Організація автоматизованого сортування поштових відправлень
- •7.2. Організація автоматизованого обліку і контролю пересилання поштових відправлень
- •7.3. Забезпечення розпізнавання поштових індексів у реальному часі
- •Контрольні питання
- •Список рекомендованої літератури
- •8. Від розпізнавання адреси до розпізнавання поштового відправлення
- •8.1. Розширення можливостей розпізнавання конфігурацій шрифтів від надрукованих до рукописних
- •8.2. Збільшення кількості рядків зчитування та розпізнавання
- •8.3. Перехід від розпізнавання адрес на листах до всіх видів пошти
- •8.4. Перехід від розпізнавання тільки адрес до розпізнавання та інтерпретації всіх зображень, позначок та текстів на поштових відправленнях
- •8.5. Перехід від розпізнавання алфавіту однієї мови до багатомовного
- •8.6. Перехід від розпізнавання на одній сортувальній машині до об’єднаної обчислювальної системи сортувальних центрів
- •8.7 Удосконалення баз даних поштових адрес
- •8.8 Удосконалення систем відеокодування
- •8.9. Нові поштові коди та засоби ідентифікації
- •8.10 Перехід від позначення розпізнаного листа штриховим кодом до запам"ятовування образу листа як його ідентифікатора для подальшої обробки
- •8.11. Слідкування за проходженням поштових відправлень на кожному етапі від приймання до вручення та удосконалення розрахунків
1.2 Перетворення зображень у цифрову форму
Для того щоб перетворити зображення з аналогової форми у цифрову необхідно виконати дві процедури: дискретизацію та квантування. Нехай зображення описується функцією , де – координати у площині зображення, які мають потужність множини дійсних чисел, при цьому їх називають неперервними, а значення – характеристика кольору або яскравість точки зображення з координатами . У загальному випадку, дискретизація полягає у переході від координат , які є дійсними числами, до нових координат , які є цілими числами. При цьому функція замінюється множиною значень , які називаються відліками. У свою чергу квантування полягає у заміні множини значень , яка є множиною дійсних чисел, дискретною скінченою множиною характеристик кольору або яскравості дискретного елементу зображення , де . Після виконання процедур дискретизації та квантування отримують зображення у цифровій формі. Розглянемо процедури дискретизації та квантування більш детально.
1.2.1 Дискретизація та квантування зображень
Дискретизацію аналогового зображення можна виконати різними методами, наприклад, з використанням інтегральних перетворень. На практиці використовується періодична дискретизація, яка полягає у наступному. Обирається крок дискретизації по кожній з координат: та . Далі зображення «розбивається» на окремі елементи, як це схематично зображено на рис. 1.4.
Рисунок 1.4 – Відліки прямокутної періодичної дискретизації
Відповідність між відліками кольору та функцією визначається рівністю
.
Решітку, яку отримують у результаті дискретизації називають растром. Елементи растру (відліки) прийнято називати пікселами. Ця назва походить від англійського терміну "pixel", що є скороченням слів picture element – елемент рисунку, зображення.
Від величини кроків дискретизації залежить розподільна здатність дискретизованого зображення, яку прийнято визначати як кількість пікселів в одному дюймі (1 дюйм дорівнює 2,53 см), яку позначають абревіатурою ppi – pixels per inch. Наприкад, розподільна здатність 60 ppi означає що в одному дюймі міститься 60 пікселів. Від розподільної здатності залежить якість відтворення дискретизованого зображення. Проілюструємо це на прикладі дискретизації зображення трикутника за умови що його розміри 1×1 дюйм.
З наведених рисунків слідує, що чим більша розподільна здатність тим менше відмінностей між реальним та дискретизованим зображеннями.
а) б) в)
Рисунок 1.5 – Дискретизація з різною розподільною здатністю а) оригінальне зображення; б,в) дискретизовані зображення з розподільними здатностями у 4 та 8 ррі.
Звичайно, що не можна як завгодно збільшувати розподільну здатність, тому постає питання визначення умов щодо вибору оптимального кроку дискретизації. Ці умови можна отримати, якщо розглядати як двовимірний сигнал з обмеженим частотним спектром: , . Тоді, згідно з теоремою Котельникова, крок дискретизації повинен задовольняти умовам: , . Виконання цих умов забезпечує максимальну якість дискретизованого зображення та мінімізує помилку відтворення аналогового зображення з дискретизованого.
При цифровій обробці зображень діапазон значень характеристик кольору або яскравості поділяється на ряд дискретних рівнів. Ця процедура називається квантуванням. Розглянемо процедуру квантування на прикладі функції однієї змінної . Квантування цієї функції складається з наступних кроків. Спочатку множина її значень, у найпростішому випадку, розбивається на діапазонів , .
Кожному з цих діапазонів приписується відповідний рівень квантування . Тоді значення функції замінюється на відповідний рівень квантування (див. рис. 1.6). При рівномірному квантуванні, діапазони та рівні визначаються з використанням співвідношень [1.3]
,
,
а середньоквадратична помилка квантування буде дорівнювати . Тобто, як і у випадку дискретизації якість квантованого зображення залежить від кроку квантування .
Рисунок 1.6 – Рівні квантування
З використанням рівномірного квантування розроблено графічний формат ВМР. У цьому форматі використовується адитивна модель відображення кольрів у ЕОМ. Це так звана RGB-модель, або простір кольорів RGB. У цій моделі використовують три основних кольори: червоний – R, зелений – G та синій –B. Довільний колір отримують як суму трьох основних з різними інтенсивностями. Для відображення інтенсивності кожного кольору використовується 256 рівнів квантування. Це дозволяє використовувати у цифровій формі для кодування кожного з цих кольорів один байт. При цьому можна відобразити різних відтінків (людина може розрізняти лише близько 10 млн. відтінків кольору).