- •Принципи побудови систем розпізнавання графічних зображень
- •1.1. Загальні відомості
- •1.2 Перетворення зображень у цифрову форму
- •1.2.1 Дискретизація та квантування зображень
- •1.2.2 Бінарний спосіб подання цифрових зображень в пам’яті еом
- •1.3 Попереднє оброблення зображень
- •1.3.1 Редагування яскравості
- •1.3.2 Фільтрація зображень
- •1.3.3 Бінаризація зображень
- •1.3.2 Способи видалення завад на бінаризованих зображеннях
- •1.4. Мінімізація поворотів поштових відправлень у системах розпізнавання поштових індексів
- •Побудова мінімальної послідовності поворотів конвертів (карток)
- •Побудова мінімальної послідовності поворотів посилок
- •1.5 Пошук та захоплення поштового індексу
- •Контрольні питання
- •Список рекомендованої літератури
- •2. Системи розпізнавання стилізованих цифр
- •2.1. Загальні відомості
- •2.1.1 Характеристика систем оптичного розпізнавання символів
- •2.1.2 Характеристики стилізованих цифр
- •2.2. Виділення і запис ознак стилізованих цифр
- •2.3. Класифікація стилізованих цифр
- •Контрольні питання
- •Список рекомендованої літератури
- •3. Системи розпізнавання нормалізованих цифр
- •3.1. Загальні відомості
- •3.2. Виділення і запис ознак нормалізованих цифр
- •3.3. Класифікація нормалізованих цифр
- •Контрольні питання
- •Список рекомендованої літератури
- •4. Системи розпізнавання штрихових кодів
- •4.1. Загальні відомості
- •4.2. Засоби зчитування штрихових кодів
- •За конструктивним виконанням портативний сканер може являти собою олівець, пістолет або пзз-сканер.
- •4.3. Декодування штрихових кодів
- •Контрольні питання
- •Список рекомендованої літератури
- •5. Адаптація алгоритмів розпізнавання до афінних спотворень графічних зображень
- •5.1. Загальна характеристика афінних спотворень графічних зображень
- •5.2. Визначення параметрів афінних спотворень графічних зображень
- •5.3. Урахування параметрів афінних спотворень в алгоритмах розпізнавання графічних зображень
- •Контрольні питання
- •Список рекомендованої літератури
- •6. Оптимізація показників якості розпізнавання графічних зображень
- •6.1. Показники якості розпізнавання графічних зображень
- •6.2. Застосування критерію мінімального ризику при розпізнаванні графічних зображень рукописних цифр
- •6.3. Приклад застосування критерію мінімального ризику при розпізнаванні графічних зображень
- •Контрольні питання
- •Список рекомендованої літератури
- •7. Організація автоматизованого оброблення поштових відправлень на базі розпізнавальних систем поштового зв’язку
- •7.1. Організація автоматизованого сортування поштових відправлень
- •7.2. Організація автоматизованого обліку і контролю пересилання поштових відправлень
- •7.3. Забезпечення розпізнавання поштових індексів у реальному часі
- •Контрольні питання
- •Список рекомендованої літератури
- •8. Від розпізнавання адреси до розпізнавання поштового відправлення
- •8.1. Розширення можливостей розпізнавання конфігурацій шрифтів від надрукованих до рукописних
- •8.2. Збільшення кількості рядків зчитування та розпізнавання
- •8.3. Перехід від розпізнавання адрес на листах до всіх видів пошти
- •8.4. Перехід від розпізнавання тільки адрес до розпізнавання та інтерпретації всіх зображень, позначок та текстів на поштових відправленнях
- •8.5. Перехід від розпізнавання алфавіту однієї мови до багатомовного
- •8.6. Перехід від розпізнавання на одній сортувальній машині до об’єднаної обчислювальної системи сортувальних центрів
- •8.7 Удосконалення баз даних поштових адрес
- •8.8 Удосконалення систем відеокодування
- •8.9. Нові поштові коди та засоби ідентифікації
- •8.10 Перехід від позначення розпізнаного листа штриховим кодом до запам"ятовування образу листа як його ідентифікатора для подальшої обробки
- •8.11. Слідкування за проходженням поштових відправлень на кожному етапі від приймання до вручення та удосконалення розрахунків
3.2. Виділення і запис ознак нормалізованих цифр
Виділення ознак нормалізованих цифр здійснюється шляхом послідовного аналізу зверху-вниз елементів кожних двох сусідніх рядків графічного зображення.
На рис. 3.3 наведено приклади виділення топологічних ознак
Рисунок 3.3 – Виділення топологічних ознак
Як топологічні ознаки виступають сукупності чорних сегментів (ліній) графічного зображення, обмежених зверху і знизу білими сегментами. Кожна ознака подається двозначним числом, цифри якого відповідають числу чорних сегментів у лівому і правому рядках зображення. Так, нижня ознака містить три лінії у лівому рядку й одну у правому, звідки випливає двозначне позначення ознаки 31, тобто з’єднання трьох ліній у одну.
Виділення метричних ознак здійснюється шляхом послідовного аналізу прирощень координат сегментів на продовженнях ліній, тобто на топологічних ознаках 11 (одна лінія зліва, одна лінія справа), не фіксованих у ТМ. Так, для пари рядків, наведених на рис. 3.3, топологічній ознаці 11 відповідає метрика НВ (нахил верхній). Остаточна метрична ознака лінії формується шляхом аналізу метрик кожної пари рядків, що подають цю лінію.
Слід наголосити, що назви ознак (П, К, Р, З, С) у ТМ не записуються. Замість них записуються відповідні номери ознак.
Записи ознак у ТМ і ММ розташовуються відповідно до розташування ліній знака (верхнім лініям знака відповідають верхні записи, нижнім – нижні), незалежно від фактичного порядку їх виявлення.
При цьому можливи два випадки:
чергова ознака виявлена нижче усіх раніше виявлених ознак;
чергова ознака виявлена між раніше виявленими ознаками або вище усіх раніше виявлених ознак.
У першому випадку поточна виявлена ознака записується нижче усіх раніше виявлених ознак і їй присвоююється номер, що на одиницю перевищує номер останньої з раніше виявлених ознак.
У другому випадку поточна виявлена ознака записується між відповідними раніше виявленими ознаками або вище усіх раніше виявлених ознак і їй присвоююється номер найближчої раніше виявленої ознаки, що розташована нижче неї, а номери усіх раніше виявлених ознак, розташованих нижче поточної, збільшуються на одиницю.
На рис. 3.4 наведено часові послідовності записів ознак у ТМ, що відповідають двом по-різному деформованим цифрам 3 (підкреслено записи ознак, номери яких замінено).
З рис. 3.4 випливає, що кінцеві записи номерів ознак у ТМ не залежать від поворотів і деформацій цифр у широких межах, що є важливою перевагою прийнятої системи топологічних ознак. Подібна картина, хоча й меншою мірою, спостерігається й у відношенні до метричних ознак.
Особливістю побудови ММ є те, що розміри розпізнаваємих знаків у обмежуючих рамках не нормуються. Замість розповсюдженої операції масштабування знаків уводяться змінні пороги на довжини ліній, що визначаються в залежності від фактичних розмірів знаків. Це дозволяє уникнути деяких помилок, що виникають при масштабуванні знаків.
3.3. Класифікація нормалізованих цифр
Класифікація нормалізованих цифр полягає у порівнянні елементів сформованих ТМ і ММ з еталонними, що заздалегідь уведені у пам’ять ЕОМ.
Для зменшення кількості еталонів нормалізованих цифр ТМ і ММ поділяються на частини (до трьох), кожна з яких містить деяку кількість рядків цих матриць. Поділ знака на частини здійснюється шляхом розділення ліній знака по з’єднаних елементах, тобто по розгалуженнях, з’єднаннях і схрещеннях. Спочатку виділяються лінії, що створюють верхню частину знака, потім – нижню, а ті лінії, що залишилися, автоматично створюють середню частину знака. Так, для заключних матриць рис. 3.4, верхня і нижня частини створюються відповідно першим і четвертим рядками ТМ (розділення за елементами з’єднання четвертого стовпця), а середня – другим і третім рядками ТМ.
Рисунок 3.4 – Часові послідовності записів ознак у ТМ
Після поділу знака на частини визначається тип кожної із них. При цьому вважається (і це підтверджено статистичними дослідженнями), що при написанні цифр їх частини незалежні, тобто, що різні конфігурації однієї і тієї ж цифри створюються шляхом з’єднання її різних частин у будь-яких можливих сполученнях.
У загальному випадку за наявності Nв верхніх, Nн нижніх і Nс середніх частин однієї і тієї ж цифри в пам’яті ЕОМ зберігається лише Nв + Nн + Nс еталонів частин знака, у той час як кількість можливих еталонів розпізнаваємих конфігурацій зазначеної цифри складає Nв Nн Nс.
Реально існує кілька десятків типів частин цифр, з яких можуть бути побудовані (згенеровані) десятки тисяч еталонів, що охоплюють практично усі конфігурації рукописних цифр. Так, при Nв ≈ Nн ≈ Nс ≈ 30, Nв + Nн + Nс ≈ 90, а Nв Nн Nс ≈ 27000.
На рис. 3.5 наведено ілюстрацію розділення знака на частини (а), виділення різних типів цих частин (б) і формування з виділених частин усіх можливих конфігурацій знака (в).
Рисунок 3.5 – Ілюстрація формування конфігурацій розпізнаваємих цифр
Вихідними конфігураціями на рис. 3.5 виступають п’ять різних за топологією конфігурацій цифри 3, в яких присутні два типи верхніх (В1, В2), два типи нижніх (Н1, Н2) і три типи середніх (С1, С2, С3) частин.
З зазначених частин формуються 2 х 2 х 3 = 12 розпізнаваних конфігурацій цифри 3: В1Н1С1, В1Н1С2, В1Н1С3, В1Н2С1, В1Н2С2, В1Н2С3, В2Н1С1, В2Н1С2, В2Н1С3, В2Н2С1, В2Н2С2, В2Н2С3.