
- •Принципи побудови систем розпізнавання графічних зображень
- •1.1. Загальні відомості
- •1.2 Перетворення зображень у цифрову форму
- •1.2.1 Дискретизація та квантування зображень
- •1.2.2 Бінарний спосіб подання цифрових зображень в пам’яті еом
- •1.3 Попереднє оброблення зображень
- •1.3.1 Редагування яскравості
- •1.3.2 Фільтрація зображень
- •1.3.3 Бінаризація зображень
- •1.3.2 Способи видалення завад на бінаризованих зображеннях
- •1.4. Мінімізація поворотів поштових відправлень у системах розпізнавання поштових індексів
- •Побудова мінімальної послідовності поворотів конвертів (карток)
- •Побудова мінімальної послідовності поворотів посилок
- •1.5 Пошук та захоплення поштового індексу
- •Контрольні питання
- •Список рекомендованої літератури
- •2. Системи розпізнавання стилізованих цифр
- •2.1. Загальні відомості
- •2.1.1 Характеристика систем оптичного розпізнавання символів
- •2.1.2 Характеристики стилізованих цифр
- •2.2. Виділення і запис ознак стилізованих цифр
- •2.3. Класифікація стилізованих цифр
- •Контрольні питання
- •Список рекомендованої літератури
- •3. Системи розпізнавання нормалізованих цифр
- •3.1. Загальні відомості
- •3.2. Виділення і запис ознак нормалізованих цифр
- •3.3. Класифікація нормалізованих цифр
- •Контрольні питання
- •Список рекомендованої літератури
- •4. Системи розпізнавання штрихових кодів
- •4.1. Загальні відомості
- •4.2. Засоби зчитування штрихових кодів
- •За конструктивним виконанням портативний сканер може являти собою олівець, пістолет або пзз-сканер.
- •4.3. Декодування штрихових кодів
- •Контрольні питання
- •Список рекомендованої літератури
- •5. Адаптація алгоритмів розпізнавання до афінних спотворень графічних зображень
- •5.1. Загальна характеристика афінних спотворень графічних зображень
- •5.2. Визначення параметрів афінних спотворень графічних зображень
- •5.3. Урахування параметрів афінних спотворень в алгоритмах розпізнавання графічних зображень
- •Контрольні питання
- •Список рекомендованої літератури
- •6. Оптимізація показників якості розпізнавання графічних зображень
- •6.1. Показники якості розпізнавання графічних зображень
- •6.2. Застосування критерію мінімального ризику при розпізнаванні графічних зображень рукописних цифр
- •6.3. Приклад застосування критерію мінімального ризику при розпізнаванні графічних зображень
- •Контрольні питання
- •Список рекомендованої літератури
- •7. Організація автоматизованого оброблення поштових відправлень на базі розпізнавальних систем поштового зв’язку
- •7.1. Організація автоматизованого сортування поштових відправлень
- •7.2. Організація автоматизованого обліку і контролю пересилання поштових відправлень
- •7.3. Забезпечення розпізнавання поштових індексів у реальному часі
- •Контрольні питання
- •Список рекомендованої літератури
- •8. Від розпізнавання адреси до розпізнавання поштового відправлення
- •8.1. Розширення можливостей розпізнавання конфігурацій шрифтів від надрукованих до рукописних
- •8.2. Збільшення кількості рядків зчитування та розпізнавання
- •8.3. Перехід від розпізнавання адрес на листах до всіх видів пошти
- •8.4. Перехід від розпізнавання тільки адрес до розпізнавання та інтерпретації всіх зображень, позначок та текстів на поштових відправленнях
- •8.5. Перехід від розпізнавання алфавіту однієї мови до багатомовного
- •8.6. Перехід від розпізнавання на одній сортувальній машині до об’єднаної обчислювальної системи сортувальних центрів
- •8.7 Удосконалення баз даних поштових адрес
- •8.8 Удосконалення систем відеокодування
- •8.9. Нові поштові коди та засоби ідентифікації
- •8.10 Перехід від позначення розпізнаного листа штриховим кодом до запам"ятовування образу листа як його ідентифікатора для подальшої обробки
- •8.11. Слідкування за проходженням поштових відправлень на кожному етапі від приймання до вручення та удосконалення розрахунків
2.1.2 Характеристики стилізованих цифр
Стилізовані цифри складаються з сукупностей сегментів (штрихів), розміри і місця розташування яких визначаються трафаретом, надрукованим на поштових конвертах і картках.
Сьогодні знайшли застосування 9-сегментні і 7-сегментні стилізації арабських цифр, основні (рекомендовані) і додаткові (нерекомендовані) конфігурації яких наведено на рис. 2.3 (а – основні конфігурації 9-сегментних цифр; б – основні конфігурації 7-сегментних цифр; в – приклади додаткових 9-сегментних і 7-сегментних конфігурацій цифр).
Рисунок 2.3 – Конфігурації стилізованих цифр
Як ознаки стилізованих цифр виступають самі сегменти, тобто частини конфігурацій цих цифр. При цьому кожний із сегментів може приймати одне з двох значень: 0 (сегмент відсутній) або 1 (сегмент присутній), внаслідок чого будь-яка конфігурація подається відповідним двійковим кодом. Так, наведені на рис. 11 9-сегментна (основна) і 7-сегментна конфігурації цифри 3 подаються відповідно 9-розрядним 110000011 і 7-розрядним 1100111 двійковими кодами (нумерація розрядів справа-наліво).
Оскільки кожний сегмент може приймати два значення, в 9-сегментній стилізації може бути подано 29 = 512, а в 7-сегментній 27 = 128 різних конфігурацій, тобто, будь-яка конфігурація, що розпізнається, сприймається як одна з 512 або одна зі 128 можливих.
Множина можливих конфігурацій розбивається на дві підмножини: підмножину дозволених конфігурацій (конфігурацій, що подають арабські цифри) і підмножину заборонених конфігурацій (конфігурацій, що не подають арабські цифри).
При віднесенні зчитаної з поштового відправлення конфігурації до першой підмножини вона класифікується як відповідна арабська цифра, при віднесенні до другої – відбувається відмова від розпізнавання, тобто приймається рішення про те, що зчитана конфігурація не являє собою жодної з арабських цифр (при цьому поштове відправлення направляється на ручне сортування).
На рис. 2.4 наведено області сегментів при 9-сегментній і 7-сегментній стилізації.
Рисунок 2.4 – Області сегментів стилізованих цифр
Як випливає з рис. 12, області горизонтальних, вертикальних і нахилених сегментів перетиняються, внаслідок чого чорні елементи зображення, що потрапили у місця перетинання областей сегментів, не можуть бути однозначно віднесені до тих чи інших сегментів.
До перетинань областей сегментів можна віднестись двояко: зберегти або вилучити їх із зображень стилізованих цифр.
У першому випадку внаслідок попадання частин одних сегментів в області інших сегментів підвищується ймовірність помилкового виникнення сегментів (помилки першого роду), а у другому – внаслідок укорочення сегментів підвищується ймовірність помилкового зникнення сегментів (помилки другого роду).
Таким чином, в обох випадках підвищується ймовірність помилкового виділення ознак.
Очевидно, що зі зростанням довжин сегментів вплив перетинання сегментів на ймовірність помилкового розпізнавання зменшується.
Сумарні площі зазначених перетинань при ширині сегмента D складають у 9-сегментній і 7-сегментній стилізації відповідно 8,5D2 і 6D2, внаслідок чого ймовірність помилкового виділення ознак при 9-сегментній стилізації виявляється приблизно в 1,4 рази вищою, ніж при 7-сегментній стилізації.
Крім того, при 7-сегментній стилізації, як випливає з подальшого, значно легше реалізувати компенсацію афінних спотворень зображень цифр. Важливим є і те, що кількість нерекомендованих конфігурацій арабських цифр при 7-сегментній стилізації значно менша, ніж при 9-сегментній внаслідок меншої загальної кількості можливих конфігурацій. Слід зазначити також, що виділення нахилених сегментів здійснюється складніше, ніж горизонтальних і вертикальних.
Наведені міркування дають підставу стверджувати, що 9-сегментна стилізація за багатьма показниками поступається 7-сегментній. Виходячи з цього в подальшому розглядається лише 7-сегментна стилізація.
З рис. 12 випливає, що середні частини сегментів несуть в собі більше інформації про ознаки, ніж їх кінцеві частини, тому при виділенні ознак елементам середніх частин сегментів доцільно присвоїти більші значення (ваги), ніж елементам їх кінцевих частин, що рівнозначне збільшенню довжини сегментів.
Наприклад, при реальній довжині сегмента 5 мм і максимальній ширині ліній сегмента 1,25 мм, можна умовно поділити протяжність сегмента на три частини:
частина 1 (від 0 до 1,25 мм) з вагою елементів 1;
частина 2 (від 1,25 до 3,75 мм) з вагою елементів 2;
частина 3 (від 3,75 до 5 мм) з вагою елементів 1.
Очевидно, що зменшення впливу областей перетинання сегментів на надійність виділення ознак стилізованих цифр можна також досягти шляхом застосування операції стоншення ліній сегментів стилізованих цифр у процесі попереднього оброблення розпізнаваних графічних зображень, однак виконання цієї операції внаслідок її трудомісткості потребує застосування ЕОМ з високою швидкодією.