Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пiдручник_РСПЗ_03_11.doc
Скачиваний:
30
Добавлен:
08.05.2019
Размер:
3.48 Mб
Скачать

5.3. Урахування параметрів афінних спотворень в алгоритмах розпізнавання графічних зображень

Будь-які алгоритми розпізнавання графічних зображень, у тому числі рукописних цифр, так чи інакше пов’язані з обходом елементів цих зображень. Оскільки в пам’яті ЕОМ подана матриця двокоординатного зображення, частіше за все як напрями обходу використовуються горизонтальний (по рядках) і вертикальний (по стовпцях).

Під впливом афінних спотворень напрями обходу елементів графічного зображення та їх дискретні довжини змінюються і повинні бути відповідно скориговані.

Враховуючи, що напрями обходу елементів графічного зображення по спотворених горизонталях і по спотворених вертикалях відрізняються лише константою квадранта КК = 2, для визначення зазначених напрямів може бути використаний єдиний алгоритм.

Основною задачею урахування параметрів афінних спотворень в алгоритмах розпізнавання графічних зображень є побудова трас обходу елементів графічного зображення по спотворених горизонталях і по спотворених вертикалях, тобто послідовностей напрямів переходу між сусідніми елементами спотвореного графічного зображення, що відповідають напрямам обходу по горизонталях і по вертикалях первісного графічного зображення.

При цьому необхідно забезпечити щільне прилягання сусідніх трас такого обходу, тобто, забезпечити таке взаємне розташування цих трас, за якого жодний елемент графічного зображення не буде пропущений і жодний елемент не буде врахований двічі.

Принцип побудови трас обходу елементів спотвореного графічного зображення, що задовольняють зазначеним вимогам щільного прилягання, полягає в наступному.

Відповідно до подання нахилених ліній на дискретній площині (рис. 41) будуються базова траса обходу елементів графічного зображення, що з’єднує центральні елементи міток М1 і М2, і дві обмежуючі траси, що з’єднують центральні елементи міток М1 і М3 та М2 і М4.

Сусідня траса обходу елементів графічного зображення будується шляхом паралельного перенесення усіх елементів базової траси на один елемент у вертикальному напрямі зверху-вниз, якщо кути нахилу лінії М1М2 φ ≤ 45°, або на один елемент у горизонтальному напрямі зліва-направо, якщо кути нахилу лінії М1М2 φ ≥ 45°.

Якщо при зазначеному перенесенні крайній елемент формованої траси обходу елементів графічного зображення виходить за обмежуючу трасу, він відкидається, якщо ж виявляється нестача крайнього елемента, – він доповнюється відповідно до рис. 41.

На рис. 5.12 наведено приклади побудови трас обходу елементів виходного (а) і спотвореного графічного зображення при різних кутах його повороту (б – при φ ≤ 45°, в – при φ ≥ 45°).

Рисунок 5.12 – Приклади побудови трас обходу елементів вихідного

і спотвореного графічного зображення

На рис. 5.13 наведено алгоритм побудови трас обходу елементів спотвореного графічного зображення.

Рисунок 5.13 – Алгоритм побудови трас обходу елементів спотвореного

графічного зображення

Алгоритм містить 11 блоків.

У блоці 1 аналізується значення кута φ повороту графічного зображення. При φ ≤ 45° – перехід до блока 2, у протилежному випадку – до блока 3.

У блоці 2 тип базової траси М1М2 обходу елементів графічного зображення визначається як тип Х.

У блоці 3 тип базової траси М1М2 обходу елементів графічного зображення визначається як тип Y.

У блоці 4 типи обмежуючих трас М1М3 і М2М4 визначаються як типи Y.

У блоці 5 типи обмежуючих трас М1М3 і М2М4 визначаються як типи Х.

У блоці 6 напрям перенесення елементів базової траси М1М2 обходу елементів графічного зображення визначається як вертикальний зверху-вниз.

У блоці 7 напрям перенесення елементів базової траси М1М2 обходу елементів графічного зображення визначається як горизонтальний зліва-направо.

У блоці 8 виконується побудова базової траси М1М2 обходу елементів графічного зображення як траси, тип якої визначено у блоках 2, 3 алгоритму.

У блоці 9 виконується побудова обмежуючих трас М1М3 і М2М4 як трас, типи яких визначено у блоках 4, 5 алгоритму.

У блоці 10 здійснюється формування наступної траси обходу елементів графічного зображення шляхом послідовного перенесення усіх елементів попередньої траси обходу елементів графічного зображення на один елемент у напрямі, визначеному у блоках 6, 7 алгоритму, з відкиданням з формованої траси зайвого крайнього елемента, що виходить за обмежуючу трасу, і доповненням формованої траси відсутнім крайнім елементом.

У блоці 11 перевіряється, чи всі траси обходу елементів графічного зображення сформовані. Якщо остання сформована траса не включає центральні елементи міток М3 і М4, тобто, ще не зайняла свого кінцевого положення, здійснюється повернення до блока 10, в протилежному випадку – закінчення роботи алгоритму.

Останнім часом широке розповсюдження знаходить подання поштових індексів у виді ШК.

Розпізнавання ШК багато в чому аналогічне розпізнаванню стилізованих цифр, зокрема, це відноситься до необхідності визначення кута повороту графічного зображення ШК і визначення напряму зчитування його елементів. Разом з цим, розпізнавання ШК не потребує визначення й урахування масштабу графічного зображення, оскільки для розпізнавання ШК важливі не абсолютні значення ширини його елементів, а їх відносні значення (типу більш широкі – більш вузькі).

Можна зазначити два різних підходи до визначення напряму зчитування елементів ШК.

Згідно з першим підходом стартстопні або інші службові знаки замінюються мітками у виді концентричних кілець (рис. 5.7), а напрям лінії зчитування визначається за координатами центральних елементів цих міток (рис. 5.14).

Рисунок 5.14 – Визначення напряму зчитування ШК

Для забезпечення надійності зчитування виконується не менше трьох разів (паралельні лінії ab, cd, ef на рис. 5.14). Лінії зчитування не повинні розташовуватися поблизу одна від одної. Зручно провадити їх на рівнях 0,25; 0,5; 0,75 від основи ШК. Для прийняття рішення про значення індексу, поданого у виді ШК, необхідний збіг даних, отриманих при всіх трьох зчитуваннях, інакше приймається рішення про відмову від розпізнавання.

Згідно з другим підходом напрями ліній зчитування ШК фіксовані заздалегідь таким чином, щоб усі елементи ШК за будь-якого його положення попадали в область зчитування хоча б по одному з цих напрямів.

Визначення кількості напрямів ліній зчитування ШК ілюструється на рис. 5.15.

Рисунок 5.15 – Визначення кількості напрямів ліній зчитування ШК

Як випливає з рис. 5.15, кут θ напряму лінії зчитування ШК пов’язаний з кутом φ повороту зображення ШК і кутом α нахилу діагоналі ШК співвідношенням

φ - α  θ  φ + α.

Звідси випливає, що фіксовані напрями ліній зчитування ШК можуть розташовуватися з кроком, меншим або рівним 2α. Очевидно, що чим більше висота ШК і чим менше його довжина, тим більше α і тим менше потрібно фіксованих напрямів ліній зчитування ШК.

Так, при α = 45° кількість фіксованих напрямів ліній зчитування ШК дорівнює двом (зчитування у горизонтальному і у вертикальному напрямах), при α = 30° – трьом (зчитування під кутами 0°, 60°, 120°), а при α = 22,5° – чотирьом (зчитування під кутами 0°, 45, 90°, 135°).

Реально розміри ШК, що подає поштовий індекс (з урахуванням стартстопних знаків) складає 20 х 50 мм.

Приймаючи до уваги, що для подання індексів потрібні лише цифри, можна скоротити довжину ШК. Для цього кожній з десяти цифр слід надати два коди, один з яких відповідає зчитуванню цифри у прямому напрямі, а інший – у зворотному. Завдяки цьому відпадає потреба у стартстопних знаках, а довжина ШК, що подає індекс, скорочується приблизно на 30%. При цьому кут нахилу діагоналі ШК перевищує 26°, внаслідок чого зчитування ШК забезпечується за допомогою чотирьох напрямів ліній зчитування.

Додаткове скорочення довжини ШК, що подає індекс, може бути досягнене за рахунок переходу від коригуючого коду 39 (три із дев’яти) до коригуючого коду 37 (три із семи), в якому із 35 можливих кодових комбінацій можна вибрати 20 для подання 10 цифр при їх зчитуванні в прямому і зворотному напрямах. При цьому довжина ШК скорочується ще на 15%.

Серед багатьох можливих варіантів такого вибору особливий інтерес являє варіант подання десяткових цифр, наведений у табл. 5.1.

Таблиця 5.1 Варіант подання десяткових цифр

Цифра

Код цифри

прямий

зворотний

0

1111222

2221111

1

1112122

2212111

2

1112212

2122111

3

1121122

2211211

4

1121212

2121211

5

1122112

2112211

6

1211122

2211121

7

1211212

2121121

8

1212112

2112121

9

1221112

2111221

У наведених записах цифрами 1 і 2 позначені відповідно вузькі і широкі елементи коду (штрихи і проміжки). Як випливає з наведених записів подання будь-якої десяткової цифри при її зчитуванні у прямому напрямі завжди починається вузьким і закінчується широким штрихом, а при зчитуванні у зворотному напрямі – навпаки.

Зазначена обставина не тільки дозволяє легко визначити напрям зчитування ШК (як у цілому, так і його окремих елементів), а й забезпечує додаткові можливості виявлення помилок у першому й останньому штрихах кожної цифри. Крім того, враховуючи, що значення десяткових цифр у табл. 11 подані пятьма внутрішніми елементами ШК, які самі по собі являють коригуючий код 25 (два із п’яти), виникають додаткові можливості виявлення помилок при зчитуванні ШК.