Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пiдручник_РСПЗ_03_11.doc
Скачиваний:
24
Добавлен:
08.05.2019
Размер:
3.48 Mб
Скачать

3.2. Виділення і запис ознак нормалізованих цифр

Виділення ознак нормалізованих цифр здійснюється шляхом послідовного аналізу зверху-вниз елементів кожних двох сусідніх рядків графічного зображення.

На рис. 3.3 наведено приклади виділення топологічних ознак

Рисунок 3.3 – Виділення топологічних ознак

Як топологічні ознаки виступають сукупності чорних сегментів (ліній) графічного зображення, обмежених зверху і знизу білими сегментами. Кожна ознака подається двозначним числом, цифри якого відповідають числу чорних сегментів у лівому і правому рядках зображення. Так, нижня ознака містить три лінії у лівому рядку й одну у правому, звідки випливає двозначне позначення ознаки 31, тобто з’єднання трьох ліній у одну.

Виділення метричних ознак здійснюється шляхом послідовного аналізу прирощень координат сегментів на продовженнях ліній, тобто на топологічних ознаках 11 (одна лінія зліва, одна лінія справа), не фіксованих у ТМ. Так, для пари рядків, наведених на рис. 3.3, топологічній ознаці 11 відповідає метрика НВ (нахил верхній). Остаточна метрична ознака лінії формується шляхом аналізу метрик кожної пари рядків, що подають цю лінію.

Слід наголосити, що назви ознак (П, К, Р, З, С) у ТМ не записуються. Замість них записуються відповідні номери ознак.

Записи ознак у ТМ і ММ розташовуються відповідно до розташування ліній знака (верхнім лініям знака відповідають верхні записи, нижнім – нижні), незалежно від фактичного порядку їх виявлення.

При цьому можливи два випадки:

  • чергова ознака виявлена нижче усіх раніше виявлених ознак;

  • чергова ознака виявлена між раніше виявленими ознаками або вище усіх раніше виявлених ознак.

У першому випадку поточна виявлена ознака записується нижче усіх раніше виявлених ознак і їй присвоююється номер, що на одиницю перевищує номер останньої з раніше виявлених ознак.

У другому випадку поточна виявлена ознака записується між відповідними раніше виявленими ознаками або вище усіх раніше виявлених ознак і їй присвоююється номер найближчої раніше виявленої ознаки, що розташована нижче неї, а номери усіх раніше виявлених ознак, розташованих нижче поточної, збільшуються на одиницю.

На рис. 3.4 наведено часові послідовності записів ознак у ТМ, що відповідають двом по-різному деформованим цифрам 3 (підкреслено записи ознак, номери яких замінено).

З рис. 3.4 випливає, що кінцеві записи номерів ознак у ТМ не залежать від поворотів і деформацій цифр у широких межах, що є важливою перевагою прийнятої системи топологічних ознак. Подібна картина, хоча й меншою мірою, спостерігається й у відношенні до метричних ознак.

Особливістю побудови ММ є те, що розміри розпізнаваємих знаків у обмежуючих рамках не нормуються. Замість розповсюдженої операції масштабування знаків уводяться змінні пороги на довжини ліній, що визначаються в залежності від фактичних розмірів знаків. Це дозволяє уникнути деяких помилок, що виникають при масштабуванні знаків.

3.3. Класифікація нормалізованих цифр

Класифікація нормалізованих цифр полягає у порівнянні елементів сформованих ТМ і ММ з еталонними, що заздалегідь уведені у пам’ять ЕОМ.

Для зменшення кількості еталонів нормалізованих цифр ТМ і ММ поділяються на частини (до трьох), кожна з яких містить деяку кількість рядків цих матриць. Поділ знака на частини здійснюється шляхом розділення ліній знака по з’єднаних елементах, тобто по розгалуженнях, з’єднаннях і схрещеннях. Спочатку виділяються лінії, що створюють верхню частину знака, потім – нижню, а ті лінії, що залишилися, автоматично створюють середню частину знака. Так, для заключних матриць рис. 3.4, верхня і нижня частини створюються відповідно першим і четвертим рядками ТМ (розділення за елементами з’єднання четвертого стовпця), а середня – другим і третім рядками ТМ.

Рисунок 3.4 – Часові послідовності записів ознак у ТМ

Після поділу знака на частини визначається тип кожної із них. При цьому вважається (і це підтверджено статистичними дослідженнями), що при написанні цифр їх частини незалежні, тобто, що різні конфігурації однієї і тієї ж цифри створюються шляхом з’єднання її різних частин у будь-яких можливих сполученнях.

У загальному випадку за наявності Nв верхніх, Nн нижніх і Nс середніх частин однієї і тієї ж цифри в пам’яті ЕОМ зберігається лише Nв + Nн + Nс еталонів частин знака, у той час як кількість можливих еталонів розпізнаваємих конфігурацій зазначеної цифри складає Nв Nн Nс.

Реально існує кілька десятків типів частин цифр, з яких можуть бути побудовані (згенеровані) десятки тисяч еталонів, що охоплюють практично усі конфігурації рукописних цифр. Так, при NвNнNс ≈ 30, Nв + Nн + Nс ≈ 90, а Nв Nн Nс ≈ 27000.

На рис. 3.5 наведено ілюстрацію розділення знака на частини (а), виділення різних типів цих частин (б) і формування з виділених частин усіх можливих конфігурацій знака (в).

Рисунок 3.5 – Ілюстрація формування конфігурацій розпізнаваємих цифр

Вихідними конфігураціями на рис. 3.5 виступають п’ять різних за топологією конфігурацій цифри 3, в яких присутні два типи верхніх (В1, В2), два типи нижніх (Н1, Н2) і три типи середніх (С1, С2, С3) частин.

З зазначених частин формуються 2 х 2 х 3 = 12 розпізнаваних конфігурацій цифри 3: В1Н1С1, В1Н1С2, В1Н1С3, В1Н2С1, В1Н2С2, В1Н2С3, В2Н1С1, В2Н1С2, В2Н1С3, В2Н2С1, В2Н2С2, В2Н2С3.