Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка по практике ЭВМ и ПУ.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
11.64 Mб
Скачать

8.9 Программное обеспечение сканеров

Сканер производит растровое изображение или bitmag – данные, - набор точек, не имеющих между собой никаких формальных связей. Только глядя на экран, можно определить, что данный набор представляет линию, окружность, и т. д. Компьютер же ничего не знает о способе распространения точек, разве только в том случае, если у него есть некое “распознающее” программное обеспечение, например, OCR.

Файл чертежа САПР представляет собой набор описаний объектов (линий, дуг, окружностей и т. д.), размеры и положение которых определенны систематическими координатами. Такие данные называются также векторными данными.

Революционным прорывом в растровом редактировании стала возможность работы с “гибридными” рисунками, содержащими растровые и векторные данные одновременно. В современных гибридных редакторах растровое изображение может редактироваться с применением инструментарии САПР. Раньше, даже если требовалось совсем незначительное изменение, изображение следовало векторизовать целиком – долгий и дорогостоящий процесс. Теперь стало возможным векторизовать только редактируемые объекты растрового изображения, В результате получая гибридный растрово - векторный файл, который может храниться и вводиться на плоттер как единое целое.

В добавление к гибридному растрово – векторному программному обеспечению появились также редакторы, дфющие возможность квазивекторного редактирования сканированных изображений в растровом формате. Более современное программное обеспечение этого типа может включать распознавание текстовых символов (OCR) и геометрических элементов, таких как линии и окружности.

8.9.1 Ocr. Распознавание образов

Система оптического распознавания образов – массовое явление. При помощи специальных устройств образы считываются с штрих – кодовых наклеек, кредитных и телефонных карт, банковсих платежнвх документов, бумажных денег, векселей. Номер и коды на такие документы могут быть нанесены типографическим способом, в том числе магнитной краской, а могут быть выдавлены или отштампованы. В мировом бизнесе, банковском деле распознавание образов широко распространено, а в России только начинается.

8.9.2 Распознавание текстов.

В банковских документах, предназначенных для систем распознавания, считываются только цифры и прописные буквы, набранные стандартным шрифтом. Это сводит к минимуму трудности распознавания образов.

Гораздо труднее научить программу распознавать книжный, газетный или журнальный текст, распечатанный на принтере или по факсу.

На одной полиграфической странице обычно встречается до трех и более шрифтов, причем отдельные участки текста могут быть оформлены с разными типами выделения, а также с изменением основного типа символа.

Тексты часто бывают многоязычными и надо различать русскую букву “c” от английской“c”, а это совершенно разные символы и т. д. В решение распознавания смешанных текстов все без исключения системы OCR используют встроенные словари. При этом качество распознавания обычно хуже, чем при чтении одноязычных текстов.

Но коренная проблема состоит в начертаниях. Изначально на нашем рынке преобладали системы, требующие обучение каждому новому шрифту, - тип multifolt. Апофеозом многошрифтовых обучаемых программ стал пакет TIGER 2.0, который содержал шрифты около 30 различных гарнитур, используемых в российской типографии со всеми их типовыми выделениями. TIGER автоматически определяет шрифт, стиль и размер символов, разбивая страницу на участки, набранные различными гарнитурами, и при этом работает быстро.

Противоположным классом OCR – систем являются интеллектуальные программы – omnifont. Их не нужно обучать. Эта программа должна различать: «Д», «д», «д» как одну и ту же букву, так как она знает топологию буквы д. Будущее именно за интеллектуальными программами.