8.9 Программное обеспечение сканеров

Сканер производит растровое изображение или bitmag – данные, - набор точек, не имеющих между собой никаких формальных связей. Только глядя на экран, можно определить, что данный набор представляет линию, окружность, и т. д. Компьютер же ничего не знает о способе распространения точек, разве только в том случае, если у него есть некое “распознающее” программное обеспечение, например, OCR.

Файл чертежа САПР представляет собой набор описаний объектов (линий, дуг, окружностей и т. д.), размеры и положение которых определенны систематическими координатами. Такие данные называются также векторными данными.

Революционным прорывом в растровом редактировании стала возможность работы с “гибридными” рисунками, содержащими растровые и векторные данные одновременно. В современных гибридных редакторах растровое изображение может редактироваться с применением инструментарии САПР. Раньше, даже если требовалось совсем незначительное изменение, изображение следовало векторизовать целиком – долгий и дорогостоящий процесс. Теперь стало возможным векторизовать только редактируемые объекты растрового изображения, В результате получая гибридный растрово - векторный файл, который может храниться и вводиться на плоттер как единое целое.

В добавление к гибридному растрово – векторному программному обеспечению появились также редакторы, дфющие возможность квазивекторного редактирования сканированных изображений в растровом формате. Более современное программное обеспечение этого типа может включать распознавание текстовых символов (OCR) и геометрических элементов, таких как линии и окружности.

8.9.1 Ocr. Распознавание образов

Система оптического распознавания образов – массовое явление. При помощи специальных устройств образы считываются с штрих – кодовых наклеек, кредитных и телефонных карт, банковсих платежнвх документов, бумажных денег, векселей. Номер и коды на такие документы могут быть нанесены типографическим способом, в том числе магнитной краской, а могут быть выдавлены или отштампованы. В мировом бизнесе, банковском деле распознавание образов широко распространено, а в России только начинается.

8.9.2 Распознавание текстов.

В банковских документах, предназначенных для систем распознавания, считываются только цифры и прописные буквы, набранные стандартным шрифтом. Это сводит к минимуму трудности распознавания образов.

Гораздо труднее научить программу распознавать книжный, газетный или журнальный текст, распечатанный на принтере или по факсу.

На одной полиграфической странице обычно встречается до трех и более шрифтов, причем отдельные участки текста могут быть оформлены с разными типами выделения, а также с изменением основного типа символа.

Тексты часто бывают многоязычными и надо различать русскую букву “c” от английской“c”, а это совершенно разные символы и т. д. В решение распознавания смешанных текстов все без исключения системы OCR используют встроенные словари. При этом качество распознавания обычно хуже, чем при чтении одноязычных текстов.

Но коренная проблема состоит в начертаниях. Изначально на нашем рынке преобладали системы, требующие обучение каждому новому шрифту, - тип multifolt. Апофеозом многошрифтовых обучаемых программ стал пакет TIGER 2.0, который содержал шрифты около 30 различных гарнитур, используемых в российской типографии со всеми их типовыми выделениями. TIGER автоматически определяет шрифт, стиль и размер символов, разбивая страницу на участки, набранные различными гарнитурами, и при этом работает быстро.

Противоположным классом OCR – систем являются интеллектуальные программы – omnifont. Их не нужно обучать. Эта программа должна различать: «Д», «д», «д» как одну и ту же букву, так как она знает топологию буквы д. Будущее именно за интеллектуальными программами.

<<< < Предыдущая 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 5152 / 5952 53 54 55 56 57 58 59 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025260.61 Кб0Методичка по научно-исследов. практике _Превент...doc
#
01.07.202550.14 Кб0методичка по образ.прог.нач шк.docx
#
29.09.2019153.6 Кб2методичка по ОДКБ.doc
#
29.04.2019699.9 Кб1методичка по оформлению.doc
#
14.09.20191.35 Mб8Методичка по практ.зан.Документ Microsoft Word.doc
#
01.07.202511.64 Mб0Методичка по практике ЭВМ и ПУ.doc
#
22.02.2015556.54 Кб64Методичка по практике.doc
#
14.09.2019108.3 Кб4методичка по практике.docx
#
01.07.2025568.4 Кб1Методичка по ПРЕОБРАЗОВАТЕЛЬНОЙ ТЕХНИКЕ.docx
#
01.07.2025128 Кб1методичка по псих.защитам личности.doc
#
13.03.20162.55 Mб24методичка по реле.pdf