Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
multimedia.doc
Скачиваний:
13
Добавлен:
22.09.2019
Размер:
382.98 Кб
Скачать
  1. Устройства ввода информации в компьютер. Сканер. Принцип действия сканера. Виды сканеров. Специальные типы сканеров. Системы оптического распознавания символов.

Современное общество не может существовать без документооборота. Документы сопровождают нас на каждом шагу. Ежегодно в мире создаются миллиарды больших и малых документов.

Одна из основных задач информатики состоит в разработке и внедрении средств и методов использования вычислительной техники для перевода документооборота из бумажной формы в электронную. Современные сетевые технологии позволяют решить эту задачу, но пока лишь частично. Возможно, в далеком будущем, когда все документы будут сразу готовиться только в электронном виде, человечество сможет перейти полностью к безбумажной технологии, и остатки лесов будут спасены от полного уничтожения, а целлюлозно-бумажные комбинаты перестанут сбрасывать отравленные воды в реки и озера. Однако сегодня персональный компьютер стоит еще не на каждом рабочем месте и не все участники документооборота объединены компьютерными сетями в рабочие группы. Поэтому основным препятствием на пути создания безбумажной технологии стоит проблема ввода исходных данных именно в электронном виде.

В информатике эта проблема решается созданием и внедрением специальных аппаратных и программных средств для перевода графической и текстовой информации в электронную форму.

Автоматизация вода информации в компьютер

Основным методом перевода бумажных документов в электронную форму является сканирование.

Сканирование – это технологический процесс, в результате которого создается графический образ бумажного продукта.

Существует несколько различных видов сканеров, но в их основе лежит один и тот де принцип. Документ освещается светом от специального источника, а отраженный свет воспринимается светочувствительным элементом. Минимальный элемент изображения интерпретируется сканером как цветная (или серая) точка. Таким образом, в результате сканирования документа создается графический файл, в котором хранится растровое изображение исходного документа. Растровое изображение состоит из точек. Количество точек определяется как размером изображения, и а разрешением сканера.

Сканеры для ввода текстов

В настоящее время для ввода текстовой и графической информации используют следующие виды сканеров:

Ручные сканеры.

Это самый простой вид сканеров, дающий наименее качественное изображение. Такой сканер не имеет движущихся частей, и сканирование производится путем перемещения сканера по документу.

Недостатком ручных сканеров является очень узкая полоса сканирования (стандартный лист бумаги приходится сканировать с несколько заходов), а также высокие требования к самому процессу сканирования. Так, если рука, держащая сканер, слегка подрагивает или движется рывками, говорить о хорошем качестве сканирования не приходится. Ручные сканеры пригодны для сканирования текстов, но использовать их для сканирования изображений (фотографий) затруднительно.

Листовые сканеры.

Сканеры этого типа позволяют за одну операцию сканировать лист бумаги стандартного формата. Блок сканирования у таких сканеров неподвижен, а бумага протягивается мимо него при помощи специальных валиков (как в принтере). Листовые сканеры гарантируют хорошее качество сканирования, но они способны сканировать только отдельные листы. Перевести с их помощью в электронную форму страницу книги или разворот журнала невозможно.

Планшетные сканеры.

Они обеспечивают наилучшее качество и максимальное удобство при работе с бумажными документами. Под крышкой планшетного сканера располагается прозрачное основание, на которое укладывают документ. Блок сканирования перемещается вдоль документа внутри корпус сканера.

Специальные типы сканеров:

Барабанные сканеры обеспечивают наивысшее разрешение сканирования, но они предназначены для сканирования не бумажных документов, а прозрачных материалов, например слайдов, негативов и т.п. В сканерах этого типа считывающая головка установлена неподвижно, а изображение, закрепленное на цилиндрическом барабане, вращается с высокой скоростью и сканируется построчно.

Сканеры форм – специальные сканеры для ввода информации с заполненных бланков. Это разновидность листовых сканеров. С помощью подобных устройств вводят данные из анкет, опросных листов, избирательных бюллетеней. От сканеров этого типа требуется не высокая разрешающая способность, а очень высокое быстродействие. В частности, для сканеров этого типа автоматизируют подачу бумажных листов в устройство.

Штрих-сканеры – разновидность ручных сканеров. Предназначены они для считывания штрих-кодов с маркировки товаров в магазинах. Штрих-сканеры позволяют автоматизировать процесс подсчета стоимости покупок.

Поскольку аппаратные интерфейсы сканеров отличаются многообразием, или предприняты специальные меры для стандартизации программного интерфейса, обеспечивающего связь между сканерами и операционной системой. Этот интерфейс основан на специальном протоколе TWAIN. Если сканер поддерживает данный протокол, то операционная система Windows способна обеспечить взаимодействие между сканером и программным приложением, предназначенным для работы с ним. Все современные сканеры поддерживают стандарт TWAIN.

После обработки документа сканером получается графическое изображение документа (графический образ). Но графический образ еще не является текстовым документом. Человеку достаточно взглянуть на лист бумаги с текстом, чтобы понять, что на нем написано. С точки зрения компьютера, документ после сканирования превращается в набор разноцветных точек, а вовсе не в текстовый документ.

Проблема распознавания текста в составе точечного графического изображения является весьма сложной. Подобные задачи решают с помощью специальных программных средств, называемых средствами распознавания образов. Системы оптического распознавания символов (Optical Character Recognition - OCR) предназначены для автоматического ввода печатных документов в компьютер. Современные научные достижения в области распознавания образов буквально перевернули представление об оптическом распознавании символов. Современные программы вполне могут справляться с различными шрифтами без перенастройки. Многие распознают даже рукописные текст.

Поскольку потребность в распознавании текста отсканированных документов достаточно велика, неудивительно, что имеется значительное число программ, предназначенных для этой цели. Так как разные научные методы распознавания текста развивались независимо друг от друга, многие из этих программ используют совершенно разные алгоритмы. Эти алгоритмы могут давать разные результаты на разных документах. Например, упоминавшиеся выше системы OCR способны распознавать только стандартный специально подготовленный шрифт и дают на этом шрифте наилучшие результаты, которые не может превзойти ни одна из более универсальных программ.

Современные алгоритмы распознавания текста не ориентируются ни на конкретный шрифт, ни на конкретный алфавит. Большинство программ способно распознавать текст на нескольких языках. Одни и те же алгоритмы модно использовать для распознавания русского, латинского, арабского и других алфавитов и даже смешанных текстов. Разумеется, программа должна знать. О каком алфавите идет речь.

Нас прежде всего интересуют программы, способные распознавать текст, напечатанный на русском языке. Такие программы выпускаются отечественными производителями. Наиболее широко известны и распространены программы FineReader и CuneiForm. Мы с вами остановимся на программе FimeReader, выпускаемой отечественной компанией ABBYY Software.

FineReader — омнифонтовая система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати, что достигается благодаря применению технологии "целостного целенаправленного адаптивного распознавания".

Программа имеет ряд удобных особенностей. Она позволяет объединять сканирование и распознавание в одну операцию, работать с пакетами документов (или с многостраничными документами) и с бланками. Программу можно обучать для повышения качества распознавания неудачно напечатанн6ых текстов или сложных шрифтов. Она позволяет редактировать распознанный текст и проверять его орфографию. FineReader работает с разными моделями сканеров. В частности, программа поддерживает стандарт TWAIN.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]