Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
10-01-2013_13-05-42 / Лекция 16.doc
Скачиваний:
67
Добавлен:
31.05.2015
Размер:
52.22 Кб
Скачать

Лекция 16

11 Автоматизация обработки документов

11.1 Этапы обработки бумажных документов

Компьютер предназначен для работы с документами, имеющими электронную форму. В то же время, нам часто приходится иметь дело с бумажными изданиями и документами: журналами, книгами, письмами, служебными записками и т.д. Чтобы в работе с информацией такого рода тоже можно было использовать компьютер, необходимы средства преобразования бумажных документов в электронную форму.

Если предполагается, что документ содержит в основном текстовую информацию, то можно выделить следующие основные этапы такого преобразования:

  • в ходе сканирования при помощи устройств оцифровки изображения производится создание электронного образа (изображения) документа;

  • процесс распознавания позволяет преобразовать электронное изображение в текстовые данные (с сохранением элементов форматирования оригинала или без них);

  • для документов, исполненных на иностранном языке, применяют дополнительные средства автоматизированного перевода на другой язык.

11.2 Сканирование документов

Процесс создания электронного изображения бумажного документа напоминает его фотографирование и требует применения соответствующего устройства. Сегодня в качестве такого устройства выступает сканер. Последние поколения цифровых камер уже могут обеспечить для документов стандартного формата качество изображения, которое гарантировало бы их надежное распознавание, однако сканирование часто удобнее и производительнее, чем фотосъемка.

Сканер является внешним устройством и подключается к компьютеру через специальный разъем. При высоком разрешении и большой площади сканируемого документа объем передаваемых данных оказывается очень большим и требует производительной линии передачи. Современные сканеры чаще всего используют для подключения порт USB. Сканеры предыдущих поколений использовали порт принтера (обеспечивает низкую производительность) или интерфейс SCSI (Small Computer System Interface).

Разные модели сканеров понимают разные управляющие команды. Чтобы избежать разнобоя, был принят универсальный стандарт взаимодействия сканера и приложений. Этот стандарт называется TWAIN. Приложение посылает команды драйверу TWAIN, который преобразует их в инструкции, распознаваемые конкретным сканером. Таким образом, для приложения конкретная модель сканера перестает иметь значение. Операционная система Windows ХР поддерживает интерфейс TWAIN, a все современные сканеры совместимы с ним и предоставляют необходимые драйверы нижнего уровня.

Сканирование через посредство интерфейса TWAIN осуществляется следующим образом. Сначала следует включить сканер. Команда сканирования располагается в выбранном пользователем приложении в меню Файл (например, в программе Adobe Photoshop соответствующий пункт запускается через меню ФайлИмпортНазвание TWAIN-драйвера сканера). После выбора этой команды открывается диалоговое окно драйвера TWAIN, вид которого зависит от модели сканера. В этом окне задают параметры сканирования: черно-белый или цветной режим, разрешение, параметры коррекции яркости и контрастности. Большинство сканеров позволяют также произвести предварительное черновое сканирование с низким разрешением и по его результатам точно задать область сканирования – часть страницы документа.

После настройки всех параметров следует щелкнуть на кнопке «Сканировать» (надпись на кнопке может быть иной). Процесс сканирования происходит автоматически, и изображение передается в приложение. Диалоговое окно драйвера TWAIN автоматически не закрывается, так что в многооконных графических редакторах (таких, как Adobe PhotoShop) можно сразу провести сканирование нескольких изображений.

Соседние файлы в папке 10-01-2013_13-05-42