- •Ершов б.Л.
- •Конспект лекций
- •Глава 4технологии документационного обеспечения управленческой деятельности
- •4.1. Понятие документа и документооборота
- •4.2. Понятие электронного документа
- •4.3. Создание электронных документов
- •4.4. Сканирование документов
- •4.5. Системы машинного перевода
- •4.6. Предоставление документов в общее пользование и защита документов
- •4.7. Регистрация, учет, контроль и хранение документов в электронном документообороте
- •4.8. Системы документооборота
- •Литература
- •Дополнительная литература:
4.3. Создание электронных документов
Электронные документы в системе электронного документооборота создаются следующими способами:
вручную, набором текста с клавиатуры компьютера и созданием графических и прочих нетекстовых материалов средствами компьютерной техники;
манипулированием структурированными данными, хранящимися в информационной системе организации;
получением по калам связи;
сканированием документов с последующим распознаванием текста;
применением программ голосового ввода текста.
(Пояснить способы получения документов)
Сканирование документа является сравнительно новым способом получения копии документа, быстро ставшего привычным для множества пользователей. Сканирование протекает в два этапа: сначала создается электронная копия образа документа как графического объекта, а потом, в случае необходимости, происходит распознавание текста. После первого этапа документ можно хранить как графический объект и распечатывать на принтере. После второго этапа документ хранится в виде текста и внедренных в него нетекстовых объектов и после несложной обработки может быть помещен в базу данных.
Современные технологии позволяют создавать документы с помощью систем распознавания речи. Для русскоязычных документов такие системы являются достаточно редкими. Для англоязычных документов системы распознавания речи появились на рынке Российской Федерации даже в виде контрафаксной продукции.
4.4. Сканирование документов
Как уже указывалось выше, сканирование документов протекает в два этапа: получение графического образа документа и распознавание текста. Программное обеспечение для сканирования документов поставляется вместе со сканерами, однако наилучшее распознавание текста на сегодняшний день обеспечивают специализированные системы распознавания текста, в частности FineReader, которые интегрируют в себя и систему управления фирменным программным обеспечением сканера.
Рассмотрим процесс сканирования на примере программного обеспечения сканера PrecisionscanPro3.1 фирмыHewlett-Packardи упоминавшейся выше системы распознавания текстаFineReader. Интерфейс программного средстваPrecisionscanPro3.1 включает традиционные меню команд и панель управления. Меню команд включает в себя команды настройки сканера и управления процессом сканирования. Кроме того, в окне имеется две панели. На первой из них помещены пошаговые инструкции, на второй – макет просканированного листа (белый прямоугольник).
Окно программного средства FineReader3bсодержит меню команд, панели управления рабочее поле, на котором в процессе сканирования появляются окна "Изображение", "Параметры распознавания", "Текст" и безымянное, занимающее всю ширину нижней части окна. После нажатия кнопки "Scan&Read" запускается система управления сканером, возврат из которого в средуFineReaderвыполняется по команде "Вернуться в…").
Вначале необходимо провести пробное сканирование и выделить сканируемый фрагмент документа, затем нажать кнопку "Вернуться в…" и произвести окончательное сканирование. В рабочей области окна Fine Reader появятся окна "Изображение" и "Параметры распознавания". Нажатием кнопки "ОК" запускается процесс распознавания, в результате которого образ документа в окне "Изображение", содержащий данные разных типов, разобьется на множество блоков, содержащих однородные данные. Откроются окна "Текст" и безымянное. В первом из них будет представлен результат распознавания, а во втором – увеличенный образ документа. Перед началом процесса распознавания командой меню "Редактор" можно установить правильное положение изображения.
Можно сохранять в файл как графический образ документа для его последующей обработки, так и результат распознавания текста в формате *.rtf, воспринимаемом всеми текстовыми редакторами. При желании можно распознавать документ по отдельным блокам.