- •О необходимости навыков работы в современном офисе
- •Назначение курса, основные понятия Офис, делопроизводство, автоматизация делопроизводства
- •Структура курса
- •Благодарности
- •1.Офисное делопроизводство: 1. Лекция: Эволюция делопроизводства и офисных технологий: версия для печати и pda
- •История делопроизводства
- •Эволюция компьютеризации предприятий
- •Эволюция офисного программного обеспечения
- •1.Офисное делопроизводство: 2. Лекция: Современные офисные пакеты: версия для печати и pda
- •Интеграция приложений ms Office
- •Дополнительные офисные программы
- •Альтернативные офисные пакеты
- •1.Офисное делопроизводство: 3. Лекция: Документооборот на современном предприятии: версия для печати и pda
- •Информационные связи предприятия Типовая структура предприятия
- •Структура современного коммерческого предприятия
- •Интернет/интранет и структура предприятия
- •Офисная техника и информационные потоки в современном офисе
- •Технологии перевода бумажных документов в электронные
- •Ввод формализованных документов
- •Виды систем ввода документов
- •Продукты для персонального ввода неформализованных документов
- •Продукты для промышленного ввода документов
- •Продукты для персонального ввода форм
- •Продукты для промышленного ввода форм
- •1.Офисное делопроизводство: 4. Лекция: Документационное обеспечение управления: версия для печати и pda Общая структура документационного обеспечения управления
- •Нормативная база делопроизводства
- •Основные требования к оформлению документов Реквизиты документов
- •Обязательные реквизиты
- •Классификаторы
- •Специфика языка документов
- •Стиль организационно-распорядительной документации
- •Язык деловой переписки
- •1.Офисное делопроизводство: 5. Лекция: Документооборот с использованием технических средств: версия для печати и pda Автоматизация документооборота
- •Юридическая сила электронного документа
- •Электронный обмен неюридическими документами
- •Дублирующий обмен юридическими документами
- •Документооборот на предприятиях разного масштаба Документооборот на базе электронной почты
- •Системы автоматизированного документооборота
- •Примеры систем автоматизации делопроизводства и документооборота
Ввод формализованных документов
Чтобы пояснить, какие задачи возникают при вводе формализованных документов, рассмотрим конкретный пример.
Предположим, в офисе отеля проводится анкетирование проживающих для оценки уровня обслуживания на разных этажах. Каждому жителю отеля в его номере оставляется анкета, которую он должен заполнить (рис. 3.8).
Рис. 3.8. Пример заполненной анкеты
Если за месяц накапливается несколько тысяч таких анкет, то их обработка представляет собой непростую задачу. Очевидно, что получение образов (электронных изображений) этих анкет хоть и облегчает задачу их хранения, однако не позволяет использовать компьютер для обработки информации.
Чаще всего задача ввода форм (в данном случае анкеты) состоит в превращении образа документа в строчку базы данных, содержащую соответствующую информацию. Когда все анкеты будут введены в базу данных, можно будет их обработать и, например, выяснить, на каком этаже обслуживание ведется лучше.
При заполнении анкеты требуется ответить на вопросы и внести информацию в определенные служебные поля, а задача программы при вводе форм - определять эти специальные поля, распознавать информацию в них и ввести ее в базу данных. При этом особенностью ввода форм в компьютер является необходимость распознавания текстов, заполненных от руки.
Обычно в том случае, если форма должна распознаваться компьютером, заполняющего просят ввести текст раздельными буквами, и такой текст называют рукопечатным. Технологии распознавания рукопечатных символов обозначаются термином ICR (Intelligent Character Recognition). Распознавание рукопечатных символов представляет собой более сложную задачу по сравнению с распознаванием печатных, поскольку требуется распознать символ, вписанный в форму от руки с учетом возможных его отклонений, обусловленных индивидуальными особенностями почерка.
Рис. 3.9. Схема перевода бумажной формы в запись базы данных
Задачи распознавания при вводе форм не обязательно связаны с распознаванием текста. При вводе форм может потребоваться распознавание различных меток и знаков, для которого тоже существует свой термин: OMR (Optical Mark Recognition). Например, в бюллетенях для голосования голосующего просят поставить крестик (или другой знак) напротив фамилии кандидата, и задача компьютера - распознать, есть в определенном поле какой-нибудь знак или нет.
Виды систем ввода документов
Помимо технологических аспектов, о которых мы говорили выше, существует также специфика, связанная с масштабом использования технологии ввода бумажных документов. Действительно, когда говорят о домашних или о персональных системах ввода документов, то обычно подразумевают именно распознавание неформализованных документов, при незначительном количестве ввода документов за единицу времени. В данном случае на первое место выходит именно технология OCR.
Напротив, ввод формализованных документов - это технология, которая обычно используется в организациях и имеет массовый характер. В данном случае наряду с распознаванием текстов встает масса технологических проблем: организация поточного (массового) сканирования, распределенная обработка, встраивание решения в корпоративные системы документооборота и т.д. Технологии, обеспечивающие решение данного набора задач, называют технологиями Data Capture.
Data Capture (дословно "захват данных") - это комплекс мероприятий по переводу бумажных документов в электронный архив для хранения и обеспечения доступа к ним.
Из отечественных компаний на рынке ввода и распознавания документов и форм наиболее активно работают фирмы ABBYY и Cognitive Technologies.
Системы ввода документов с учетом масштаба технологии можно разделить на четыре вида:
Рис. 3.10. Классификация программ для перевода документов в электронный вид
