- •Тема 1.1. Автоматизированные информационные системы и их классификация
- •Классификация по архитектуре
- •Классификация по степени автоматизации
- •Классификация по характеру обработки данных
- •Классификация по сфере применения
- •Классификация по охвату задач (масштабности)
- •Тема 1.2. Информационные технологии и их классификация
- •Классификация по интерфейсу
- •Классификация по интерактивности
- •Классификация по области применения
- •Классификация по степени применения вычислительных средств
- •Другие виды классификаций ит
- •Тема 1.3. Информационные технологии работы с электронными документами
- •Microsoft Office Document Imaging
- •Readiris
- •OmniPage
- •Abbyy Finereader
- •Ocr cuneiform
- •Средства для организации электронного документооборота
- •Тема 2.1. Цели, задачи, назначение и структура еаис фтс России
- •Требования к структуре и функционированию еаис
- •Требования к надежности еаис
- •Требования к эргономике и технической эстетике
- •Требования к защите от влияния внешних воздействий
- •Требования к эксплуатации и техническому обслуживанию
- •Требования по стандартизации и унификации
- •Требования к информационной безопасности
- •Тема 2.2. Основные компоненты еаис и их характеристика
- •Техническое обеспечение
- •Информационное обеспечение еаис
- •Перечень функциональных подсистем еаис
- •Технологическое обеспечение еаис
- •Тема 2.3. Органы проведения информационно-технической политики фтс России
- •Тема 3.1. Программные комплексы и автоматизированные рабочие места
- •Автоматизированное рабочее место декларанта "Феанор"
- •Арм диспетчера таможенного склада
- •Программа «Таможенные документы»
- •Программа «вэд-склад»
- •Тема 3.2. Электронное декларирование
- •Тема 3.3. Базы и банки данных
- •Тема 3.4. Защита информации в автоматизированных информационных системах
Microsoft Office Document Imaging
В последних версиях офисного пакета Microsoft Office появились инструменты для сканирования и распознавания текста – MS Office Document Scanning (рис. 5) и Document Imaging. Для этих приложений характерна высокая степень интеграции с другими приложениями MS Office, поддерживаются средства индексирования документов. Document Imaging может открывать файлы MDI (собственный формат Microsoft для сжатия изображений) и TIFF, и передавать результаты распознавания в Microsoft Word.
Программа Document Imaging способна работать только с двумя языками: английским и языком локализации самого MS Office. Для поддержки других языков необходимо дополнительно устанавливать пакет Multilingual User Interface (MUI). OCR настроек в программе практически нет, программа в автоматическом режиме поддерживает распознавание типа и размера шрифтов, картинок и простых таблиц.
Рис. 5. Скриншот MS Office Document Scanning (слева)
и MS Office Document Imaging (справа)
Readiris
Readiris разработана компанией I.R.I.S. Так же как и другие программы распознавания текста, Readiris преобразует отсканированные изображения документов в редактируемый формат. Readiris уверенно распознает документы, содержащие сложную верстку, таблицы, иллюстрации.
Существуют Pro и Corporate версии этого продукта, а также добавочные модули распознавания ближневосточных и восточных языков. Версия Corporate отличается от Pro улучшенной работой с PDF, поддержкой сжатия выходных файлов, распознаванием одного пакета в несколько файлов, индексированием распознанных документов и другими возможностями. В Corporate версии есть удобное средство для автоматического распознавания файлов, попадающих в определенную папку (Watched folder).
Поддерживается распознавание текста с более 120 языков распознавания, включая русский, а также ближневосточные языки - арабский, иврит, фарси (в версии Middle-East) и японский, китайский, корейский (в версии Asian). Вместе с поддержкой распознавания популярных форматов картинок распознаются файлы формата PDF и DjVu.
Рис. 6. Скриншот Readiris для Windows
OmniPage
Программа OmniPage, служащая для сканирования и распознавания текста, представлена на рынке компанией Nuance Communications.
Программа отличается высокой скоростью и точностью распознавания. Распознаются более 120 языков с различными алфавитами: латинский, греческий алфавиты, кириллица, китайский, японский и корейский языки. В этой программе есть поддержка параллельной работы с несколькими документами: можно открывать, распознавать, корректировать и сохранять несколько документов одновременно.
OmniPage выпускается в трех версиях: Standard, Professional, Enterprise. Версия Professional, в отличие от Standard, включает средство для управления документами, ParerPort, и программаPDF Create, позволяющее создавать PDF документы из любого приложения. В версии Enterprise добавлены интеграция с Microsoft SharePoint Server, дополнительные сетевые и многопользовательские функции.
В программе реализована технология "3D Correction", которая позволяет корректировать и распознавать изображения, полученные с цифровых камер для более точного распознавания специфических терминов Программа оснащена встроенными словарями – финансовым, юридическим, медицинским.
OmniPage (рис. 6) позволяет сохранять результаты распознавания в PDF, HTML, Microsoft Word, Excel и PowerPoint, Corel WordPerfect и других форматах, имеет возможность распознавания информации из различных электронных форм и анкет.
OmniPage позволяет использовать средства коррекции изображений: удаление шума с рисунков, регулировка контрастности, яркости, других параметров.