- •Тема 1.
- •1. Информация в материальном мире
- •2. Данные
- •2.1. Носители данных
- •2.2. Операции с данными
- •2.3. Кодирование данных двоичным кодом
- •2.4. Кодирование целых и действительных чисел
- •2.5. Кодирование текстовых данных
- •Базовая таблица кодировки ascii
- •2.6. Кодирование графических данных
- •2.7. Кодирование звуковой информации
- •2.8. Основные структуры данных
- •2.9. Упорядочение структур данных
- •3. Файлы и файловая структура
- •4. Информатика. Предмет и задачи информатики
- •Подведение итогов
- •Тема 2.
- •1. История развития средств вычислительной техники
- •1.1. Механические первоисточники
- •1.2. Математические первоисточники
- •2. Состав вычислительной системы
- •2.1. Аппаратное обеспечение
- •2.2. Программное обеспечение
- •2.2.1. Базовый уровень
- •2.2.2. Системный уровень
- •2.2.3. Служебный уровень
- •2.2.4. Прикладной уровень
- •3. Виды служебных программных средств
- •3.1. Диспетчеры файлов (файловые менеджеры)
- •4. Классификация прикладных программных средств
- •4.1. Текстовые редакторы и процессоры
- •4.2. Графические редакторы
- •4.3. Системы управления базами данных
- •4.4. Электронные таблицы
- •4.5. Системы автоматизированного проектирования (cad-системы)
- •4.6. Настольные издательские системы
- •4.8. Браузеры (обозреватели, средства просмотра Web)
- •4.9. Бухгалтерские системы
- •Подведение итогов
- •Тема 3.
- •1. Базовая аппаратная конфигурация персонального компьютера
- •2. Внутренние устройства системного блока
- •2.3. Дисковод гибких дисков
- •2.4. Дисковод компакт-дисков cd-rom
- •2.5. Видеокарта (видеоадаптер)
- •3. Системы, расположенные на материнской плате
- •3.3. Системная шина (магистраль)
- •3.3.1. Шина данных
- •3.3.2. Шина адреса
- •3.3.3. Шина управления
- •3.4. Микросхема пзу и система bios
- •3.5. Энергонезависимая память cmos
- •4. Периферийные устройства
- •Тема 4.
- •1. Основные функции операционных систем персональных компьютеров
- •1.1. Обеспечение интерфейса пользователя
- •1.2. Организация файловой системы
- •1.3. Обслуживание файловой структуры
- •1.4. Управление установкой, исполнением и удалением приложений
- •1.5. Взаимодействие с аппаратным обеспечением
- •1.6. Обслуживание компьютера
- •2. Основы работы с операционной системой Windows xp
- •2.1. Значки и ярлыки объектов
- •2.2. Файлы и папки Windows
- •2.3. Программа Проводник
- •2.4. Буфер обмена
- •2.5. Стандартные приложения Windows xp
- •2.7. Служебные приложения Windows xp
- •2.8. Стандартные средства мультимедиа
- •Тема 5.
- •1. Виды компьютерной графики
- •1.1. Растровая графика
- •1.2. Векторная графика
- •1.3.Фрактальная графика
- •1.4. Основные понятия трехмерной графики
- •2. Представление графических данных
- •2.1. Форматы графических данных
- •2.2. Понятие цвета
- •2.3. Способы описания цвета
- •3. Программные средства компьютерной графики
- •3.1. Работа с Macromedia Flash
- •3.2. Программные средства обработки трехмерной графики
- •Тема 6.
- •1. Назначение компьютерных сетей
- •2. Локальные компьютерные сети
- •3. Аппаратное обеспечение сети
- •4. Топологии сети
- •5. Глобальная компьютерная сеть Интернет
- •5.1. Протокол маршрутизации
- •5.2. Транспортный протокол
- •6. Службы Интернета
- •6.1. Электронная почта
- •6.2. Телеконференции
- •6.3. Служба World Wide Web (www)
- •6.4. Служба имен доменов (dns)
- •6.5. Служба передачи файлов (ftр)
- •6.6. Интерактивное общение в Интернете
- •7. Мультимедиа технологии в Интернете
- •7.1. Технология сжатия мр3
- •7.2. Технологии потокового воспроизведения
- •8. Поиск информации в Интернете
- •8.1. Поисковые системы общего назначения
- •8.1.1. Поиск по ключевым словам
- •8.1.2. Поиск в иерархической системе каталогов
- •8.2. Специализированные поисковые системы
- •9. Вопросы компьютерной безопасности
- •9.1. Компьютерные вирусы
- •9.2. Методы защиты от компьютерных вирусов
- •9.3. Средства антивирусной защиты
- •9.4. Защита информации в Интернете
- •9.5. Понятие о несимметричном шифровании информации
- •9.6. Принцип достаточности защиты
- •10. Публикация Web-документов
- •Тема 7.
- •1. Теоретические основы сжатия данных
- •2. Обратимость сжатия
- •3. Программные средства сжатия данных
- •4. Базовые требования к диспетчерам архивов
- •Тема 8.
- •1. Преобразование документов в электронную форму
- •1.1. Сканирование документов
- •1.2. Распознавание документов
- •2. Автоматизированный перевод документов
- •Тема 9.
- •Проектирование программ
Тема 8.
Автоматизация обработки документов
Компьютер предназначен для работы с документами, имеющими электронную форму. В то же время, нам часто приходится иметь дело с бумажными изданиями и документами: журналами, книгами, письмами, служебными записками и т. д. Чтобы в работе с информацией такого рода тоже можно было использовать компьютер, необходимы средства преобразования бумажных документов в электронную форму.
Если предполагается, что документ содержит в основном текстовую информацию, то можно выделить следующие основные этапы такого преобразования:
в ходе сканирования при помощи устройств оцифровки изображения производится создание электронного образа (изображения) документа;
процесс распознавания позволяет преобразовать электронное изображение в текстовые данные (с сохранением элементов форматирования оригинала или без них);
для документов, исполненных на иностранном языке, применяют дополнительные средства автоматизированного перевода на другой язык.
1. Преобразование документов в электронную форму
1.1. Сканирование документов
Процесс создания электронного изображения бумажного документа напоминает его фотографирование и требует применения соответствующего устройства. Сегодня в качестве такого устройства выступает сканер. Такие устройства, как цифровые камеры, пока не могут обеспечить для документов стандартного формата качество изображения, которое гарантировало бы их надежное распознавание.
Основной рабочий элемент сканера включает источник света, используемый для освещения документа, и светочувствительную головку, воспринимающую отраженный свет.
Сканер является внешним устройством и подключается к компьютеру через специальный разъем. При высоком разрешении и большой площади сканируемого документа объем передаваемых данных оказывается очень большим и требует производительной линии передачи. Современные сканеры чаще всего используют для подключения порт USB.
Разные модели сканеров понимают разные управляющие команды. Чтобы избежать разнобоя, был принят универсальный стандарт взаимодействия сканера и приложений. Этот стандарт называется TWAIN. Приложение посылает команды драйверу TWAIN, который преобразует их в инструкции, распознаваемые сканером. Таким образом, для приложения перестает иметь значение конкретная модель сканера. Операционная система Windows ХР поддерживает интерфейс TWAIN, а все современные сканеры совместимы с ним и предоставляют необходимые драйверы нижнего уровня.
1.2. Распознавание документов
Этап распознавания документа состоит в преобразовании электронного изображения (фактически набора цветных или черно-белых точек) в текстовый документ. В процессе распознавания происходит "сравнение" элемента изображения с эталонными вариантами начертания символов, после чего выбирается наиболее подходящий символ. Этот подход требует использования специального комплекта шрифтов, но дает на нем наилучшие результаты.
На сегодняшний день уже существуют современные алгоритмы распознавания, не привязанные к конкретному начертанию символов, так же, как человек способен узнавать буквы при любых начертаниях (и даже при значительных искажениях).
В ходе распознавания сначала в изображении выделяются крупные элементы текста: колонки, абзацы, отдельные текстовые блоки (например, подрисуночные подписи), ячейки таблиц. Этот этап называют сегментацией, он может выполняться автоматически или вручную. После этого выполняется автоматический этап распознавания: блоки разбиваются на строки, строки - на отдельные символы, каждый из которых распознается независимо и помещается в итоговый текстовый документ.
Все операции, необходимые в ходе преобразования бумажного документа в электронную форму, могут быть выполнены с помощью программы FineReader. Эта программа способна выполнять сканирование и распознавание текстов на разных языках, в том числе и смешанных двуязычных текстов. С ее помощью можно выполнять пакетную обработку многостраничных документов, а также настраивать режим распознавания для улучшения соответствия электронного документа бумажному оригиналу при плохом качестве последнего или использовании в нем шрифтов, далеких от стандартных.
