Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Metoda_po_inf_ch_2.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.83 Mб
Скачать

Контрольные вопросы:

  1. Знать основные компоненты Математического пакета Mathcad

2. Дать описание всем инструментам, находящимся на панели «Программирование», уметь их практически использовать.

Задание:

1. Задание на закрепление пройденного: сделать программу на рис. 4.3 рекуррентной, а на рис. 4.4 – рекурсивной.

2. Задания 1 выполнить в среде математического пакета Mathcad.

Лабораторная работа №5

Тема: Программа сканирования и распознования текстов FineReader.

Цель работы: Ознакомление с принципом работы програм сканирования текста, а также приобретение навыков работы с программой FineReader.

Введение

Все мы вводим тексты в компьютер. Это могут быть газетные вырезки, журнальные статьи, прошлогодние договоры, деловые письма, факсы, прайс - листы, биржевые сводки, анкеты... Подсчитано, что более 90% современных документов поступает к нам на бумаге. Десятилетия люди знали только один способ ввода печатных документов в компьютер - с клавиатуры. Помните часы, которые Вы просиживали за компьютером, перепечатывая текст длиной в ве­чность? А как бы нам всем хотелось, чтобы компьютер научился читать сам прямо с бумажного листа!

Программа оптического рас­познавания текстов (по-английски OCR – Optical Character Recognition) FineReader позволит Вашему компьютеру и сканеру самостоятельно читать печатные тексты.

1. Возможности программы abbyy FineReader

FineReader позволяет ввести документ одним нажатием на кнопку Scan&Read, не вдаваясь в подробности работы программы. Распознанный текст можно передать в текстовый редактор или электронную таблицу, сохранить в форматах PDF и HTML с полным сохранением оформления документа или сохранить в базе данных

1.1. Что такое ocr-системы?

Системы оптического распознавания символов (Optical Character Recognition - OCR) предназначены для автоматического ввода печатных документов в компьютер.

FineReader — омнифонтовая система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати, что достигается благодаря применению технологии "целостного целенаправленного адаптивного распознавания".

Процесс ввода документа в компьютер можно подразделить на два этапа:

  1. Сканирование. На первом этапе сканер играет роль «глаза» Вашего компьютера: «просматривает» изображение и передает его компьютеру. При этом полученное изображение является не чем иным, как набором черных, белых или цветных точек, картинкой, которую невозможно отредактировать ни в одном текстовом редакторе.

  2. Распознавание. Обработка изображения OCR-системой.

1.2. Новые возможности ABBYY FineReader 5.0

Работа с изображениями

  • Новый режим отображения страниц пакета Пиктограммы, в котором страницы пакета представляются своими сильно уменьшенными изображениями.

Сканирование

  • Возможность сканирования разворота книги: обе страницы раскрытой книги сканируются одновременно, но обрабатываются по отдельности. Изображение, содержащее сдвоенные страницы, записывается в две различные страницы пакета.

Анализ макета страницы

  • В программу добавлена объединенная процедура анализа макета страницы и распознавания. Теперь алгоритм поиска блоков использует информацию о распознанном тексте для более точного анализа макета страницы. Новые алгоритмы анализа используются автоматически при запуске распознавания на странице без блоков, т.е. анализ макета и распознавание делаются за один шаг. Старый алгоритм анализа страницы, который не использует распознавание, по-прежнему доступен (меню Процесс>Анализ макета документа).

  • Поддержка распознавания "встроенных" картинок: возможно отметить блок "картинка" внутри текстового или табличного блока.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]