Задания-1 / Word_Сложный_документ / Распознавание текстов / Лаб_раб_FR / лаб_раб распознавание текстов FineReader 8
.docИнститут МХО, 2010_11 учебный год
Лабораторная работа "Подготовка текстовых и графических материалов к использованию в ЭУМ"
Цель работы: Необходимо распознать имеющуюся в графическом файле текстовую, табличную и графическую информацию с помощью программы ABBYY FineReader 8.0 и передать ее в текстовый редактор Word.
-
Основные этапы работы.
-
Запустить программу распознавания текстов FineReader 8.0 с помощью ярлыка на Рабочем столе Windows или по адресу C:/Program Files/ABBYY FineReader 8.0 Professional Edition/FineReader;
-
Открыть из своей папки пакет «mho», используя команду Файл Открыть пакет…
-
Загрузить по очереди страницы из окна «Пакет» в окно «Изображение».
-
Произвести сегментацию каждой страницы (назначение инструментов панели окна «Изображение» см. в приложение 1). Возможные способы сегментации:
-
-
ручная сегментация – с помощью инструментов «Выделить блок Текст», «Выделить блок Таблица», «Выделить блок Картинка» панели окна «Изображение»;
-
автоматическая сегментация – с помощью инструмента «Анализ макета страниц» или через меню Процесс Распознать Анализ макета страницы;
-
Распознать в окно «Текст» выделенные блоки с помощью 2-й кнопки панели Scan&Read.
-
Передать распознанную информацию из окна «Текст» в текстовый редактор Word с помощью 4-й кнопки панели Scan&Read.
-
Основные технологические приемы работы.
-
Изменение размера блока – потянуть ЛКМ (левой клавишей мышки) за границы блока.
-
Удаление лишнего блока – ПКМ (правая клавиша мышки) Удалить блок
-
Изменение типа блока – ПКМ (правая клавиша мышки) Изменить тип блока выбрать нужный тип блока
-
Создание нужного типа блока вручную – выбрать нужный инструмент и натянуть рамку с помощью ЛКМ
-
Повернуть изображение – с помощью последних двух инструментов панели инструментов «Изображение»
-
-
Задание на распознавание.
№ стр. пакета |
Задание |
Технология, особенности |
1 |
Распознать весь текст |
Изъять из текстового блока фамилию автора статьи |
2 |
Распознать текст и картинки |
Удалить блоки с фигурным текстом сверху страницы из распознавания, поменять блоки «Таблица» на «Картинка» |
3 |
Распознать только текст |
Удалить все лишние блоки, кроме текстовых; удалить фигурный текст |
4 |
Распознать текст, все картинки и таблицу |
Удалить фигурный текст, для картинок установить правильный тип блока, сделать вручную блок «Таблица» для таблицы слева от тройной картинки, удалив 3 текстовых блока |
5 |
Распознать только текст (абзац сверху и 2 колонки) |
Удалить лишние блоки |
6 |
Распознать только текст в 3-х колонках |
Повернуть страницу, удалить лишние мелкие блоки, удалить картинку и подпись под картинкой |
7 |
Распознать таблицу |
Требуется ручная сегментация. Сначала натянуть на всю таблицу синию рамку (блок «Таблица»), потом нанести вертикаль и горизонтали, потом инструментом «Выбор объектов» выделить ячейки в первой строке и объединить их (ПКМ Ячейки таблицы Объединить ячейки), точно также объединить ячейки последней строки |
-
Задание на передачу распознанных данных в Word
-
Передайте в текстовый редактор Word первую распознанную страницу;
-
Передайте в текстовый редактор Word все распознанные страницы;
-
Передайте в текстовый редактор Word 2, 4, 6 распознанные страницы, выделив их в окне «Пакет» с помощью клавиши Ctrl;
-
Передайте многоколоночный текст с 6-й страницы через Буфер обмена по следующей технологии: а именно: Выделите и скопируйте в буфер обмена распознанную информацию в окне «Текст» (правой клавишей мышки выберите команду «Выделить все», затем «Копировать»); Откройте текстовый редактор Word и вставьте туда находящуюся в буфере обмена информацию (Правка Вставить).
-
Задание для самостоятельной работы
Откройте графические файлы (команда Файл Открыть PDF/изображение…), предназначенные для самостоятельной работы, из папки, указанной преподавателем, произведите распознавание всей информации и передайте ее в единый текстовый документ (документ должен содержать текст без колонок, картинки, таблицы).