Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Задания-1 / Word_Сложный_документ / Распознавание текстов / Лаб_раб_FR / лаб_раб распознавание текстов FineReader 8

.doc
Скачиваний:
46
Добавлен:
24.04.2015
Размер:
87.55 Кб
Скачать

Институт МХО, 2010_11 учебный год

Лабораторная работа "Подготовка текстовых и графических материалов к использованию в ЭУМ"

Цель работы: Необходимо распознать имеющуюся в графическом файле текстовую, табличную и графическую информацию с помощью программы ABBYY FineReader 8.0 и передать ее в текстовый редактор Word.

  1. Основные этапы работы.

    1. Запустить программу распознавания текстов FineReader 8.0 с помощью ярлыка на Рабочем столе Windows или по адресу C:/Program Files/ABBYY FineReader 8.0 Professional Edition/FineReader;

    2. Открыть из своей папки пакет «mho», используя команду Файл  Открыть пакет…

    3. Загрузить по очереди страницы из окна «Пакет» в окно «Изображение».

    4. Произвести сегментацию каждой страницы (назначение инструментов панели окна «Изображение» см. в приложение 1). Возможные способы сегментации:

  • ручная сегментация – с помощью инструментов «Выделить блок Текст», «Выделить блок Таблица», «Выделить блок Картинка» панели окна «Изображение»;

  • автоматическая сегментация – с помощью инструмента «Анализ макета страниц» или через меню Процесс  Распознать  Анализ макета страницы;

    1. Распознать в окно «Текст» выделенные блоки с помощью 2-й кнопки панели Scan&Read.

    1. Передать распознанную информацию из окна «Текст» в текстовый редактор Word с помощью 4-й кнопки панели Scan&Read.

  1. Основные технологические приемы работы.

    1. Изменение размера блока – потянуть ЛКМ (левой клавишей мышки) за границы блока.

    2. Удаление лишнего блока – ПКМ (правая клавиша мышки)  Удалить блок

    3. Изменение типа блока – ПКМ (правая клавиша мышки)  Изменить тип блока  выбрать нужный тип блока

    4. Создание нужного типа блока вручную – выбрать нужный инструмент и натянуть рамку с помощью ЛКМ

    5. Повернуть изображение – с помощью последних двух инструментов панели инструментов «Изображение»

  2. Задание на распознавание.

№ стр. пакета

Задание

Технология, особенности

1

Распознать весь текст

Изъять из текстового блока фамилию автора статьи

2

Распознать текст и картинки

Удалить блоки с фигурным текстом сверху страницы из распознавания, поменять блоки «Таблица» на «Картинка»

3

Распознать только текст

Удалить все лишние блоки, кроме текстовых; удалить фигурный текст

4

Распознать текст, все картинки и таблицу

Удалить фигурный текст, для картинок установить правильный тип блока, сделать вручную блок «Таблица» для таблицы слева от тройной картинки, удалив 3 текстовых блока

5

Распознать только текст (абзац сверху и 2 колонки)

Удалить лишние блоки

6

Распознать только текст в 3-х колонках

Повернуть страницу, удалить лишние мелкие блоки, удалить картинку и подпись под картинкой

7

Распознать таблицу

Требуется ручная сегментация. Сначала натянуть на всю таблицу синию рамку (блок «Таблица»), потом нанести вертикаль и горизонтали, потом инструментом «Выбор объектов» выделить ячейки в первой строке и объединить их (ПКМ  Ячейки таблицы  Объединить ячейки), точно также объединить ячейки последней строки

  1. Задание на передачу распознанных данных в Word

  • Передайте в текстовый редактор Word первую распознанную страницу;

  • Передайте в текстовый редактор Word все распознанные страницы;

  • Передайте в текстовый редактор Word 2, 4, 6 распознанные страницы, выделив их в окне «Пакет» с помощью клавиши Ctrl;

  • Передайте многоколоночный текст с 6-й страницы через Буфер обмена по следующей технологии: а именно: Выделите и скопируйте в буфер обмена распознанную информацию в окне «Текст» (правой клавишей мышки выберите команду «Выделить все», затем «Копировать»); Откройте текстовый редактор Word и вставьте туда находящуюся в буфере обмена информацию (Правка  Вставить).

  1. Задание для самостоятельной работы

Откройте графические файлы (команда Файл  Открыть PDF/изображение…), предназначенные для самостоятельной работы, из папки, указанной преподавателем, произведите распознавание всей информации и передайте ее в единый текстовый документ (документ должен содержать текст без колонок, картинки, таблицы).