Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Metoda_po_inf_ch_2.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.83 Mб
Скачать

6. Проверка и редактирование текста

После завершения распознавания результат появляется в окне Текст. Окно Текст - это встроенный редактор программы FineReader; в нем Вы можете проверить результаты распознавания и отредактировать распознанный текст.

Одна из возможностей текстового редактора FineReader – это встроенная проверка орфографии (список языков, для которых поддерживается проверка орфографии, приведен в Поддерживаемых языках распознавания).

Система встроенной проверки орфографии позволяет:

  • Находить неуверенно распознанные слова (слова, в которых есть неуверенно распознанные символы).

  • Находить орфографические ошибки (неправильно написанные слова).

  • Добавлять неизвестные системе FineReader слова в словарь для того, чтобы они распознавались уверенно.

6.1. Проверка распознанного текста

Неуверенно распознанные символы и слова, которых нет в словаре, выделяются различными цветами. По умолчанию для выделения неуверенно распознанных символов используется голубой, для несловарных слов - розовый. Чтобы изменить цвета:

  • На закладке Вид (меню Сервис>Опции) в поле Объект выберите пункт Неуверенно распознанный символ (Несловарное слово) и в поле Цвет - цвет подсветки.

Чтобы проверить результаты распознавания:

  • Нажмите кнопку Проверить на панели Scan&Read (или выберите пункт Проверка в меню Сервис).

  • Откроется диалог Проверка.

  • В диалоге Проверка три окна. Верхнее окно - аналог окна «Крупный план» программы FineReader, в нем показано изображение слова с возможной ошибкой. Среднее окно показывает само слово с возможной ошибкой, в строке над этим окном выводится название типа ошибки. В нижнем окне, Варианты, предлагаются варианты замены данного слова (если таковые имеются).

Замечание. Для удобства проверки и редактирования текста диалог Проверка может быть увеличен. Для этого достаточно поместить указатель мыши на границу диалога (указатель превратится в двустороннюю стрелку). Перетаскивая границу, увеличьте или уменьшите размеры диалога.

Вопросы:

  1. 1. Что такое OCR-системы?

2. Инструментальные панели программы FineReader.

  1. 3.Анализ макета страницы, блоки.

  2. 4. Распознование текста.

  3. 5. Какие существуют возможности сохранения распознанного текста?

Порядок выполнения работы:

1. Создать пакет.

2. Добавить изображение со сканированным текстом (нескольких типов).

3. Выделить блоки текста автоматически и в ручную, распознать.

  1. 4. Провести анализ качества распознанного текста с выделенными блоками текста автоматически и в ручную. Попробовать обучить программу распознавать не распознанные символы.

ЛАБОРАТОРНАЯ РАБОТА №6

Тема: Автоматизированная система лингвистического перевода PROMT 99.

Цель работы: Ознакомление с автоматизированной системой перевода на базе программного продукта PROMT 99.

Введение

PROMT 99 (в дальнейшем изложении - PROMT), принадлежит к системам автоматического перевода разработанным фирмой ПРОект МТ и обеспечивающим перевод с основных европейских языков на русский и обратно. В настоящий момент система позво­ляет работать с текстами на английском, немецком и французском языках в зависимости от приобретенной комплектации. Это 32-разрядтюе приложение, специально предназначенное для использования среде Windows 9X. Однако, оно может полноценно функционировать и среде Windows NT, 2000, XP.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]