Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
leontev_b_sekrety_skanirovaniya_na_pk.rtf
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
2.74 Mб
Скачать

Глава 31. Блоки

Типы блоков в OCR – системе ABBYY FineReader

Блоки – это заключенные в рамку участки изображения. Программой блоки выделяются для того с тем, чтобы указать OCR‑системе, какие участки отсканированной страницы необходимо распознавать и в каком порядке. Кроме того по ним воспроизводится исходное оформление страницы. Блоки разных типов имеют различные цвета рамок. Вы имеете возможность изменить цвета рамок блоков на закладке Вид диалогового окна к Опции (доступ:Сервис к Опции ) в разделе Объекты. В поле Объект выберите нужный тип блока, а в поле Цвет – требуемый цвет.

Выделение блоков «вручную» может понадобиться, если:

• Вы хотите распознать часть страницы.

• В результате автоматического анализа блоки были выделены неправильно.

Совет: В некоторых случаях качество автоматического анализа можно улучшить, правильно установив опции анализа макета. Проверьте установленные опции анализа (закладка Распознавание, меню Сервис к Опции ).

В случае, если программа выделила неправильно некоторые блоки, часто оказывается быстрее исправить только их, воспользовавшись инструментами для редактирования блоков, а не выделять блоки на изображении заново вручную.

В процессе обработки изображений выделяют блоки следующих типов:

Зона Распознавания

Блок используется для распознавания и автоматического анализа части изображения. После нажатия на кнопку 2‑Распознать выделенный блок автоматически анализируется и распознается.

Текст

Блок используется для обозначения текста. Он должен содержать только одноколоночный текст. В случае, если внутри текста содержатся картинки, выделите их в отдельные блоки.

Таблица

Блок используется для обозначения таблиц или текста, имеющего табличную структуру. В процессе распознавания программа разбивает данный блок на строки и столбцы и формирует табличную структуру. В выходном тексте данный блок передается таблицей. Вы имеете возможность выделить и скорректировать таблицу вручную.

Картинка

Этот блок используется для обозначения картинок. Он может содержать картинку или любую другую часть текста, которую вы хотите передать в распознанный текст в качестве картинки.

Штрих‑код (только в версии Office)

Этот блок используется для распознавания штрих‑кодов. Это означает, что, если ваш документ содержит штрих‑код и вы хотите передать его не картинкой, а перевести его в последовательность букв и цифр, то выделите штрих‑код в отдельный блок и присвойте ему тип Штрих‑код.

Важно: По умолчанию опция, позволяющая искать и распознавать штрих‑коды отключена. Для того, чтобы подключить ее, активизируйте опцию Искать штрих‑коды на закладке Распознавание (доступ: Сервис к Опции ).

Опции автоматического анализа макета страницы

В процессе автоматического анализа макета страницы FineReader сам выделяет блоки, содержащие тексты, таблицы, картинки и штрих‑коды.

Автоматический анализ запускается по кнопке 2– Распознать одновременно с распознаванием текста. До запуска распознавания необходимо установить основные опции анализа: тип страницы и опции анализа таблиц.

Для большинства изображений расположение текста на странице определяется автоматически, чему соответствует значение Авто на закладкеРаспознавание в разделе Тип страницы (доступ: Сервис к Опции ), устанавливаемое системой по умолчанию.

В некоторых случаях может потребоваться установить значение типа страницы вручную. Для этого на закладке Распознавание диалогового окна Опции (доступ: Сервис к Опции ) в разделе Тип страницы выберите необходимую команду.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]