- •Б. К. Леонтьев Секреты сканирования на пк
- •Аннотация
- •Глава 2. Ручные сканеры
- •Глава 3. Листовые сканеры
- •Глава 4. Планшетные сканеры
- •Глава 5. Слайд‑сканеры
- •Глава 6. Барабанные сканеры
- •Глава 7. Цветное сканирование
- •Глава 8. Параметры сканеров
- •Глава 9. Глубина цвета
- •Глава 10. Размер области процесса сканирования
- •Глава 11. Скорость процесса сканирования
- •Глава 12. Способ подключения
- •Глава 13. Драйверы
- •Глава 14. Домашний сканер
- •Глава 15. Как осуществляется сканирование в программе Adobe Photoshop twain
- •Глава 19. Системы распознавания текстов в офисе
- •Глава 20. Программа abbyy FineReader
- •Глава 21. Омнифонтовая ocr‑система
- •Глава 22. Установка программы
- •Глава 23. Запуск программы
- •Глава 24. Распознавание в программе FineReader
- •Глава 25. Пакет
- •Глава 26. Крупный план
- •Глава 29. Процесс сканирования и распознавания печатного материала
- •1‑Сканировать
- •2‑Распознать
- •4‑Сохранить
- •Глава 30. Сканирование многостраничных документов
- •Использование автоподатчика adf
- •Без использования автоподатчика adf
- •Глава 31. Блоки
- •Возможные типы страницы
- •Выделение и редактирование блоков «вручную»
- •Редактирование формы и положения блоков пакета
- •Глава 32. Распознавание
- •Глава 33. Как обучить FineReader
- •Глава 34. Как проверить и отредактировать распознанный текст
- •Пополнение и удаление слов из пользовательского словаря
- •Глава 35. Редактирование текста
- •Отмена и восстановление действий
- •Глава 36. Редактирование таблиц
- •Глава 37. Экспорт результатов распознавания во внешние приложения
- •Глава 38. Описания основных команд меню
- •Vectory for windows – Векторизация растровых изображений
- •Глава 2. Обработка сканированных изображений для использования в различных системах сапр и гис
- •Глава 3. Обработка сканированных изображений для использования в различных гис
- •Глава 4. Цветопередача
- •Глава 5. Использование цифровых камер
- •Глава 6. Лазерные принтеры и сканеры
- •Глава 7. Словарь
Глава 31. Блоки
Типы блоков в OCR – системе ABBYY FineReader
Блоки – это заключенные в рамку участки изображения. Программой блоки выделяются для того с тем, чтобы указать OCR‑системе, какие участки отсканированной страницы необходимо распознавать и в каком порядке. Кроме того по ним воспроизводится исходное оформление страницы. Блоки разных типов имеют различные цвета рамок. Вы имеете возможность изменить цвета рамок блоков на закладке Вид диалогового окна к Опции (доступ:Сервис к Опции ) в разделе Объекты. В поле Объект выберите нужный тип блока, а в поле Цвет – требуемый цвет.
Выделение блоков «вручную» может понадобиться, если:
• Вы хотите распознать часть страницы.
• В результате автоматического анализа блоки были выделены неправильно.
Совет: В некоторых случаях качество автоматического анализа можно улучшить, правильно установив опции анализа макета. Проверьте установленные опции анализа (закладка Распознавание, меню Сервис к Опции ).
В случае, если программа выделила неправильно некоторые блоки, часто оказывается быстрее исправить только их, воспользовавшись инструментами для редактирования блоков, а не выделять блоки на изображении заново вручную.
В процессе обработки изображений выделяют блоки следующих типов:
Зона Распознавания
Блок используется для распознавания и автоматического анализа части изображения. После нажатия на кнопку 2‑Распознать выделенный блок автоматически анализируется и распознается.
Текст
Блок используется для обозначения текста. Он должен содержать только одноколоночный текст. В случае, если внутри текста содержатся картинки, выделите их в отдельные блоки.
Таблица
Блок используется для обозначения таблиц или текста, имеющего табличную структуру. В процессе распознавания программа разбивает данный блок на строки и столбцы и формирует табличную структуру. В выходном тексте данный блок передается таблицей. Вы имеете возможность выделить и скорректировать таблицу вручную.
Картинка
Этот блок используется для обозначения картинок. Он может содержать картинку или любую другую часть текста, которую вы хотите передать в распознанный текст в качестве картинки.
Штрих‑код (только в версии Office)
Этот блок используется для распознавания штрих‑кодов. Это означает, что, если ваш документ содержит штрих‑код и вы хотите передать его не картинкой, а перевести его в последовательность букв и цифр, то выделите штрих‑код в отдельный блок и присвойте ему тип Штрих‑код.
Важно: По умолчанию опция, позволяющая искать и распознавать штрих‑коды отключена. Для того, чтобы подключить ее, активизируйте опцию Искать штрих‑коды на закладке Распознавание (доступ: Сервис к Опции ).
Опции автоматического анализа макета страницы
В процессе автоматического анализа макета страницы FineReader сам выделяет блоки, содержащие тексты, таблицы, картинки и штрих‑коды.
Автоматический анализ запускается по кнопке 2– Распознать одновременно с распознаванием текста. До запуска распознавания необходимо установить основные опции анализа: тип страницы и опции анализа таблиц.
Для большинства изображений расположение текста на странице определяется автоматически, чему соответствует значение Авто на закладкеРаспознавание в разделе Тип страницы (доступ: Сервис к Опции ), устанавливаемое системой по умолчанию.
В некоторых случаях может потребоваться установить значение типа страницы вручную. Для этого на закладке Распознавание диалогового окна Опции (доступ: Сервис к Опции ) в разделе Тип страницы выберите необходимую команду.
