- •Лекція___ тема: ocr-системи. Призначення, види та використання Что такое ocr-системы
- •Процесс ввода документа в компьютер можно подразделить на два этапа:
- •Форматы, в которых FineReader сохраняет распознанный текст FineReader сохраняет результаты распознавания в следующих форматах:
- •Поддерживаемые графические форматы FineReader открывает файлы следующих форматов:
- •FineReader сохраняет изображения в следующих форматах:
- •Поддерживаемые языки распознавания
- •Основные языки
- •Дополнительные языки
- •Искусственные языки
- •Языки программирования
- •Языки со специализированными словарями
- •Сканирование
- •Преимущества одного режима перед другим
- •Чтобы запустить сканирование:
- •Установка параметров сканирования
- •Основными параметрами сканирования являются:
- •Чтобы установить параметры сканирования:
- •Сканирование многостраничных документов
- •При использовании автоподатчика (adf)
- •Без использования автоподатчика (adf)
- •Общая информация по распознаванию
- •Вы можете:
- •Чтобы запустить распознавание:
- •Распознавание в фоновом режиме
- •Проверка распознанного текста
- •Чтобы проверить результаты распознавания:
- •Перемещение по неуверенно распознанным словам
Общая информация по распознаванию
Внимание!Перед запуском распознавания проверьте установленные опции:язык распознавания,тип печати распознаваемого текстаитип страницы.
Вы можете:
Распознать блок или несколько блоков, выделенных на изображении.
Распознать открытую страницу или все страницы, выделенные в окне Пакет.
Распознать все нераспознанные страницы пакета.
Распознать все страницы в фоновом режиме. В этом режиме возможно распознавание с одновременным редактированием уже распознанных страниц.
Распознать страницы в режиме распознавание с обучением. Данный режим применяется в основном для распознавания текстов, использующих декоративные шрифты, или для распознавания большого объема (более 100 страниц) документов плохого качества печати.
Распознать страницы одного пакета на нескольких компьютерах одновременно.
Чтобы запустить распознавание:
Нажмите кнопку 2-Распознатьна панелиScan&Read.
В меню Процессвыберите нужный Вам пункт:
Распознать - чтобы распознать открытую страницу или все страницы,выделенные в окне Пакет;
Распознать все - чтобы распознать все нераспознанные страницы пакета;
Распознать Блок - чтобы распознать блок или несколько блоков, выделенные на изображении;
Запустить фоновое распознавание - чтобы запустить распознавание в фоновом режиме.
Кнопка 2-Распознатьзапускает распознавание открытого изображения. Чтобы изменить режим кнопки, нажмите на стрелку справа от нее и из открывшегося меню выберите нужный пункт. |
Замечание. При распознавании уже распознанной страницы перераспознаются только отредактированные и добавленные блоки.
Распознавание в фоновом режиме
Если Вы хотите одновременно с распознаванием редактировать распознанные страницы, Вы можете запустить распознавание в фоновом режиме:
В меню Процессвыберите пунктЗапустить фоновое распознавание. В строке состояния внизу экрана появится значок. Если для окна Пакет выбран режим показа свойства страниц (локальное меню, пунктВид>Вид со свойствами), то напротив распознаваемой страницы в колонкеОткрытапоявится значок.
В этом режиме распознавание автоматически возобновляется, как только в пакете появляются нераспознанные страницы.
Замечание.На многопроцессорных компьютерах режим "Фоновое распознавание" позволяет увеличить скорость распознавания пакетов, содержащих большое количество страниц.
Чтобы остановить Распознавание в фоновом режиме:
В меню Процессвыберите пунктОстановить фоновое распознавание.
Внимание! В режиме работы Распознавание в фоновом режиме используются опции, установленные в программе до запуска фонового распознавания.
Проверка распознанного текста
Неуверенно распознанные символы и слова, которых нет в словаре, выделяются различными цветами. По умолчанию для выделения неуверенно распознанных символов используется голубой, для несловарных слов - розовый. Чтобы изменить цвета:
На закладке Вид(менюСервис>Опции) в полеОбъект выберите пунктНеуверенно распознанный символ (Несловарное слово) и в полеЦвет -цвет подсветки.
Чтобы проверить результаты распознавания:
Нажмите кнопку 3-Проверить на панелиScan&Read (или выберите пунктПроверка в менюСервис).
Проверка позволяет найти в тексте слова, содержащие неуверенно распознанные символы, несловарные слова, а также слова с орфографическими ошибками. Клавиатурная команда: F7
Откроется диалог Проверка.
В диалоге Проверкатри окна. Верхнее окно - аналог окна "Крупный план" программы FineReader, в нем показано изображение слова с возможной ошибкой. Среднее окно показывает само слово с возможной ошибкой, в строке над этим окном выводится название типа ошибки. В нижнем окне,Варианты, предлагаются варианты замены данного слова (если таковые имеются). Для вариантов используется словарь, указанный в полеЯзык словаря. Вы можете использовать любой словарь из предложенного списка.
Замечание.Для удобства проверки и редактирования текста диалогПроверкаможет быть увеличен. Для этого достаточно поместить указатель мыши на границу диалога (указатель превратится в двустороннюю стрелку). Перетаскивая границу, увеличьте или уменьшите размеры диалога.
У Вас есть следующие возможности:
Нажмите кнопку Пропустить, чтобы оставить слово, как есть.
Нажмите кнопку Пропустить все, чтобы оставить все такие слова в распознанном тексте, как есть.Замечание. При нажатии на кнопкиПропуститьилиПропустить всесо слова снимается "признак неуверенности" - считается, что слово не содержит нераспознанных или неуверенно распознанных символов; снимается также и визуальная подсветка таких символов в тексте. При экспорте в PDF в режимеЗаменять неуверенно распознанные слова их изображениямислова, с которых при проверки был снят "признак неуверенности" (при нажатии кнопокПропустить иПропустить все), не будут заменены на свои изображения.
Выберите вариант для замены и нажмите кнопку Заменить илиЗаменить все, чтобы заменить текущее слово или все такие слова в тексте. Если в окнеВариантынет правильного варианта для замены слова, отредактируйте слово или несколько соседних слов в среднем окне (обратите внимание, что при переходе в режим редактирования меняется назначение некоторых кнопок диалога и соответственно - надписи на них) и нажмите кнопкуПодтвердить, чтобы зафиксировать сделанные изменения и перейти к следующему фрагменту текста.
Нажмите Добавить..., чтобыдобавить слово в словарь. В этом случае при дальнейшей проверке орфографии, если это слово (или одна из его форм) встретится в тексте, оно не будет считаться ошибочным.
Нажмите Опции..., чтобы установить опции проверки распознанного текста.
Нажмите Закрыть, чтобы закрыть диалоговое окно.