- •Лекція___ тема: ocr-системи. Призначення, види та використання Что такое ocr-системы
- •Процесс ввода документа в компьютер можно подразделить на два этапа:
- •Форматы, в которых FineReader сохраняет распознанный текст FineReader сохраняет результаты распознавания в следующих форматах:
- •Поддерживаемые графические форматы FineReader открывает файлы следующих форматов:
- •FineReader сохраняет изображения в следующих форматах:
- •Поддерживаемые языки распознавания
- •Основные языки
- •Дополнительные языки
- •Искусственные языки
- •Языки программирования
- •Языки со специализированными словарями
- •Сканирование
- •Преимущества одного режима перед другим
- •Чтобы запустить сканирование:
- •Установка параметров сканирования
- •Основными параметрами сканирования являются:
- •Чтобы установить параметры сканирования:
- •Сканирование многостраничных документов
- •При использовании автоподатчика (adf)
- •Без использования автоподатчика (adf)
- •Общая информация по распознаванию
- •Вы можете:
- •Чтобы запустить распознавание:
- •Распознавание в фоновом режиме
- •Проверка распознанного текста
- •Чтобы проверить результаты распознавания:
- •Перемещение по неуверенно распознанным словам
Чтобы запустить сканирование:
Нажмите кнопку 1-Сканировать или в менюФайл выберите пунктСканировать. Спустя некоторое время вГлавном окне программы FineReader появится окноИзображение с "фотографией" вставленного листа. Если Вы хотите отсканировать несколько страниц, то нажмите на стрелке справа от кнопки1-Сканироватьи в локальном меню выберите пунктСканировать несколько страниц. |
В случае если сканирование не началось сразу:
откроется встроенный TWAIN-интерфейссканера;
откроется диалог Настройки сканера.
Совет:
Если Вы хотите сразу запустить распознавание отсканированных страниц, воспользуйтесь опцией Сканировать и распознать илиСканировать и распознать несколько страниц:
Нажмите на стрелке справа от кнопки Scan&Read и в локальном меню выберите один из пунктов:Сканировать и распознать илиСканировать и распознать несколько страниц. |
FineReader отсканирует и распознает изображения. В Главном окнепрограммы появятся окноИзображениес "фотографией" вставленного листа и окноТекст с результатом распознавания. Распознанный текст Вы можетесохранить во внешние редакторы и форматы.
Установка параметров сканирования
Качество распознавания во многом зависит от того, насколько хорошее изображение получено при сканировании. Качество изображения регулируется установкой основных параметров сканирования: типа изображения, разрешения и яркости.
Основными параметрами сканирования являются:
Тип изображения- серый (256 градаций). Сканирование в сером является оптимальным режимом для системы распознавания. В случае сканирования в сером режиме осуществляетсяавтоматический подбор яркости.Черно-белыйтип изображения обеспечивает более высокую скорость сканирования, но при этом теряется часть информации о буквах, что может привести к ухудшению качества распознавания на документах среднего и низкого качества печати. Если Вы хотите, чтобы содержащиеся в документе цветные элементы (картинки, цветные буквы и цветной фон) были переданы в электронный документ с сохранением цвета, необходимо выбратьцветнойтип изображения. В других случаях используйтесерый тип изображения.
Разрешение- используйте 300 dpi для обычных текстов (размер шрифта 10 и более пунктов) и 400-600 dpi для текстов, набранных мелким шрифтом (9 и менее пунктов).
Яркость- в большинстве случаев подходит среднее значение яркости - 50%. На некоторых документах при сканировании в черно-белом режиме может понадобиться дополнительнаянастройка яркости.
Замечание. Сканирование с разрешением 400-600 dpi вместо 300 dpi или сканирование в сером или в цвете, а не в черно-белом может занять существенно больше времени. На некоторых моделях сканеров сканирование с разрешением 600 dpi занимает в 4 раза больше времени, чем сканирование с разрешением 300 dpi.
Чтобы установить параметры сканирования:
При сканировании через TWAIN с использованием интерфейса FineReader: в менюСервисвыберите пунктНастройки сканераи в открывшемся диалогеНастройки сканераустановите нужные опции.
При сканировании через TWAIN с использованием интерфейса TWAIN-драйвера сканера для установки параметров сканирования используется диалог Вашего сканера, который открывается автоматически при нажатии на кнопку1-Сканировать. Опции для установки параметров сканирования могут называться по-разному, в зависимости от модели сканера. Например, яркость может называться brightness, threshold, изображаться "солнышком" или черно-белым кружком. Смысл опций описан в документации, прилагаемой к Вашему сканеру.