Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
43.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
144.46 Кб
Скачать

Сканування документа

Сканування - це технічна операція, що виконує скануючий пристрій. Задача програми FineReader на цьому етапі складається в тому, щоб прийняти отриману інформацію від сканера і відобразити значки отсканованних сторінок на панелі Пакет.

Для того щоб провести сканування необхідно:

  1. Запустити програму FineReader і включити сканер.

  2. Вибрати тип драйвера (драйвера сканера, TWAIN-драйвера). При безпосередній взаємодії зі сканером можливість сканування кольорових зображень не використовується, тому що передбачається, текст у будь-якому випадку є одноколірним. Встановити прапорці і параметри режиму сканування:

  • орієнтація (книжкова, альбомна),

  • добір яскравості (ручний, автоматичний),

  • режим сканування картинок ()

  • дозвіл,

  • прапорець "Показувати діалог перед скануванням" застосовують тільки в тому випадку, коли паперові сторінки документа істотно відрізняються друг від друга. Це може бути викликано, наприклад, властивостями паперу або тим, що різні сторінки друкувалися в різний час і різні засоби. У цьому випадку перед скануванням кожної сторінки відчиняється діалогове вікно настроювання сканера, щоб користувач міг відрегулювати якість процесу.

  • прапорець "Пауза між сторінками, сек" використовують при відсутності в сканера автоматичної подачі сторінок.

Вікно діалогу TWAIN-драйвера з'являється після запуску процесу сканування.

  1. Сканування сторінки робить по клацанні на кнопці "Сканувати" на панелі інструментів Scan&Read або при натисканні комбінації клавіш CTRL+K.

На кнопці з'являється червоний кружок із білим хрестиком, що сигналізує про те, що процес сканування почався. Перервати процес можна тільки клавішею Esc. Якщо потрібно опрацювати багато сторінок, те найкраще спочатку усіх їх отсканувати, а вже потім приступати до розпізнавання. Це пов'язано з тим, що сканування потребує присутності користувача через необхідність керування сканером (наприклад, для зміни сторінок), а розпізнавання може відбуватися в автоматичному режимі.

Після сканування кожного листа у вікні "Пакет" з'являються піктограма з номером сторінки. Сторінки нумеруються послідовно, починаючи з одиниці. Існує опція, що дозволяє нумерувати з заданої сторінки, із заданим збільшенням 1 або 2, по зростанню або убуванню.

Коли остання сторінка буде отсканованний, відчиняються два вікна - "Зображення" і "Великий план", у яких відображена активна сторінка. Користувач може переглянути результати сканування в різних масштабах, дізнатися властивості зображення, зберегти отримані графічні файли в окремій папці.

46. Розпізнавання тексту документа.

Після сегментації і встановлення порядку проходження текстових блоків

виконують останній етап роботи - власне розпізнавання. Звичайно цей етап проходить автоматично. Якщо документ надрукований достатньо стандартним шрифтом, що, до того ж, був добре відтворений при скануванні, то клацанні на кнопці "Розпізнати відкриту сторінку" достатньо, щоб документ був розпізнаний. Якщо паперовий документ має недостатню контрастність або незвичний шрифт, процедура трохи ускладнюється. У цьому випадку програма може не справлятися з розпізнаванням визначених символів і припускати однотипні помилки. У таких випадках для великих документів доцільно спочатку провести навчання програми відповідно до особливостей даного документа. Це достатньо трудомісткий процес, але він усе ж простіше, чим ручне введення багатосторінкового документа.

Настроювання розпізнавання починають із створення еталона, у якому зберігаються особливості даного документа. Для цього треба дати команду "Сервіс - Редактор еталонів", клацнути в діалоговому вікні, що відчинилося, "Еталони" на кнопці "Новий еталон" і ввести ім'я утворюваного еталона.

1. Для підключення еталона при розпізнаванні, треба клацнути на кнопці, що розкриває, поруч із кнопкою "Розпізнати відкриту сторінку" і вибрати пункт "Опції". У діалоговому вікні, що відчинилося, у групі "Навчання" варто вибрати тільки що створений еталон. Якщо передбачається розпізнавання документа, що відповідає еталону, що був створений і настроєний раніше, те вибирається не новий, а старий еталон.

2. Для "навчання" еталона варто встановити прапорець "Розпізнавання з навчанням".

3. Режим розпізнавання в цьому випадку трохи змінюється. Всякий раз, коли програма не може впевнено розпізнати символ, вона видає діалогове вікно "Ручне навчання еталона". У верхній частині цього діалогового вікна приводиться збільшене зображення поточного розпізнаваного рядка. Поточний символ укладений у рамку.

4. У поле зі списком "Символ" приведений символ, що, як думає програма, знаходиться в рамці.

5. Необхідно переконатися, що символ у поле зазначений вірно, і замінити його в разі потреби. Після цього треба клацнути на кнопці "Навчити".

6. Якщо невірно зазначені межі символу, то кнопки "Зрушити вліво" і "Зрушити вправо" дозволяють поправити положення рамки.

7. Якщо вірно розташувати рамку не вдасться або в тексті зустрівся рідкісний символ, що правильно інтепретувати не можна, варто клацнути на кнопці "Пропустити".

Результати опрацювання сторінок надалі об'єднуються в єдиний текстовий файл.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]