Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Сканування та розп_знавання тексту.doc
Скачиваний:
4
Добавлен:
01.04.2025
Размер:
177.66 Кб
Скачать

Процес введення документа в комп'ютер можна підрозділити на два етапи:

  1. Сканування. На першому етапі сканер виконує роль "ока" Вашого комп'ютера: "проглядає" зображення і передає його комп'ютеру. При цьому одержане зображення є не чим іншим, як  набором чорних, білих або кольорових крапок, картинкою, яку неможливо відредагувати ні в одному текстовому редакторі.

  2. Розпізнавання. Обробка зображення OCR-системою.

Зупинимося на другому кроці детальніше.

Обробка зображення системою FineReader включає аналіз графічного зображення, переданого сканером, і розпізнавання кожного символу. Процеси аналізу макету сторінки (визначення областей розпізнавання, таблиць, картинок, виділення в тексті рядків і окремих символів) і розпізнавання зображення тісно зв'язані між собою: алгоритм пошуку блоків використовує інформацію про розпізнаний текст для точнішого аналізу сторінки.

Як вже згадувалося, розпізнавання зображення здійснюється на основі технології "цілісного цілеспрямованого адаптивного розпізнавання".

  • Цілісність - об'єкт описується як ціле за допомогою значущих елементів і відносин між ними.

  • Цілеспрямованість - розпізнавання будується як процес висунення і цілеспрямованої перевірки гіпотез.

  • Адаптивна - здібність OCR-системи до самонавчання.

Відповідно до цих трьох принципів система спочатку висуває гіпотезу про об'єкт розпізнавання (символі, частині символу або декількох склеєних символах), а потім підтверджує або спростовує її, намагаючись послідовно знайти всі структурні елементи і зв'язуючі їх відносини. У кожному структурному елементі виділяються частини, значущі для людського сприйняття: відрізки, дуги, кільця і крапки. Слідуючи принципу адаптивної, програма самостійно "настроюється", використовуючи позитивний досвід, одержаний на перших упевнено розпізнаних символах. Цілеспрямований пошук і облік контексту дозволяють розпізнавати розірвані і спотворені зображення, роблячи систему стійкої до можливих дефектів листу.

В результаті роботи у вікні FineReader з'явиться розпізнаний текст, який Ви можете відредагувати і зберегти в найзручнішому для Вас форматі.

ABBYY FineReader 7.0

Головне вікно програми FineReader

Працюючи з програмою FineReader, користувач завжди має справу з деяким пакетом. Пакет - це бібліотека, в якій зберігаються зображення і робочі файли програми. Кожне відскановане зображення записується як окрема сторінка пакету.

При запуску програми FineReader за умовчанням відкривається новий пакет. Ви можете продовжити роботу з новим пакетом або ж відкрити вже існуючий пакет. Ви можете продовжити роботу з пакетом за умовчанням або создать новый пакет. Більш докладно про роботу з пакетом див. Общие сведения по работе с пакетом.

Зверху Головного вікна FineReader знаходиться меню системи, під ним - інструментальні панелі. У програмі їх чотири: Стандартная, Форматирование, Изображение і Scan&Read.

Заховати або показати інструментальні панелі на екрані можна через меню Вигляд (пункт Панелі інструментів) або через локальне меню. Щоб відкрити локальне меню, клацніть правою кнопкою миші на одній з інструментальних панелей. Панелі, які видно на екрані, відмічені галочкою. Виберіть панель, яку Ви хочете заховати або, навпаки, показати.