
Додаток до лекції №6 сканування документів План
Базові поняття сканування документів.
Види сканерів.
Характеристики сканерів.
Перетворення документів в електронну форму. Сканування документів.
Програма FineReader
Література: Сучасні інформаційні технології: навч.посіб./ В.І. Косинський, О.Ф.Швець. – К.: Знання , 2011.-318 с.
Базові поняття сканування документів. Види сканерів. Характеристики сканерів. Перетворення документів в електронну форму. Програма FineReader. Навчальний тренінг.
1. Базові поняття сканування документів
Комп'ютер призначений для роботи з документами, що мають електронну форму. Водночас часто доводиться мати справу з паперовими виданнями й документами: журналами, книгами, листами тощо. Щоб у роботі з такою інформацією теж можна було використати комп'ютер, необхідні засоби перетворення паперових документів в електронну форму.
Одним з основних прийомів такого перетворення є сканування. Це технологічний процес, у результаті якого створюється графічний образ документа на твердому носії в електронній формі.
Для сканування застосовують спеціальні пристрої, які називаються сканерами, хоча графічний образ документа можна одержати й за допомогою інших засобів введення інформації, таких як цифрові фото- і відеокамери.
Перетворення графічного образу в текстовий документ виконують програмним шляхом. Для цього застосовують спеціальні програмні засоби — програми розпізнавання образів.
Якщо припустити, що документ містить в основному текстову інформацію, то можна виділити такі головні етапи перетворення:
у процесі сканування за допомогою пристроїв оцифровки зображення створюється електронний образ (зображення) документа;
процес розпізнавання дає змогу перетворити електронне зображення в текстові дані (зі збереженням елементів форматування оригіналу або без них);
для документів, створених іноземною мовою, застосовують додаткові засоби автоматизованого перекладу на іншу мову.
10.2. Види сканерів
Залежно від способу сканування об'єкта й самих об'єктів сканування розрізняють сканери декількох типів: ручний, листовий, планшетний, барабанний, планетарний та слайд-сканер.
Ручний сканер дає змогу зчитувати зображення вибірково і є пристроєм, який людина пересуває відносно зображення. Цей тип сканерів можна назвати спеціалізованим, адже під час використання їх для сканування книг звичайного формату виникає низка незручностей, наприклад, низька роздільна здатність, мала швидкість роботи, вузька смуга сканування, можливі перекоси зображення, оскільки користувачу важко переміщувати сканер з постійною швидкістю.
Листовий — це пристрій, під час роботи якого аркуш із зображенням протягується через нерухомий зчитувальний пристрій. Він має менші розміри, порівняно із планшетним, однак може сканувати тільки окремі аркуші, що обмежує його застосування в основному офісами компаній. Багато моделей мають пристрій автоматичної подачі аркушів для швидкого сканування великої кількості документів.
На сканері планшетного типу аркуш із зображенням жорстко фіксується, що забезпечує найкращу якість роботи. Це найпоширеніший вид сканерів, оскільки забезпечує максимальну зручність для користувача, а саме: високу якість і прийнятну швидкість сканування. Це планшет, усередині якого під прозорим склом розташований механізм сканування.
Планетарні сканери застосовуються для сканування книг або документів, які легко пошкоджуються. При скануванні немає контакту з об'єктом, який сканується (як у планшетних сканерах). Серед цих сканерів виокремлюють два підвиди:
1) книжкові сканери, призначені для сканування брошурованих документів. Сучасні моделі професійних сканерів дають змогу значно підвищити збережуваність документів в архівах завдяки дуже делікатному поводженню з оригіналами. Сканування виконується лицьовим боком вверх, тому дії людини під час сканування не відрізняються від перегортання сторінок при звичайному читанні. Програмне забезпечення, що використовується у книжкових сканерах, дає змогу усувати дефекти, згладжувати перекручування, редагувати отримані відскановані сторінки. Такі сканери мають унікальну функцію "усунення перегину" книги, що забезпечує хорошу якість сканованого зображення;
2) книжкові сканери з V-образною колискою на основі цифрових фотоапаратів є підвидом планетарних сканерів, однак мають низку відмінностей, серед яких V-подібна колиска, що дозволяє сканувати книгу не розкриваючи її повністю, у режимі дбайливого сканування, тому часто використовується бібліотеками. Притискне скло, яке входить до складу конструкції, забезпечує випрямлення сторінок книги (отримане зображення не містить перекручувань).
Барабанні сканери застосовуються у поліграфії, мають велику роздільну здатність (майже 10 тис. точок на дюйм). Барабанний сканер — це барабан, на якому закріплюється оригінал, що обертається з великою швидкістю. Зчитувальний пристрій розташовується дуже близько до оригіналу, чим досягається висока якість сканування.
Слайд-сканери, як зрозуміло з назви, служать для сканування плівкових слайдів, випускаються як самостійні пристрої, так і у вигляді додаткових модулів до звичайних планшетних сканерів.
Принцип роботи планшетного сканера
Розглянемо принцип роботи найпоширенішого виду сканерів — планшетного. На рис. 10.1 схематично зображений пристрій планшетного сканера, а на рис. 10.2 — принцип його роботи.
Планетарні сканери застосовуються для сканування книг або документів, які легко пошкоджуються. При скануванні немає контакту з об'єктом, який сканується (як у планшетних сканерах). Серед цих сканерів виокремлюють два підвиди:
1) книжкові сканери, призначені для сканування брошурованих документів. Сучасні моделі професійних сканерів дають змогу значно підвищити збережуваність документів в архівах завдяки дуже делікатному поводженню з оригіналами. Сканування виконується лицьовим боком вверх, тому дії людини під час сканування не відрізняються від перегортання сторінок при звичайному читанні. Програмне забезпечення, що використовується у книжкових сканерах,
дає змогу усувати дефекти, згладжувати перекручування, редагувати отримані відскановані сторінки. Такі сканери мають унікальну функцію "усунення перегину" книги, що забезпечує хорошу якість сканованого зображення;
2) книжкові сканери з V-образною колискою на основі цифрових фотоапаратів є підвидом планетарних сканерів, однак мають низку відмінностей, серед яких V-подібна колиска, що дозволяє сканувати книгу не розкриваючи її повністю, у режимі дбайливого сканування, тому часто використовується бібліотеками. Притискне скло, яке входить до складу конструкції, забезпечує випрямлення сторінок книги (отримане зображення не містить перекручувань).
Барабанні сканери застосовуються у поліграфії, мають велику роздільну здатність (майже 10 тис. точок на дюйм). Барабанний сканер — це барабан, на якому закріплюється оригінал, що обертається з великою швидкістю. Зчитувальний пристрій розташовується дуже близько до оригіналу, чим досягається висока якість сканування.
Слайд-сканери, як зрозуміло з назви, служать для сканування плівкових слайдів, випускаються як самостійні пристрої, так і у вигляді додаткових модулів до звичайних планшетних сканерів.
Принцип роботи планшетного сканера
Р
озглянемо
принцип роботи найпоширенішого виду
сканерів — планшетного. На рис. 10.1
схематично зображений пристрій
планшетного сканера, а на рис. 10.2 —
принцип його роботи.
Світло з джерела світла відбивається від сканованого оригіналу. Далі світло по системі дзеркал надходить на циліндричну лінзу, що формує на лінійці світлочутливих елементів зображення вузького рядка оригіналу. Потім процес відбувається майже так само, як у цифровій камері. Сигнал оцифровується за допомогою аналогово-цифрових перетворювачів, обробляється й у цифровій формі передається у комп'ютер один рядок оригіналу.
Каретка із джерелом світла й першим дзеркалом прецизійно переміщується уздовж оригіналу. На кожному кроці в комп'ютер передається черговий рядок. У результаті сканування отримуємо растрове зображення оригіналу.
Основним елементом сканера є CCD-матриця (Charge Coupled Device — пристрій із зарядовим зв'язком) або РМТ (PhotoMultiplier Tube — фотомножник). Колби-фотомножники використовуються лише у складному й дорогому барабанному професійному сканері, тому далі розглянутий лише принцип дії сканерів з CCD-матрицею.
CCD-матриця — це набір діодів, які реагують на світло при дії зовнішньої напруги. Від якості матриці залежить якість розпізнавання зображення. Прості моделі розпізнають наявність/відсутність кольорів, складні — відтінки сірих кольорів, ще більш складні — всі кольори. Сканований об'єкт висвітлюється ксеноновою лампою або набором світолодіодів. Відбитий промінь за допомогою системи дзеркал або лінз проектується на CCD-матрицю. Під дією світла й зовнішньої напруги матриця генерує аналоговий сигнал, що змінюється при переміщенні щодо неї аркуша й інтенсивності відображення різних елементарних фрагментів. Сигнал подається на аналогово-цифровий перетворювач, де він оцифровується і передається в пам'ять комп'ютера. Є два способи сканування: переміщення аркуша щодо нерухомої CCD-матриці і переміщення світлочутливого елемента при нерухомому аркуші.