Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lutay_A.P._Informatsiyni_tehnologiyi_ta_sistemi...doc
Скачиваний:
28
Добавлен:
16.11.2019
Размер:
46.89 Mб
Скачать

3.11 Системи оптичного розпізнавання Технології обробки зображень документів

Технології обробки зображень документів призначені для введення, обробки, збереження і пошуку графічних образів на паперових документах. Подібні системи доцільно застосовувати в організаціях з великим обсягом документообігу. Технічне забезпечення систем включає високошвидкісні сканери, документні контролери (виконують швидку і високоефективну компресію/декомпресію документів і забезпечують швидкісну роботу зі сканерами та принтерами), бібліотеки-автомати на базі оптичних нагромаджувачів з автоматичною подачею дисків. Комп'ютерні образи документів знаходяться на сервері зображень і проглядаються на робочих станціях-клієнтах.

Системи обробки зображень здійснюють сканування документів для запису на сервер, їх класифікацію за різними критеріями, передачу на зображень робочу станцію для перегляду, модифікацію або друк.

Подібні системи передбачають також визначення маршруту передачі зображень по мережі, їх факсу розсилання по чи електронній пошті, пошук зображень за окремими елементами.

Оскільки файли зображень досягають великих розмірів, існують різні варіанти організації їхнього збереження. З метою заощадження пам'яті на запам'ятовуючому пристрої більшість систем стискають зображення і створюють спеціальний індекс де зображень, містяться відповідні значення атрибутів Наприклад: документів. найменування, автор, тема.

У високопродуктивних системах реалізовані технології, що дають змогу збільшити швидкість роботи.

Наприклад, попередня вибірка і перенесення зображень з повільних оптичних носіїв на більш швидкі магнітні; адаптуюче кешування, що дозволяє зберігати часто використовувані зображення в пам'яті сервера; перенесення на лазерний диск; групове сканування, що забезпечує зчитування кількох сторінок за однуоперацію.

Системи оптичного розпізнавання символів

Багато систем обробки зображень мають програмне забезпечення оптичного розпізнавання символів (OCR).

Застосування OCR дозволяє вирішити проблему перекладу паперових документів в електронну виді форму у текстового файлу. Системи OCR дозволяють одержувати електронну копію документа з друкованого аркуша або копію документа, що прийшов по факсу. Існують експериментальні системи, що дозволяють чином подібним обробляти також і рукописні матеріали (Intelligent Character Recognition).

У стислому вигляді функціонування системи OCR можна уявити в такий спосіб. За допомогою скануючого пристрою зчитується зображення документа. У результаті розпізнавання тексту зображення документа відображається у файл, відформатований як Таким текстовий. чином, паперовий документ, минаючи трудомістке ручне введення, автоматично перетвориться в форму електронну.

Виділяють два класи систем OCR - ті, яких навчають, та інтелектуальні. Принцип дії систем першого класу заснований на “поточечному” порівнянні відцифрованого символу зі зразком із довідника. При збігу зразка і символу останній вважається розпізнаним і додається в результуючий файл. При такому способі розпізнавання розміри зразка і шрифту документа повинні збігатися, тобто в системі необхідно мати маски для кожного розміру кожного типу шрифту, тому подібна система більш ефективна у випадку однотипного і якісного тексту. В другому випадку “маска” символу його замінюється на “образ”, що може бути використаний для будь-яких розмірів шрифтів.

Для підвищення точності розпізнавання інтелектуальні системи можуть виконувати ряд перевірок результуючого тексту. Наприклад, здійснювати частотний аналіз тексту і порівнювати частоту появи даного в символу тексті з його частотою в мові оригіналу або виявляти неправильне сполучення символів, виходячи з правил орфографії.

У реальних системах OCR сполучаються різні розпізнавальні механізми, що дає можливість будь-обробляти які шрифти і будь-які тексти.

На сьогоднішній день відомо кілька досить якісних програмних продуктів по розпізнаванню тексту, у тому числі дві системи вітчизняних фірм, орієнтовані в першу чергу на розпізнавання російськомовних текстів (Fine Reader та CuneiForm). Середня швидкість роботи системи

OCR на устаткуванні середньої потужності складає приблизно одну машинописну сторінку за хвилину. Якість розпізнавання - одна-дві помилки на 1000 знаків у тексті середньої якості.

Можна рекомендувати наступні критерії вибору системи OCR:

  • сумісність з існуючим програмним та апаратним забезпеченням;

  • швидкість сканування і розпізнавання переважного в даній установи типу тексту, наприклад: факс - українська мова, ксерокопія різної якості, машинопис різної якості та ін.;

  • якість розпізнавання текстів різних типів, наприклад, кількість помилок на 1000 знаків;

  • здатність розпізнавати рідкісні шрифти;здатність навчання новим символам;наявність елементів семантичного аналізу тексту;наявність модуля перевірки орфографії;

  • зручність користувальницького інтерфейсу.

Проте, основними характеристиками читаючих автоматів є достовірність розпізнання та виробничі потужності.

Найпоширеніші системи оптичного розпізнавання символів Finereader і Cuneiform використовують як растровий, так і структурний методи розпізнавання

FineReader — система оптичного розпізнавання символів розроблена російською компанією ABBYY Software House. Підтримує розпізнавання тексту багатьма мовами і має вбудовану перевірку орфографії на 38 з них.

CuneiForm — інструмент оптичного розпізнавання символів, розроблений російською компанією Cognitive Technologies. Програма перетворює файли зображень, отримані зі сканера або іншим шляхом на текст.

CuneiForm – шрифтонезалежна система. Алгоритми, закладені в CuneiForm, виходять з правил написання літер, з їх топології, і не вимагають завдання яких-небудь еталонів, або навчання. Розпізнаються будь-які друкарські шрифти - книги, газети, журнали, роздруківки з лазерних і матричних принтерів, тексти з друкарських машинок, і т.п. Не розпізнається рукописний текст і декоративні шрифти (готичний, стилізований під рукописний). У CuneiForm існують спеціальні налаштування для розпізнавання текстів з матричного принтера і факсів .CuneiForm зберігає форматування тексту і роспізнає складні таблиці будь-якої структури.

Інтелектуальна система оптичного розпізнавання ABBYY FineReader 10 дозволяє швидко і точно перекладати паперові документи, цифрові фотографії документів і PDF-файли в електронний вигляд. При розпізнаванні ABBYY FineReader повністю зберігає оформлення документа: ілюстрації, картинки, списки і т.д. Отримані результати можна виправляти в програмах Microsoft Office, зберігати в різних форматах, відправляти по електронній пошті і публікувати в інтернеті.

Надійне сканування

ABBYY FineReader працює зі всіма популярними моделями сканерів і багатофункціональних пристроїв, у тому числі з обладнанням наступних виробників: AGFA, Fujitsu, Plustek, Avision, Genius, Primax, BenQ, HP, Ricoh, Brother, Kodak, Toshiba, Canon, Lexmark, Umax, Dell, Microtek, Visioneer, Epson, Mustek, Xerox.

Для сканування великої кількості сторінок в програмі передбачений спеціальний режим, що дозволяє працювати як з автоподатчиком сканера, так і без нього.

Широкий вибір графічних форматів

ABBYY FineReader відкриває файли наступних форматів: PDF, DJVU, BMP, PCX, DCX, JPEG, JPEG 2000, TIFF, PNG. Відкриття PDF-файлів

ABBYY FineReader відкриває і розпізнає файли у форматі PDF. Творець PDF-файла може обмежити доступ до свого файлу, наприклад захистити його паролем, встановити заборону на відкриття файлу або витяг з нього тексту і графіки. При відкритті подібних файлів ABBYY FineReader запрошуватиме пароль, щоб забезпечити захист авторських прав творця файлу.

Обробка зображень

ABBYY FineReader дозволяє заздалегідь обробити зображення, щоб підвищити якість розпізнавання і спростити подальшу роботу з документом. Програма містить такі опції як: очистити зображення від сміття, усунути перекоси, усунути спотворення рядків, Інвертувати зображення, повернути або дзеркально відобразити зображення, обрізати зображення, стерти частину зображення.

Аналіз і розпізнавання

Визначення структури документа

ABBYY FineReader представляє революційно новий підхід до розпізнавання документів. Тепер документ аналізується і обробляється цілком, а не посторінковий, що дозволяє FineReader зрозуміти такі елементи його внутрішньої структури, як верхні і нижні колонтитули, виноски, підписи до картинок і діаграм, стилі, шрифти і т.д. Елементи початкового документа відновлюються в результуючому документі. Наприклад, при збереженні в Word верхні і нижні колонтитули, виноски відтворюються як відповідні об'єкти в Word.

Відмінна якість розпізнавання і точне збереження оформлення

Система оптичного розпізнавання ABBYY FineReader точно розпізнає і максимально повно зберігає початкове оформлення будь-якого документа (в тому числі з текстом на тлі картинок, з кольоровим текстом на кольоровому фоні, з обтіканням картинок текстом і т.д.)

Розпізнавання багатомовних документів

ABBYY FineReader розпізнає документи на 179 мовах, включаючи російська, англійська, німецька, французька, іспанська, італійська, шведська, фінська, болгарська, угорська, словацька, чеська, башкирський, білоруський, казахський, український. Для 38 мов, передбачена перевірка орфографії. Текст документа може бути складений на двох і більше мовами. Користувач може вказати свою мову розпізнавання для кожного блоку типу «текст» або для кожного комірки таблиці.

Інтелектуальне розпізнавання PDF-документів

Як відомо, деякі PDF-файли містять так званий текстовий шар, причому його вміст може не повністю відповідати видимому на екрані документу. FineReader заздалегідь аналізує вміст файлу і для кожного текстового блоку ухвалює рішення: розпізнати його або витягувати відповідний текст з текстового шару. Таким чином вдається збільшити якість розпізнавання і скоротити час обробки.

Розпізнавання цифрових фотографій документів

Тепер для розпізнавання необов'язково оснащувати комп'ютер сканером. ABBYY FineReader дозволяє розпізнавати фотографії документів, зроблені цифровою камерою (рекомендується використовувати цифровий фотоапарат з дозволом матриці 4 Мпікс і вище).

Розпізнавання гіперпосилань

ABBYY FineReader знаходить в тексті посилання на веб-сайти, адреси електронної пошти, файли, ftp-сервери і відтворює їх у вихідних документах.

Такі документи можуть бути збережені у форматах Microsoft Word, PDF і HTML. Крім того, в розпізнаний текст можна додавати власні гіперпосилання.

При розпізнаванні PDF-файлів, крім зовнішніх посилань, відновлюються і внутрішні (на інші сторінки того ж документа).

Розпізнавання штрих-кодів

ABBYY FineReader підтримує розпізнавання штрих-кодів, у тому числі двовимірних типу PDF-417. Легкість і зручність використання.

Автоматична обробка документів

Процес розпізнавання документів дуже часто складається з одного і того ж набору операцій. Щоб заощадити час користувача, у програмі ABBYY FineReader описано декілька найбільш поширених сценаріїв обробки документів, наприклад «відсканувати - розпізнати - зберегти в PDF». Для запуску сценарію досить натиснути одну кнопку - все інше FineReader зробить автоматично.

Крім того, в ABBYY FineReader можна створювати власні, призначені для користувача сценарії. Майстер сценаріїв допоможе швидко і просто налаштувати FineReader на вирішення тих чи інших завдань.

Інтеграція з іншими додатками

Виклик з Microsoft Word і Excel Ви можете викликати FineReader безпосередньо з Microsoft Word, Excel і вставити розпізнаний текст «під курсор» у вже відкритий документ або в новий документ.

Інтеграція з Windows Explorer

Процес розпізнавання можна запустити з контекстного меню файлу або перетягнути файл з провідника прямо у вікно FineReader.

Інтеграція з поштовими програмами

Процес розпізнавання можна запустити з листа з вкладеними графічними або PDF-файлами. Якщо в додатку декілька файлів, то програма запропонувати вибрати потрібні вам файли. ABBYY FineReader дозволяє відправити зображення або розпізнаний текст електронною поштою у вигляді вкладеного файлу.

Інструменти для розбиття зображення

Ви можете розбити зображення на кілька частин і зберегти кожну з них як окрему сторінку. Кожна з таких сторінок може бути оброблена окремо, наприклад, для них може бути усунутий перекіс. Ця можливість особливо корисна при розпізнаванні книжкових розворотів, візитних карток і роздруківок презентацій Microsoft PowerPoint.

Контрольні запитання:

1. Системи оптичного розпізнавання.

2. Технології обробки зображень документів.

3. Системи оптичного розпізнавання символів (OCR).

4. Критерії вибору системи OCR.

5. Найпоширеніші системи оптичного розпізнавання символів.

6. Інтелектуальна система оптичного розпізнавання ABBYY FineReader.

7. Інструмент оптичного розпізнавання символів — CuneiForm.

8. Обробка зображень, аналіз і розпізнавання.

9. Інтелектуальне розпізнавання PDF-документів.

10. Розпізнавання гіперпосилань.

11. Інтеграція з іншими додатками.

Завдання для аудиторної контрольної роботи в середовищі

текстового редактора Microsoft Word - робота з текстом

Приклад виконання практичного завдання

Завдання:

  1. Завантажити текстовий редактор Microsoft Word.

  2. Установити режим виводу у вікні тільки панелей інструментів "Стандартная" і "Форматирование".

  3. Установити спосіб показу документа Разметка страницы

  4. Установити наступні параметри сторінки:верхнє, нижнє, праве поля – 2 см, ліве поле – 3 см. Орієнтація листа – книжкова.

  5. Для введення тексту вибрати тип шрифту Times New Roman, розмір - 14 пунктів

  6. У вікні редагування ввести тему лабораторної роботи, прізвище студента, групу, дату роботи.

  7. У вікні редагування ввести абзаци тексту з використанням аналогічних способів форматування (зміна шрифтів, способів вирівнювання тексту, визначення відступів за допомогою лінійки форматування).

Готельна сфера — основна складова туристичної індустрії за обсягом матеріальних і фінансових ресурсів, кількістю зайнятих працівників, обсягом доходів у туризмі. Готельний сервіс охоплює комплекс послуг для туристів. Це ключовий чинник, який визначає перспективи розвитку туризму. Туристичні послуги, зокрема в межах готельного обслуговування, належать до соціально-культурних. їх формують на принципах сучасної гостинності, що підвищує їхню роль у розвитку вітчизняного туризму, а також зумовлює необхідність фахової підготовки кадрів для туристичного та готельного сервісу.

8. Змінити шрифт заголовка тексту: тип шрифту - Arial, накреслення – напівжирний курсив, розмір - 16 пунктів.

9. Для першого абзацу тексту за допомогою лінійки форматування установити відступ ліворуч 1 см, відступ праворуч 1,5 см, відступ першого рядка 3 см.

10. Виконати центрування заголовка.

11. Скопіювати текст у вікні редагування 7 разів.

12. Установити міжрядковий інтервал у всьому тексті полуторний.

13. Установити масштаб перегляду документа 80%.

14. Розставити номера сторінок у документі, починаючи з 5. Номер сторінки повинен друкуватися і на першій сторінці документа.

15. Зберегти документ на диску ім’я файла - П.І.Б.

16. Створити новий документ.

17. Скопіювати 2 абзаци тексту з документа (ім’я файла - П.І.Б.) в новий документ.

18. Установити вивід у вікні програми Word двох документів.

19. Зберегти файли на диску D у папці Мої документи.

20. Роздрукувати документ.