- •Методичні рекомендації для виконання самостійних робіт з дисципліни
- •1. Мета та завдання навчальної дисципліни
- •Самостійна робота № 1 Інформатика. Подання інформації в пк
- •Методичні рекомендації для студентів
- •Позиційні системи числення
- •Алгоритми переведення чисел з однієї позиційної системи числення в іншу
- •Завдання:
- •Основна література
- •Питання та завдання для самоконтролю та самоперевірки
- •Основна література
- •Питання та завдання для самоконтролю та самоперевірки
- •Самостійна робота №3
- •Методичні рекомендації для студентів
- •Форматування тексту.
- •Практичні завдання:
- •Вимоги безпеки в аварійних ситуаціях
- •Увага щодо форматування тексту!
- •Основна література
- •Питання та завдання для самоконтролю та самоперевірки
- •Самостійна робота № 4 Вставка графічних об’єктів у текстовому редакторі ms Word
- •Методичні вказівки для студентів
- •Вставка малюнків з колекції Microsoft ClipGallery
- •Робота з малюнками в редакторі
- •Хід роботи
- •Створити коло:
- •Створити ромб:
- •Створити прямокутник, аналогічно до створення ромба.
- •Намалювати лінії:
- •Створити написи:
- •Згрупувати створене зображення:
- •Основна література
- •Основна література
- •Питання та завдання для самоконтролю та самоперевірки
- •Основна література
- •Розпізнавання документів у програмі FineReader
- •Порядок розпізнавання текстових документів
- •Сканування документа
- •Сегментація документа
- •Розпізнавання документа
- •Особливості настроювання програми FineReader
- •Розпізнавання бланків
- •Алгоритм сканування фотографій:
- •Алгоритм сканування тексту з графічними зображеннями:
- •Основна література
- •Хід роботи
- •3. Відкрийте файл file1.Htm у броузері.
- •4. Поекспериментуйте з різними значеннями кольорів (green, white, yellow, blue, #ffaa55 тощо) параметрів bgcolor і text.
- •Основна література
- •Питання та завдання для самоконтролю та самоперевірки Завдання для самостійної роботи з теми: «Створення Web-документів»
- •Контрольні питання
- •Завдання:
- •Основна література
- •Питання та завдання для самоконтролю та самоперевірки
Порядок розпізнавання текстових документів
Перетворення паперового документа в електронний відбувається в три етапи. Кожний з цих етапів програма FineReader може виконувати як автоматично, так і під контролем користувача. Якщо всі етапи проводяться автоматично, то перетворення документа відбувається за один прийом.
1. Перший етап роботи – сканування. На цьому етапі звичайно використовують сканер. Однак зображення з листа папера може бути перетворене в цифрову форму і за допомогою інших засобів, таких, наприклад, як цифрові фотоапарати і цифрові відеокамери.
2. Другий етап роботи — сегментація тексту. Справа в тім, що в паперовому документі, наприклад на сторінці книги або журналу, текст не завжди розташовується у фіксованому порядку. Він може розміщатися в декількох колонках, містити ілюстрації (і підпису до них). Додаткові урізання і дані, представлені в таблицях, також можуть заплутати природний порядок тексту. Тому, перш ніж включати текст у документ, його розбивають на блоки, що містять цільні фрагменти. Блоки розпізнають послідовно. Отриманий текст включається в документ у порядку нумерації блоків.
3. Останній етап роботи програми — безпосереднє розпізнавання. Цей етап звичайно не вимагає втручання користувача, за винятком тих випадків, коли розпізнавання супроводжується «навчанням».
Розпізнаний текст відображається в окремому вікні у вигляді форматованого текстового документа. Він «утрачає зв'язок» з вихідним зображенням і може редагуватися, і форматуватися незалежно від нього. Програма виділяє кольором ті символи, що вона сама розглядає як неоднозначно пізнані. Це спрощує пошук помилок. Засобами програми в отриманому тексті можна також провести перевірку граматики.
4. Отриманий текст можна зберегти у вигляді форматованого або неформатованого документа. Передбачена також можливість прямої передачі отриманого тексту в програми Word або Excel, а також у буфер обміну Windows.
Сканування документа
Сканування — це технічна операція, яку виконує скануючий пристрій. Задача програми FineReader на цьому етапі полягає в тому, щоб прийняти отриману інформацію і відобразити значки відсканованих сторінок на панелі Пакет. Так сторінки готуються до розпізнавання.
Сегментація документа
Під звичайним порядком розпізнавання тексту розуміється послідовне розпізнавання рядків зліва направо. Однак, якщо текст розбитий на декілька колонок (стовпців) або містить урізання, підписи під малюнком, примітки, таблиці й інші елементи форматування, його розпізнавання в звичайному порядку неможливо. У таких випадках програма розбиває текст на блоки, кожний з яких являє собою цільний фрагмент тексту, розпізнаваний у звичайному порядку. Така розбивка документа називається сегментацією.
Автоматична сегментація — не проста задача для програми. Програма розшукує проміжки між рядками, а також зони початку і кінця рядків. Якщо послідовність рядків, що йдуть підряд, має однакові зони початку і кінця, то програма розглядає таку область як текстовий блок.
Якщо проміжки між рядками узагалі відсутні, то, як видно, мова йде про ілюстрації. Якщо виявляється велике число вертикальних і горизонтальних фрагментів, що утворять правильну структуру, то, напевно, у текст включена таблиця.
Якщо клацнути на кнопці Сегментувати виділені сторінки, то сегментація сторінки виробляється автоматично. Правда, якщо зображення документа має невисоку якість, то сегментація може бути зроблена невдало, що проявиться в надлишковій кількості занадто дрібних блоків.
У таких випадках можна вручну вказати межі блоків або змінити автоматичну розбивку. Нові прямокутні блоки створюють методом протягання миші. При протяганні створюваний блок виділяється пунктирною рамкою, яка у момент створення блоку перетворюється в суцільну зелену лінію.
Якщо сторінка має простий стандартний вид, то простіше вручну створити одиночний блок, що охоплює всю сторінку, чим надати це програмі, ризикуючи можливістю появи помилок.
Один зі створених блоків завжди є поточним. Він обведений більш жирною лінією, а його вершини позначені маркерами. Перетаскуванням цих маркерів можна регулювати границі блоку.
Для створення блоку непрямокутної форми або зміни послідовності блоків використовують кнопки панелі інструментів Інструменти. Усі кнопки цієї панелі використовуються саме на етапі сегментації.
Програма FineReader розрізняє кілька типів блоків, які обробляються по-різному. Такі блоки виділяються різними кольорами. Текстові блоки обводяться зеленою лінією. Щоб змінити тип блоку, варто клацнути в межах блоку правою кнопкою миші і вибрати потрібний тип у меню Тип блоку контекстного меню.
