Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
26
Добавлен:
12.02.2016
Размер:
1.66 Mб
Скачать

Хід виконання

1. Визначитися з предметною областю майбутніх наукових досліджень, уточнити тему з викладачем та науковим керівником.

2. Зробити аналіз літературних джерел для вступу з даної предметної області, використавши при цьому як електронні фахові ресурси так і інформацію на твердих носіях. Для отримання таксту з твердих носіїв, виконати почергово оцифрування зораження з допомогою цифрової камери а також сканера.

3. Оцифрувавати зображення «цифровиком».Для цього можна використати компактну фотокамеру чи мобільний телефон з мінімальним розміром матриці іневеликою кількістю мегапікселів:

- розташувати сторінку, яка фотографується, на увесь кадр - не повинна виходити за його межі і не залишати білих полів. Цього можна досягти, видаливши фотоапарат в середньому на 50 сантиметрів від документу. При цьому на зображенні не повинно бути тіней або відблисків, освітлення природне і достатнє;

- розташувати фотоапарат потрібно прямо по центру тексту так, щоб об'єктив був паралельний до документу. Краще вимкнути фотоспалах, щоб уникнути утворення відблисків на знімку. Увімкнути в фотокамері режим «Текст» або «Макро» (піктограма з квіткою). Бажано використати стабілізатор зображення для отримання вищої чіткості (якщо таку функцію підтримує дана камера);

- натискати на кнопку спуску плавно, без ривків і різких рухів. В іншому випадку всі налаштування фокусування і стабілізації зіб'ються. Зробити знімок тексту, переглянути, що вийшло. При некоректному підсумковому зображенні повторити процедуру. Пепенести отримане зображення на ПК.

4. Виконати сканування тексту через програму FineReader, який працює зі сканерами через TWAIN-інтерфейс.

Основними параметрами сканування є:

  • Тип зображення- сірий (256 градацій).

Сканування в сіромує оптимальним режимом для системи розпізнавання. У випадку сканування в сірому режимі здійснюється автоматичний підбір яскравості.Чорно-білийтип зображення забезпечує більш високу швидкість сканування, але при цьому губиться частина інформації про букви, що може привести до погіршення якості розпізнавання на документах середньої і низької якості друку. Для передання в електронний документ кольорових елементів, що містяться в документі-оригіналі (малюнків, кольорових букв і тла), необхідно вибратикольоровийтип зображення з відповідною глибиною кольору.

  • Роздільна здатнiсть- 300 dpi  для звичайних текстів (розмір шрифту 10 і більш пунктів) і 400-600 dpi для текстів, набраних дрібним шрифтом (9 і менш пунктів).

Зауваження. Сканування з роздільною здатнiстю 400-600 dpi замість 300 dpi або сканування в сірому або в кольорі, а не в чорно-білому може зайняти істотно більше часу. На деяких моделях сканерів сканування зі здатнiстю 600 dpi займає в 4 рази більше часу, ніж сканування зі здатнiстю 300 dpi.

5. Виконати аналіз макета сторінки.

Аналіз макета сторінки може проводитися як автоматично, так і вручну. У більшості випадків FineReader сам успішно справляється з аналізом складних сторінок. Автоматичний аналіз виробляється по кнопці 2-РОЗпІзнатИ (Читати) одночасно з розпізнаванням тексту.

Зауваження.Окрема процедура аналізу макета сторінки теж доступна (менюПроцес>Аналіз макета сторінки). Правда, при цьому якість сегментації може бути нижче, тому що при спільній процедурі розпізнавання і сегментації для аналізу сторінки використовується додаткова інформація, отримана в процесі розпізнавання.

6. Процес Розпізнавання, який полягає в тому, щоб перетворити вiдскановане зображення в текст, зберігши при цьому оформлення сторінки. Перш ніж приступити до розпізнавання тексту, необхідно установити основні параметри розпізнавання: мову розпізнавання, тип друку розпізнаного тексту і тип сторінки.

7. Виконати перевірка і редагування тексту.

8. Зберегти текст в зовнішні редактори і формати, наприклад в Microsoft Word. І створити файли з відповідними іменами.

9. Провести загальне ознайомлення з пакетами програм мовного розпізнавання тексту DragonNaturallySpeakingPersonalEdition 1.0 і Диктант 2.5: - Зробити інсталяцію пакетів у папки D:\Dragon і D:\Dictate. Запустити додатки, ознайомитися з їхнім інтерфейсом користувача. Зробити тести аудіосистеми робочої станції, необхідні для початку роботи з пакетами (можна використати наявні в глобальній мережі);

- Для пакета Dragon здійснити мовне уведення обраного фрагмента тексту англійською мовою. При необхідності скорегувати уведений текст і зробити додаткове навчання розпізнавача за допомогою команд Tools >Train wordsабоTools >VOCabulary Builder. Для пакетаДиктантза допомогою командГолосовое меню >Возможности>Добавить словозробити додаткове навчання для уведення обраного фрагмента тексту за допомогою додаткаБлокноті голосове керування додаткомКалькулятор. Запустити додатокБлокнот,Калькуляторі провести роботу з ними під керуванням мовного розпізнавачаДиктант.

10. Проаналізувати отримані результати і зробити Висновки.