
- •Н аціональний технічний університет України «Київський політехнічний інститут»
- •Завдання на дипломний проект (роботу) студенту
- •Р еферат
- •Перелік прийнятих скорочень
- •Постановка задачі
- •Розділ 1 аналіз шляхів налагодження інтерфейсу користувача з програмними додатками
- •1.1 Існуючі технології інтерфейсів, критерії та оцінка їх ефективності
- •1.2 Голосовий інтерфейс та його практичне застосування
- •1.3 Системи розпізнавання мови
- •1.4 Огляд продуктів, які використовують технології голосового інтерфейсу
- •1.5 Реалізація голосового інтерфейсу в AutoCad
- •Розділ 2 методика побудови та оцінювання ефективності голосового інтерфейсу
- •2.1 Попередній аналіз сигналу
- •2.2 Приховані марківські моделі
- •2.3 Алгоритм Вітербі
- •2.3 Методика goms
- •Розділ 3 розробка програм з голосовим інтерфейсом
- •3.1 Вибір інструментальної платформи
- •3.2 Вимоги до програм та інструкція користувача
- •3.3 Опис розроблених програм з голосовим інтерфейсом
- •Розділ 4 експериментальні дослідження ефективності голосового інтерфейсу у програмах
- •4.1 Програма «Голосовий калькулятор – 1»
- •4.2 Програма «Голосовий калькулятор-2»
- •4.3 Програма «Голосовий блокнот»
- •4.4 Програма «Голосовий знімок екрану»
- •Розділ 5 охорона праці
- •5.1 Загальні положення
- •5.2 Гігієна праці і санітарія
- •Висновки і перспективи подальших досліджень
- •Перелік посилань
Перелік прийнятих скорочень
GOMS – модель цілей, об’єктів, методів і правил відбору
ПММ – приховані марківські моделі
ВСТУП
Актуальність проблеми. На даний час найбільш поширений інтерфейс користувача з програмними додатками включає в себе використання маніпулятора «миша» та клавіатури. Однак очевидними є зайві затрати часу на виконання окремих операцій за рахунок використання цих пристроїв. Таким чином актуальною є тема підвищення ефективності використання традиційних інтерфейсів користувача з програмними додатками за рахунок включення до його складу голосової взаємодії. Дана робота присвячена дослідженню ефективності застосування марківських прихованих моделей для побудови голосових компонент інтерфейсу користувача з програмними додатками.
В історії розвитку 1952 рік можна вважати роком народження систем розпізнавання мови. Компанія Bell Laboratories розробила систему названу Одрі, яка розпізнавала цифри, сказані одним голосом. Через 10 років компанія IBM представила комп'ютер Shoebox зі здатністю розпізнавати 16 слів англійською мовою.
Голосові технології міцно увійшли в наше повсякденне життя. В наш час системи голосового інтерфейсу отримують практичне застосування в телекомунікація, мобільних пристроях, побутових пристроях, автомобілях, освіті, комп'ютерних системах, інтернеті, системах доступу, аерокосмосі, військовому комплексі, іграх.
Створення інтерфейсу користувача має бути націлене на показники ефективності людино-машинної системи, які можна виміряти кількісно і об'єктивно:
продуктивність праці;
точність роботи (кількість помилок);
функціональна повнота;
завершеність роботи;
простота освоєння.
Найбільш поширені інтерфейси, з використанням клавіатури та миші, не відповідають усім заявленим вимогам. Сучасні комп'ютерні програми все більшою мірою стають орієнтованими на користувача, і як альтернатива пропонується голосовий інтерфейс. На сьогоднішній день найбільш поширеним алгоритмом розпізнавання мови є приховані марківські моделі. Він використовується в різних програмних додатках, але ефективність застосування марковських прихованих моделей для побудови голосових компонент інтерфейсу користувача з програмними додатками потребує досліджень.
Проблема розробки голосового інтерфейсу є досить складною і комплексною, що вимагає від розробника знань у різних предметних областях, таких як комп'ютерні науки, лінгвістика та психологія поведінки людини. Навіть при наявності просунутих засобів проектування, розробка ефективного голосового інтерфейсу вимагає від його творців детального розуміння як задач, виконуваних системою, так і психології користувачів системи.
Об’єктом дослідження є голосовий інтерфейс.
Предмет дослідження – моделі та методи побудови голосового інтерфейсу.
Робота складається з вступу, п’ятьох розділів і висновку. В першому розділі наведені проведений огляд літератури, описані критерії та оцінка ефективності інтерфейсу, розлянено практичнее використання голосового інтерфейсу, системи розпізнавання мови та програмне забезпечення для реалізації данної технології. У другому розділі розглянуто методику побудови та оцінювання ефективності голосового інтерфейсу. У третьому розділі розроблена структурно-функціональна схема та архітектура програмної реалізації голосового інтерфейсу, представлений опис програм. У четвертому розділі представлені результати експериментальних дослідженнь у програмах з голосовим інтерфейсом, які використовують приховані марківські моделі для розпізнавання голосових команд.У п’ятому розділі розглянуто охорону праці у відділі інформаційних технологій.