Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
main (Автосохраненный).docx
Скачиваний:
4
Добавлен:
22.08.2019
Размер:
1.74 Mб
Скачать

Министерство образования и науки Российской Федерации

Государственное образовательное учреждение высшего профессионального образования

Рязанский государственный радиотехнический университет

Факультет вычислительной техники К ЗАЩИТЕ

Кафедра ЭВМ Заведующий кафедрой ЭВМ

Направление 230100 д.т.н., профессор

______________ В.К.Злобин

«___»______________2012 г.

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА

к выпускной квалификационной работе на тему

«user_name_theme»

Студент ______________________________ (Жидков С.О.)

Руководитель работы __________________ (Бабаев С.И.)

«____»_____________ 2012 г.

Оглавление

Введение 4

1. Технико-экономическое обоснование работы 6

1.1. Описание предметной области 6

1.2. Анализ существующих аналогов 8

2. Постановка задачи 9

2.1. Основание для разработки программы 9

2.2. Назначение разработки 9

2.3. Требования к программе 9

2.3.1. Условия эксплуатации 10

2.3.2. Требования к программной совместимости 10

2.4. Требования к программной документации 10

3. Теоретическая часть 11

3.1. Введение в речевые технологии 11

3.2. Преобразование текста в синтезированную речь 12

3.3. Структура синтезатора речи по тексту 13

3.3.1. Текстовый процессор 14

3.3.2. Просодический процессор 16

3.3.3. Фонетический процессор 17

3.3.4. Акустический процессор 19

3.4. Компоненты Speech API 20

3.5. Необходимые компоненты и их установка 25

3.6. Оценка разборчивости синтезированной речи 26

3.7. Выбор языка программирования 28

4. Разработка алгоритмов 29

4.1. Общий алгоритм решения задачи 29

4.2. Алгоритм подключения голосовых модулей 30

4.3. Алгоритм настройки голосовых модулей 31

4.4. Алгоритм управления голосовым модулем 34

4.5. Описание логической структуры разработанной программы 36

5. Разработка интерфейса пользователя 41

5.1. Разработка форм 41

5.2. Разработка сценария инсталляции программы 46

6. Разработка программной документации 47

6.1. Руководство системного программиста 47

6.1.1. Общие сведения о программе 47

6.1.2. Структура программы 47

6.1.3. Проверка программы 48

6.1.4. Настройка программы 48

6.1.5. Сообщения системному программисту 49

6.2. Руководство оператора 50

6.2.1. Назначение и условия применения программы 50

6.2.2. Обращение к программе для запуска 50

6.2.3. Входные и выходные данные 51

6.2.4. Сообщения пользователю 52

Заключение 53

Список используемых источников 54

Введение

Современный уровень развития вычислительной техники и её повсеместное внедрение в человеко-машинных системах управления делают актуальной организацию общения человека и компьютера в одной из наиболее удобных для человека форм – в форме речевого диалога на естественном языке. Речевой способ общения в человеко-машинных системах имеют принципиальные преимущества, главными из которых являются следующие:

- удобство, естественность и простота общения, не требующая специальной подготовки, что существенно расширяет круг потенциальных пользователей вычислительных систем и повышает эффективность их использования;

- разгрузка зрительного канала при выводе информации и устранение ручных манипуляций при вводе, что увеличивает оперативность взаимодействия с компьютером и уменьшает число ошибок оператора;

- возможность использования в качестве терминалов телефонных аппаратов и существующей сети телефонной связи, что позволяет создавать системы массового обслуживания, в том числе с выходом в Интернет.

Создание систем речевого общения с ЭВМ требует решения двух основных проблем: проблемы автоматического синтеза и проблемы автоматического анализа и распознавания речи. В полном объеме проблема синтеза речи решается в тех исследованиях и разработках, в которых ставиться задача автоматического синтеза речи неограниченного словарного состава непосредственно по орфографическому тексту сообщения с любыми наперед заданными характеристиками синтезированного голоса и речи. Эта задача удовлетворительно еще не решена ни для одного из языков, хотя на её решение были затрачены усилия многих исследователей из разных стран. Исследователи сталкиваются с принципиальными трудностями, связанными с созданием интеллектуальной системы, моделирующей речевое чтение человеком произвольных текстов. Следует также отметить, что далеко не все результаты, полученные для одного языка, годятся при разработке синтезатора речи другого языка. Фонетические системы каждого конкретного языка уникальны. Необходима конкретно-языковая разработка правил ассимиляции, коартикуляции и редукции звуков, ритмико-мелодической организации речи.

Исследования, приведенные для создания моделей синтеза речи по тексту, позволили вскрыть тонкие глубинные структуры звуковой организации речевого потока. Удовлетворительный по качеству синтез речи невозможен в принципе, если не созданы всеобъемлющая и детально проработанная акустическая модель полной системы фонем языка, модель их модификаций в речевом потоке под действием комбинаторах и позиционных факторов. По мере разработки все более качественной модели синтеза речи по тексту накапливается все более достоверная информация об эталонных образцах каждой фонемы и их модификаций в речевом потоке. Эта информация является исключительно ценной для смежной области – автоматического распознавания речи.

Несмотря на широкое развитие исследований в области синтеза речи по тексту, основным критерием качества до недавних пор оставалась степень разборчивости синтезированной речи. Недостаточное внимание, уделяемое естественности синтезированной речи, ставит барьер для широкого применения систем синтеза речи по тексту в составе интерфейсов компьютерных систем и устройств. Одним из путей повышения естественности синтезированной речи является разработка методов и средств анализа персональных особенностей голоса человека, его дикции и выразительности речи с последующей реализацией этих характеристик при синтезе речи по тексту. При этом решается не только проблема повышения естественности синтезированной речи, но и проблема воспроизведения произвольного текста с манерой чтения конкретного человека и его голосом.

Таким образом, исследование проблемы синтеза речи по тексту актуально как в практическом плане создания универсальных систем речевого вывода информации из компьютера, так и в теоритическом плане создания интеллектуальных персонализированных моделей чтения текстов различных стилей и содержания человеком.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]