- •Министерство образования и науки российской федерации
- •Оглавление
- •Список рисунков
- •Введение
- •Основы работы со средой математического моделирования МаtLab
- •История создания и развития системы MatLab
- •Интерфейс пользователя
- •Типы данных в системе MatLab
- •Переменные в системе MatLab
- •Арифметические и логические операции в системе MatLab
- •Массивы и матрицы в системе MatLab
- •Использование знака «:» и множественной индексации в системе MatLab
- •Операции над матрицами в системе MatLab
- •Встроенные функции в системе MatLab
- •Графические возможности системы MatLab
- •Изменение свойств линий и оформление графиков
- •Графики функций двух переменных
- •Вывод нескольких графиков на одни оси
- •Вывод нескольких графиков в одном графическом окне
- •Работа со звуковыми файлами в системе MatLab
- •Считывание данных из wav-файлов
- •Запись данных в wav-файл
- •Воспроизведение звуковых сигналов
- •Запись звуковых сигналов
- •Лабораторная работа №1. Исследование внутренней структуры речевого сигнала
- •Методические указания к лабораторной работе
- •Исследование структуры и временных характеристик речевых сигналов
- •Ручная сегментация исследуемой фонограммы
- •Определение фонетического состава сегментов исследуемого слова
- •Лабораторная работа №2. Исследование спектральных свойств речевого сигнала
- •Методические указания к лабораторной работе
- •Комментарии по оформлению отчета к лабораторной работе
- •Программа анализа спектров фонограмм «Спектр» (версия 4)
- •Назначение программы
- •Функциональные возможности программы
- •Лабораторная работа №3. Исследование корреляционных свойств речевого сигнала
- •Методические указания к лабораторной работе
- •Комментарии к оформлению отчета по лабораторной работе
- •Программа анализа корреляционных функций «Коррелограмма»
- •Назначение программы
- •Предварительный этап работы с фонограммой
- •Порядок работы в программе «Коррелограмма»
- •Дополнительные возможности по работе с программой
- •Лабораторная работа №4. Исследование vad-алгоритма
- •Методические указания к лабораторной работе
- •Комментарии по оформлению отчета к лабораторной работе
- •Исследование алгоритма vad в программе «Коррелограмма»
- •Лабораторная работа №5. Исследование методов оценки основного тона речи
- •Методические указания к лабораторной работе
- •Лабораторная работа №6. Моделирование алгоритмов обработки речи
- •Методические указания к лабораторной работе
- •Список индивидуальных заданий
- •Вопросы для самоподготовки
- •Лабораторная работа №1
- •Лабораторная работа №2
- •Лабораторная работа №3
- •Лабораторная работа №4
- •Лабораторная работа №5
- •Лабораторная работа №6 (Индивидуальные задания)
- •Список литературы
- •Приложение аСписок литературы и web-ресурсы по «Речевым технологиям» и среде математического моделирования «MatLab»
- •Список литературы по «Речевым технологиям»
- •Отечественная литература
- •Общетеоретические вопросы
- •Прикладная фонетика
- •Синтез речи
- •Психоакустика и физиология речи
- •Цифровая связь (телефония)
- •Зарубежная литература
- •Web – ресурсы
- •Список литературы по среде математического моделирования «MatLab»
- •Приложение б Современные направления научно-исследовательских работ кафедры «Бортовых радиоэлектронных систем в области разработки систем обработки речи
- •Основные области применения разрабатываемых алгоритмов
- •Многоуровневая временная сегментация речевых сигналов
- •Модификация фонограмм
Лабораторная работа №4. Исследование vad-алгоритма
Цель работы: изучение методов обнаружения речевой активности.
Методические указания к лабораторной работе
Перед выполнением лабораторной работы студенту необходимо ознакомиться с существующими методами обнаружения речевой активности в литературе по обработке речи (см. список рекомендованной литературы), а также использовать дополнительные источники информации (периодические издания, интернет).
Для большинства алгоритмов обработки речевых сигналов необходимым в первую очередь является определение речевой компоненты (активности) во входном речевом сигнале. Существует несколько вариантов построения алгоритмов VAD (Voice Activity Detection). В зависимости от задач обработки решение о речевой активности может приниматься с задержкой во времени или без нее. Возможно усложнение алгоритма VAD с целью расширения его возможностей, например, введение классификации типов сегментов речи.
В данной лабораторной работе студенту предлагается ознакомиться с метод обнаружения речевой активности (VAD-алгоритмы) реализованным в программе «Коррелограмма».
Блок-схема алгоритма обнаружения речевой активности показана на рис.5.1.
Исследование алгоритма VADнеобходимо осуществлять для фонограмм:
а) фонограмма, записанная при отсутствии фонового шума,
б) фонограмма, записанная при наличии фонового шума (работа вентилятора, пылесоса и др.).
Комментарии по оформлению отчета к лабораторной работе
При оформлении отчета для каждого этапа работы алгоритма необходимо привести:
1. скриншоты,
2. комментарии и выводы по полученным результатам.

Рис.5.1. Блок-схема алгоритма VAD
Исследование алгоритма vad в программе «Коррелограмма»
1) Открыть и загрузить файл фонограммы в программу «Коррелограмма» (см. раздел 2.3.2 Предварительный этап работы с программой «Коррелограмма»),
2) провести предварительную обработку фонограммы – ВЧ-фильтрацию (см. раздел 2.3.2 Предварительный этап работы с программой «Коррелограмма»),
3) сформировать из фонограммы новый сигнал Y(s), путем взятия модуля значений отсчетов фонограммы, для этого нажать на кнопку Вывод Y(s) (рис.5.2),
4) построить гистограмму распределения средних значений отсчетов сигнала на интервале оценивания Lоц, (рис.5.3),. Исследование алгоритма провести для трех значений параметра «каналов гистограммы» – 10,100, 1000. Результаты отобразить в отчете,
5) проверить обнаружения активности для сигнала Y(s) – кнопка VAD[Y(s)] (рис.5.4),
6) проверить обнаружение активности речевого сигнала для исходной фонограммы – кнопка VAD. Примечание проверку алгоритма осуществить для четырех значений пороговых коэффициентов 1, 3, 6, 10.

Рис.5.2. Осциллограмма сигналаY(s)

Рис.5.3. Гистограмма средних значений отсчетов

Рис.5.4. Обнаружение речевой активности для сигнала Y(s)

Рис.5.5. Обнаружение речевой активности для исходного речевого сигнала
Лабораторная работа №5. Исследование методов оценки основного тона речи
Цель работы: изучение методов оценки периода основного тона речи.
Методические указания к лабораторной работе
Перед выполнением лабораторной работы студенту необходимо ознакомиться с существующими методами обнаружения речевой активности в литературе по обработке речи (см. список рекомендованной литературы), а также использовать дополнительные источники информации (периодические издания, интернет).
Лабораторная работа выполняется на программах «Спектр» (4 версия) и «Коррелограмма».
1) С помощью программы требуется «Спектр» определить изменение частоты (периода) основного тона по фонограмме. По результатам исследования построить график зависимости периода основного тона речи от времени для исследуемой фонограммы (для построения необходимо иметь не менее 15-20 точек). Для этого необходимо определить частоты основного тона для нескольких интервалов спектрального анализа. За частоту основного тона принять частоту спектрального экстремума, имеющего максимальное значение в диапазоне до 450Гц (см. рис.6.1). Интервал анализа необходимо выбрать равным длине 6-12 периодов основного тона (длина определяется эмпирически по осциллограмме фонограммы).
2) С помощью программы «Коррелограмма» определить изменение периода основного тона речи, для этого:
а) построить коррелограмму для исследуемой фонограммы,
б) используя возможности программы, вывести график зависимости периода основного тона для исследуемого речевого сигнала (рис.6.2), в) в случае если оценка периода невозможна по причине «срыва» алгоритма оценки из-за «нестационарных участков» фонограммы, осуществить самостоятельное измерение периода, анализируя максимальные экстремумы выборочных корреляционных функций (рис.6.3). Построить график зависимости периода основного тона речи от времени (для построения необходимо иметь не менее 15-20 точек).
3) Сравнить полученные данные в 1) и во 2) пунктах. По результатам сравнения сделать выводы о точности определения частоты каждым из методов.

Рис.6.1. Определение частоты основного тона по амплитудному спектру фонограммы

Рис.6.2. Автоматическое определение изменения периода основного тона фонограммы «Береза» в программе «Коррелограмма»

Рис.6.3. Выборочная корреляционная функция слова «Барабан»
