Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Руководство к лаб.работам_ver3f.doc
Скачиваний:
182
Добавлен:
14.03.2016
Размер:
5.56 Mб
Скачать
  1. Лабораторная работа №4. Исследование vad-алгоритма

Цель работы: изучение методов обнаружения речевой активности.

    1. Методические указания к лабораторной работе

Перед выполнением лабораторной работы студенту необходимо ознакомиться с существующими методами обнаружения речевой активности в литературе по обработке речи (см. список рекомендованной литературы), а также использовать дополнительные источники информации (периодические издания, интернет).

Для большинства алгоритмов обработки речевых сигналов необходимым в первую очередь является определение речевой компоненты (активности) во входном речевом сигнале. Существует несколько вариантов построения алгоритмов VAD (Voice Activity Detection). В зависимости от задач обработки решение о речевой активности может приниматься с задержкой во времени или без нее. Возможно усложнение алгоритма VAD с целью расширения его возможностей, например, введение классификации типов сегментов речи.

В данной лабораторной работе студенту предлагается ознакомиться с метод обнаружения речевой активности (VAD-алгоритмы) реализованным в программе «Коррелограмма».

Блок-схема алгоритма обнаружения речевой активности показана на рис.5.1.

Исследование алгоритма VADнеобходимо осуществлять для фонограмм:

а) фонограмма, записанная при отсутствии фонового шума,

б) фонограмма, записанная при наличии фонового шума (работа вентилятора, пылесоса и др.).

    1. Комментарии по оформлению отчета к лабораторной работе

При оформлении отчета для каждого этапа работы алгоритма необходимо привести:

1. скриншоты,

2. комментарии и выводы по полученным результатам.

Рис.5.1. Блок-схема алгоритма VAD

    1. Исследование алгоритма vad в программе «Коррелограмма»

1) Открыть и загрузить файл фонограммы в программу «Коррелограмма» (см. раздел 2.3.2 Предварительный этап работы с программой «Коррелограмма»),

2) провести предварительную обработку фонограммы – ВЧ-фильтрацию (см. раздел 2.3.2 Предварительный этап работы с программой «Коррелограмма»),

3) сформировать из фонограммы новый сигнал Y(s), путем взятия модуля значений отсчетов фонограммы, для этого нажать на кнопку Вывод Y(s) (рис.5.2),

4) построить гистограмму распределения средних значений отсчетов сигнала на интервале оценивания Lоц, (рис.5.3),. Исследование алгоритма провести для трех значений параметра «каналов гистограммы» – 10,100, 1000. Результаты отобразить в отчете,

5) проверить обнаружения активности для сигнала Y(s) – кнопка VAD[Y(s)] (рис.5.4),

6) проверить обнаружение активности речевого сигнала для исходной фонограммы – кнопка VAD. Примечание проверку алгоритма осуществить для четырех значений пороговых коэффициентов 1, 3, 6, 10.

Рис.5.2. Осциллограмма сигналаY(s)

Рис.5.3. Гистограмма средних значений отсчетов

Рис.5.4. Обнаружение речевой активности для сигнала Y(s)

Рис.5.5. Обнаружение речевой активности для исходного речевого сигнала

  1. Лабораторная работа №5. Исследование методов оценки основного тона речи

Цель работы: изучение методов оценки периода основного тона речи.

    1. Методические указания к лабораторной работе

Перед выполнением лабораторной работы студенту необходимо ознакомиться с существующими методами обнаружения речевой активности в литературе по обработке речи (см. список рекомендованной литературы), а также использовать дополнительные источники информации (периодические издания, интернет).

Лабораторная работа выполняется на программах «Спектр» (4 версия) и «Коррелограмма».

1) С помощью программы требуется «Спектр» определить изменение частоты (периода) основного тона по фонограмме. По результатам исследования построить график зависимости периода основного тона речи от времени для исследуемой фонограммы (для построения необходимо иметь не менее 15-20 точек). Для этого необходимо определить частоты основного тона для нескольких интервалов спектрального анализа. За частоту основного тона принять частоту спектрального экстремума, имеющего максимальное значение в диапазоне до 450Гц (см. рис.6.1). Интервал анализа необходимо выбрать равным длине 6-12 периодов основного тона (длина определяется эмпирически по осциллограмме фонограммы).

2) С помощью программы «Коррелограмма» определить изменение периода основного тона речи, для этого:

а) построить коррелограмму для исследуемой фонограммы,

б) используя возможности программы, вывести график зависимости периода основного тона для исследуемого речевого сигнала (рис.6.2), в) в случае если оценка периода невозможна по причине «срыва» алгоритма оценки из-за «нестационарных участков» фонограммы, осуществить самостоятельное измерение периода, анализируя максимальные экстремумы выборочных корреляционных функций (рис.6.3). Построить график зависимости периода основного тона речи от времени (для построения необходимо иметь не менее 15-20 точек).

3) Сравнить полученные данные в 1) и во 2) пунктах. По результатам сравнения сделать выводы о точности определения частоты каждым из методов.

Рис.6.1. Определение частоты основного тона по амплитудному спектру фонограммы

Рис.6.2. Автоматическое определение изменения периода основного тона фонограммы «Береза» в программе «Коррелограмма»

Рис.6.3. Выборочная корреляционная функция слова «Барабан»

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]