Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Руководство к лаб.работам_ver3f.doc
Скачиваний:
182
Добавлен:
14.03.2016
Размер:
5.56 Mб
Скачать
  1. Лабораторная работа №6. Моделирование алгоритмов обработки речи

Цель работы: исследования алгоритмов обработки речевых сигналов, используемых в системах связи.

    1. Методические указания к лабораторной работе

Целью данной лабораторной работе является разработка и моделирование алгоритмов обработки речевых сигналов. Индивидуальное задание на разработку алгоритма необходимо получить у преподавателя. Список возможных заданий представлен ниже. В зависимости от сложности алгоритмической и программной реализации каждому заданию присвоен соответствующий уровень сложности.

Результатом выполнения лабораторной является программа, реализующая алгоритм обработки фонограммы, в системе MatLab.

    1. Список индивидуальных заданий

Определение энергетического спектра речи (тестовой фонограммы) студента.

Разработать:

а) методику, алгоритм и программу оценки по фонограмме энергетического спектра речи,

б) провести оценку спектра речи по тестовым фонограммам.

Сложность - 1

Определение амплитудного спектра типичных сегментов тестовой фонограммы.

Использовать сегменты, соответствующие звукам – шумовым, взрывным, вокализованным.

Разработать:

а) методику, алгоритм и программу оценки по фонограмме амплитудного спектра речи,

б) провести оценку спектра речи по тестовым фонограммам.

Сложность - 1

Определение амплитудно-фазового (комплексного) спектра речи (тестовой фонограммы) студента.

Разработать:

а) методику, алгоритм и программу оценки по фонограмме амплитудно-фазового спектра речи для разных временных интервалов,

б) провести оценку спектра речи по тестовым фонограммам:

  • для отдельных слов,

  • для отдельных фраз,

  • для коротких временных сегментов, соответствующих характерным звукам.

Сложность - 1

Имитация алгоритма VAD

Разработать:

а) методику, алгоритм и программу определения временных границ для одной тестовой фонограммы (слова «Заказ»), базовое пороговое значение определяется оператором ЭВМ.

  • при наличии фонового шума (например, вентилятор ЭВМ),

  • при отсутствии фонового шума.

Сложность - 1

Разработать алгоритм и программу, реализующую блоковое спектральное оценивание тестовой фонограммы на интервале «квазистационарности» ~20мс.

Результат представляется в виде спектрограммы (сонограммы).

Сложность - 2

Корреляционная обработка речевого сигнала (тестовой фонограммы) студента.

Разработать: методику, алгоритм и программу корреляционной обработки фонограммы для разных временных интервалов:

  • Tк.об. << Tот ,

  • Tк.об. ≈Tот ,

  • Tк.об. ≈ 2-4 Tот.

Сложность - 3

«Разностная» обработка речевого сигнала (тестовой фонограммы) студента.

Разработать:

а) Нормированный модуль разности:

Fразн=sum(abs(v1-v2))/a, где v1-эталонный вектор, v2- текущий вектор

б) методику, алгоритм и программу корреляционной обработки фонограммы для разных временных интервалов:

  • Tр.об. << Tот ,

  • Tр.об. ≈Tот ,

  • Tр.об. ≈ 2-4 Tот.

Сложность – 3

Разработать алгоритм и программу А-компандирования и экспандирования.

а) разработать методику оценки ошибок А-компандирования,

б) провести оценку ошибок А-компандирования (объективную и субъективную).

Сложность – 3

Разработать алгоритм и программу Мю-компандирования и экспандирования.

а) разработать методику оценки ошибок Мю-компандирования,

б) провести оценку ошибок Мю-компандирования (объективную и субъективную).

Сложность – 3

Разработать алгоритм очистки (фильтрации) фонограммы от НЧ-наводки (частота сетевой наводки ~ 50Гц).

Разработать методику, алгоритм и программу предварительной очистки фонограммы от НЧ-наводки.

Сложность – 3

Разработать алгоритм и программу, реализующую преобразование ИКМ в ДИКМ (первого порядка).

а) разработать методику оценки степени сжатия,

б) провести оценку степени сжатия для ДИКМ первого порядка.

Сложность – 3

Разработать алгоритм и программу, реализующую преобразование ИКМ в ДИКМ (второго порядка).

а) разработать методику оценки степени сжатия,

б) провести оценку степени сжатия для ДИКМ второго порядка.

Сложность – 3

Разработать алгоритм и программу, реализующую преобразование ИКМ в ДИКМ (третьего порядка).

а) разработать методику оценки степени сжатия,

б) провести оценку степени сжатия для ДИКМ третьего порядка.

Сложность – 3

Разработать алгоритм и программу, реализующую оценку распределения модуля мгновенных значений фонограммы.

Разработать:

а) методику, алгоритм и программу оценки по фонограмме распределения модуля мгновенных значений фонограммы,

б) алгоритм определения моды распределения.

Сложность – 3

Разработать алгоритм и программу, реализующую спектральное разделение тестовой фонограммы на две области НЧ (Fоти гармоникиFот) и ВЧ (формантную).

Сложность – 3

Разработать алгоритм и программу, реализующую временное прореживание тестовой фонограммы при Fд = 44100Гц.

Коэффициенты прореживания – Kof_pr = 2, 4, 5,

Разработать вариант алгоритма при Kof_pr =1.5.

Сложность – 3

Исследовать влияние жесткого и мягкого ограничения на разборчивость речи.

а) разработать несколько удобных зависимостей с «мягким» ограничением и «клиппирующих» зависимостей,

б) разработать программу по обработке фонограммы,

в) проанализировать разборчивость речи для разных вариантов нелинейного преобразования.

Сложность – 3

Оценка влияния частоты временной дискретизации на качество фонограммы. Исследуется ошибка записи фонограммы для различных частот дискретизации

Разработать:

а) методику, алгоритм и программу по формированию из исходной фонограммы с заданной частотой дискретизации,

б) разработать методику оценки ошибок А/Ц-преобразования как функцию частоты дискретизации,

в) провести оценку ошибок записи фонограммы (объективную и субъективную).

Сложность – 3

Оценка влияния разрядности амплитудного квантования на качество фонограммы. Исследуется ошибка записи фонограммы для разных вариантов разрядность квантования.

Разработать:

а) методику, алгоритм и программу по формированию из исходной фонограммы фонограмму с заданной разрядностью квантования,

б) разработать методику оценки ошибок А/Ц-преобразования как функцию разрядности квантования,

в) провести оценку ошибок записи фонограммы (объективную и субъективную).

Сложность – 3

Разработать алгоритм и программу, реализующую оценку распределения «огибающей» отсчетов фонограммы.

Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм). Оценить зависимость выборочных распределений от интервала анализа.

Сложность – 4

Разработать алгоритм и программу, реализующую обнаружение речевой активности /алгоритм VAD/.

Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм).

Сложность – 5

Разработать алгоритм и программу, реализующую разделение сегментов фонограммы на «вокализованные-невокализованные».

Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм).

Сложность – 5

Разработать алгоритм и программу, реализующую оценивание периода основного тона.

Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм).

Сложность – 5

Экспериментальное определение частоты ОТ (основного тона). Исследовать распределение частоты ОТ для мужчин и для женщин; однополая выборка должна составлять не менее 5 человек, построить экспериментальную зависимость; сравнить с теоретическими данными (см. Список литературы).

Сложность – 3

Определение частоты ОТ (основного тона) методом HPS(HarmonicProductSpectrum).

Сложность – 4

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]