- •Министерство образования и науки российской федерации
- •Оглавление
- •Список рисунков
- •Введение
- •Основы работы со средой математического моделирования МаtLab
- •История создания и развития системы MatLab
- •Интерфейс пользователя
- •Типы данных в системе MatLab
- •Переменные в системе MatLab
- •Арифметические и логические операции в системе MatLab
- •Массивы и матрицы в системе MatLab
- •Использование знака «:» и множественной индексации в системе MatLab
- •Операции над матрицами в системе MatLab
- •Встроенные функции в системе MatLab
- •Графические возможности системы MatLab
- •Изменение свойств линий и оформление графиков
- •Графики функций двух переменных
- •Вывод нескольких графиков на одни оси
- •Вывод нескольких графиков в одном графическом окне
- •Работа со звуковыми файлами в системе MatLab
- •Считывание данных из wav-файлов
- •Запись данных в wav-файл
- •Воспроизведение звуковых сигналов
- •Запись звуковых сигналов
- •Лабораторная работа №1. Исследование внутренней структуры речевого сигнала
- •Методические указания к лабораторной работе
- •Исследование структуры и временных характеристик речевых сигналов
- •Ручная сегментация исследуемой фонограммы
- •Определение фонетического состава сегментов исследуемого слова
- •Лабораторная работа №2. Исследование спектральных свойств речевого сигнала
- •Методические указания к лабораторной работе
- •Комментарии по оформлению отчета к лабораторной работе
- •Программа анализа спектров фонограмм «Спектр» (версия 4)
- •Назначение программы
- •Функциональные возможности программы
- •Лабораторная работа №3. Исследование корреляционных свойств речевого сигнала
- •Методические указания к лабораторной работе
- •Комментарии к оформлению отчета по лабораторной работе
- •Программа анализа корреляционных функций «Коррелограмма»
- •Назначение программы
- •Предварительный этап работы с фонограммой
- •Порядок работы в программе «Коррелограмма»
- •Дополнительные возможности по работе с программой
- •Лабораторная работа №4. Исследование vad-алгоритма
- •Методические указания к лабораторной работе
- •Комментарии по оформлению отчета к лабораторной работе
- •Исследование алгоритма vad в программе «Коррелограмма»
- •Лабораторная работа №5. Исследование методов оценки основного тона речи
- •Методические указания к лабораторной работе
- •Лабораторная работа №6. Моделирование алгоритмов обработки речи
- •Методические указания к лабораторной работе
- •Список индивидуальных заданий
- •Вопросы для самоподготовки
- •Лабораторная работа №1
- •Лабораторная работа №2
- •Лабораторная работа №3
- •Лабораторная работа №4
- •Лабораторная работа №5
- •Лабораторная работа №6 (Индивидуальные задания)
- •Список литературы
- •Приложение аСписок литературы и web-ресурсы по «Речевым технологиям» и среде математического моделирования «MatLab»
- •Список литературы по «Речевым технологиям»
- •Отечественная литература
- •Общетеоретические вопросы
- •Прикладная фонетика
- •Синтез речи
- •Психоакустика и физиология речи
- •Цифровая связь (телефония)
- •Зарубежная литература
- •Web – ресурсы
- •Список литературы по среде математического моделирования «MatLab»
- •Приложение б Современные направления научно-исследовательских работ кафедры «Бортовых радиоэлектронных систем в области разработки систем обработки речи
- •Основные области применения разрабатываемых алгоритмов
- •Многоуровневая временная сегментация речевых сигналов
- •Модификация фонограмм
Лабораторная работа №6. Моделирование алгоритмов обработки речи
Цель работы: исследования алгоритмов обработки речевых сигналов, используемых в системах связи.
Методические указания к лабораторной работе
Целью данной лабораторной работе является разработка и моделирование алгоритмов обработки речевых сигналов. Индивидуальное задание на разработку алгоритма необходимо получить у преподавателя. Список возможных заданий представлен ниже. В зависимости от сложности алгоритмической и программной реализации каждому заданию присвоен соответствующий уровень сложности.
Результатом выполнения лабораторной является программа, реализующая алгоритм обработки фонограммы, в системе MatLab.
Список индивидуальных заданий
Определение энергетического спектра речи (тестовой фонограммы) студента.
Разработать:
а) методику, алгоритм и программу оценки по фонограмме энергетического спектра речи,
б) провести оценку спектра речи по тестовым фонограммам.
Сложность - 1
Определение амплитудного спектра типичных сегментов тестовой фонограммы.
Использовать сегменты, соответствующие звукам – шумовым, взрывным, вокализованным.
Разработать:
а) методику, алгоритм и программу оценки по фонограмме амплитудного спектра речи,
б) провести оценку спектра речи по тестовым фонограммам.
Сложность - 1
Определение амплитудно-фазового (комплексного) спектра речи (тестовой фонограммы) студента.
Разработать:
а) методику, алгоритм и программу оценки по фонограмме амплитудно-фазового спектра речи для разных временных интервалов,
б) провести оценку спектра речи по тестовым фонограммам:
для отдельных слов,
для отдельных фраз,
для коротких временных сегментов, соответствующих характерным звукам.
Сложность - 1
Имитация алгоритма VAD
Разработать:
а) методику, алгоритм и программу определения временных границ для одной тестовой фонограммы (слова «Заказ»), базовое пороговое значение определяется оператором ЭВМ.
при наличии фонового шума (например, вентилятор ЭВМ),
при отсутствии фонового шума.
Сложность - 1
Разработать алгоритм и программу, реализующую блоковое спектральное оценивание тестовой фонограммы на интервале «квазистационарности» ~20мс.
Результат представляется в виде спектрограммы (сонограммы).
Сложность - 2
Корреляционная обработка речевого сигнала (тестовой фонограммы) студента.
Разработать: методику, алгоритм и программу корреляционной обработки фонограммы для разных временных интервалов:
Tк.об. << Tот ,
Tк.об. ≈Tот ,
Tк.об. ≈ 2-4 Tот.
Сложность - 3
«Разностная» обработка речевого сигнала (тестовой фонограммы) студента.
Разработать:
а) Нормированный модуль разности:
Fразн=sum(abs(v1-v2))/a, где v1-эталонный вектор, v2- текущий вектор
б) методику, алгоритм и программу корреляционной обработки фонограммы для разных временных интервалов:
Tр.об. << Tот ,
Tр.об. ≈Tот ,
Tр.об. ≈ 2-4 Tот.
Сложность – 3
Разработать алгоритм и программу А-компандирования и экспандирования.
а) разработать методику оценки ошибок А-компандирования,
б) провести оценку ошибок А-компандирования (объективную и субъективную).
Сложность – 3
Разработать алгоритм и программу Мю-компандирования и экспандирования.
а) разработать методику оценки ошибок Мю-компандирования,
б) провести оценку ошибок Мю-компандирования (объективную и субъективную).
Сложность – 3
Разработать алгоритм очистки (фильтрации) фонограммы от НЧ-наводки (частота сетевой наводки ~ 50Гц).
Разработать методику, алгоритм и программу предварительной очистки фонограммы от НЧ-наводки.
Сложность – 3
Разработать алгоритм и программу, реализующую преобразование ИКМ в ДИКМ (первого порядка).
а) разработать методику оценки степени сжатия,
б) провести оценку степени сжатия для ДИКМ первого порядка.
Сложность – 3
Разработать алгоритм и программу, реализующую преобразование ИКМ в ДИКМ (второго порядка).
а) разработать методику оценки степени сжатия,
б) провести оценку степени сжатия для ДИКМ второго порядка.
Сложность – 3
Разработать алгоритм и программу, реализующую преобразование ИКМ в ДИКМ (третьего порядка).
а) разработать методику оценки степени сжатия,
б) провести оценку степени сжатия для ДИКМ третьего порядка.
Сложность – 3
Разработать алгоритм и программу, реализующую оценку распределения модуля мгновенных значений фонограммы.
Разработать:
а) методику, алгоритм и программу оценки по фонограмме распределения модуля мгновенных значений фонограммы,
б) алгоритм определения моды распределения.
Сложность – 3
Разработать алгоритм и программу, реализующую спектральное разделение тестовой фонограммы на две области НЧ (Fоти гармоникиFот) и ВЧ (формантную).
Сложность – 3
Разработать алгоритм и программу, реализующую временное прореживание тестовой фонограммы при Fд = 44100Гц.
Коэффициенты прореживания – Kof_pr = 2, 4, 5,
Разработать вариант алгоритма при Kof_pr =1.5.
Сложность – 3
Исследовать влияние жесткого и мягкого ограничения на разборчивость речи.
а) разработать несколько удобных зависимостей с «мягким» ограничением и «клиппирующих» зависимостей,
б) разработать программу по обработке фонограммы,
в) проанализировать разборчивость речи для разных вариантов нелинейного преобразования.
Сложность – 3
Оценка влияния частоты временной дискретизации на качество фонограммы. Исследуется ошибка записи фонограммы для различных частот дискретизации
Разработать:
а) методику, алгоритм и программу по формированию из исходной фонограммы с заданной частотой дискретизации,
б) разработать методику оценки ошибок А/Ц-преобразования как функцию частоты дискретизации,
в) провести оценку ошибок записи фонограммы (объективную и субъективную).
Сложность – 3
Оценка влияния разрядности амплитудного квантования на качество фонограммы. Исследуется ошибка записи фонограммы для разных вариантов разрядность квантования.
Разработать:
а) методику, алгоритм и программу по формированию из исходной фонограммы фонограмму с заданной разрядностью квантования,
б) разработать методику оценки ошибок А/Ц-преобразования как функцию разрядности квантования,
в) провести оценку ошибок записи фонограммы (объективную и субъективную).
Сложность – 3
Разработать алгоритм и программу, реализующую оценку распределения «огибающей» отсчетов фонограммы.
Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм). Оценить зависимость выборочных распределений от интервала анализа.
Сложность – 4
Разработать алгоритм и программу, реализующую обнаружение речевой активности /алгоритм VAD/.
Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм).
Сложность – 5
Разработать алгоритм и программу, реализующую разделение сегментов фонограммы на «вокализованные-невокализованные».
Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм).
Сложность – 5
Разработать алгоритм и программу, реализующую оценивание периода основного тона.
Провести тестирование алгоритма на реальных фонограммах (по базе созданных кратковременных фонограмм).
Сложность – 5
Экспериментальное определение частоты ОТ (основного тона). Исследовать распределение частоты ОТ для мужчин и для женщин; однополая выборка должна составлять не менее 5 человек, построить экспериментальную зависимость; сравнить с теоретическими данными (см. Список литературы).
Сложность – 3
Определение частоты ОТ (основного тона) методом HPS(HarmonicProductSpectrum).
Сложность – 4
