- •Краткие теоретические сведения
- •Частотно-временное представление речевого сигнала с помощью Фурье и вейвлет-преобразований
- •Методы представления речевого сигнала на основе кепстрального анализа и кодирования с линейным предсказанием
- •Методы формирования наборов признаков для распознавания речевых единиц
- •Содержание отчета
- •Лабораторная робота №2
- •Порядок выполнения работы
- •Оформить отчет по лабораторной работе. Краткие теоретические сведения
- •Содержание отчета
- •Лабораторная робота №3
- •Порядок выполнения работы
- •Оформить отчет по лабораторной работе. Краткие теоретические сведения Гауссовы смешанные модели (gmm)
- •Нейросетовой подход для решения задачи распознавания речи
- •Содержание отчета
- •Лабораторная робота №4
- •Порядок выполнения работы
- •Оформить отчет по лабораторной работе. Краткие теоретические сведения
- •Содержание отчета
Методы формирования наборов признаков для распознавания речевых единиц
Чтобы получить вектора признаков для дискретного сигнала x(n) (0 n N-1), он разбивается на фреймы длиной N. Длина фрейма для анализа РС выбирается с учетом периода основного тона и согласно составляет около 20 мс.
Для
классификации звуков на основе на каждом
m-ом
фрейме РС формируются наборы векторов
признаков
.
Наиболее используемые признаки для
распознавания РС сведем в результирующую
таблицу 1.2:
Таблица 1.2 – Наборы признаков, используемых для распознавания звуков речи
№ |
На основе спектра Фурье (N – ширина окна анализа) |
|
1 |
Энергия спектра |
|
2 |
нормированный энергетический спектр |
|
3 |
кумулятивное отношение |
|
На основе вейвлет-спектра (jmin, jmax, – минимальный и максимальный уровни разложения, N – длина сигнала) |
||
4 |
мера контрастности |
|
На основе кепстрального анализа |
||
5 |
коэффициенты кепстра |
где: N – ширина окна анализа, Х – коэффициент спектра Фурье
|
6 |
мел-частотные кепстральные коэффициенты (MFCC) |
где: L – количество мел-полос, w(k) – оконная функция Бартлета,
|
На основе КЛП |
||
7 |
коэффициенты предсказателя порядка p |
|
8 |
нормированная автокорреляция сигнала |
|
9 |
коэффициенты отражения КЛП |
|
10 |
площади поперечных сечений акустической трубы |
|
11 |
нормированная автокорреляция КЛП |
|
12 |
нормированный сглаженный энергетический спектр КЛП |
|
13 |
кепстр импульсной характеристики |
|
Компоненты вектора признаков сегмента РС получаются усреднением соответствующих компонент векторов признаков по всем фреймам, входящим в сегмент РС.
Содержание отчета
Отчет должен содержать:
Постановку задачи.
Экранные формы, демонстрирующие результаты работы программы.
Выводы. В выводах необходимо оценить сглаженность нормированного сглаженного энергетического спектра КЛП при р=50 и р=100, проанализировать, при использовании какого из наборов признаков и для какой пары фонетических классов наилучшая разделимость, привести экранную форму окна визуального анализа эффективности признаков на соответствующей паре классов.
Листинг программы.
Приложение к отчету – файл с базой данных, содержащей обучающую выборку для дальнейшего распознавания.

(представляет
собой скалярную величину)
,
,
,
E
- полная энергия сигнала
,
,
,
,
,
– границы
l-той
полосы,
– четное число.
,
,
,
,
A1=1,
,
,
,
,
,