Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Laboratornye_Raboty.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
571.57 Кб
Скачать

Методы формирования наборов признаков для распознавания речевых единиц

Чтобы получить вектора признаков для дискретного сигнала x(n) (0 nN-1), он разбивается на фреймы длиной N. Длина фрейма для анализа РС выбирается с учетом периода основного тона и согласно составляет около 20 мс.

Для классификации звуков на основе на каждом m-ом фрейме РС формируются наборы векторов признаков . Наиболее используемые признаки для распознавания РС сведем в результирующую таблицу 1.2:

Таблица 1.2 – Наборы признаков, используемых для распознавания звуков речи

На основе спектра Фурье (N – ширина окна анализа)

1

Энергия спектра

(представляет собой скалярную величину)

2

нормированный энергетический спектр

3

кумулятивное отношение

, ,

, E - полная энергия сигнала

На основе вейвлет-спектра (jmin, jmax, – минимальный и максимальный уровни разложения, N – длина сигнала)

4

мера контрастности

,

На основе кепстрального анализа

5

коэффициенты

кепстра

, ,

где: N – ширина окна анализа, Х – коэффициент спектра Фурье

6

мел-частотные кепстральные коэффициенты (MFCC)

, ,

где: L – количество мел-полос, w(k) – оконная функция Бартлета,

– границы l-той полосы, – четное число.

На основе КЛП

7

коэффициенты предсказателя

порядка p

,

8

нормированная автокорреляция

сигнала

,

9

коэффициенты

отражения КЛП

,

10

площади поперечных сечений акустической трубы

, A1=1,

11

нормированная автокорреляция КЛП

,

12

нормированный сглаженный энергетический спектр КЛП

, ,

13

кепстр импульсной характеристики

, ,

Компоненты вектора признаков сегмента РС получаются усреднением соответствующих компонент векторов признаков по всем фреймам, входящим в сегмент РС.

Содержание отчета

Отчет должен содержать:

  1. Постановку задачи.

  2. Экранные формы, демонстрирующие результаты работы программы.

  3. Выводы. В выводах необходимо оценить сглаженность нормированного сглаженного энергетического спектра КЛП при р=50 и р=100, проанализировать, при использовании какого из наборов признаков и для какой пары фонетических классов наилучшая разделимость, привести экранную форму окна визуального анализа эффективности признаков на соответствующей паре классов.

  4. Листинг программы.

  5. Приложение к отчету – файл с базой данных, содержащей обучающую выборку для дальнейшего распознавания.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]