Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
32
Добавлен:
10.02.2015
Размер:
733.7 Кб
Скачать

Предпроцесс временного и уровневого выравнивания Вычисление общего усиления системы.

Характеристики системы не определены однозначно и могут сильно меняться. Кроме того, не имеется никакого единственного уровня, в котором сигнал будет сохранен. Таким образом, очень важно выровнять уровни исходного X(t)и кодированногоY(t)сигналов по мощности. Уровень слышимости вPESQпринят равным 79 дб. Алгоритм выравнивания вPESQработает следующим образом:

Обрабатываются заранее отфильтрованные исходный и кодированный сигналы. Фильтр блокирует компоненты до 250 Гц, пассивен до 2000 Гц, и имеет резко уменьшающуюся пропускную характеристику проходя через следующие точки: {2000 Гц, 0 дб}, {2500 Гц, –5 дб }, {3000 Гц,10 дб}, {3150 Гц,20 дб}, {3500 Гц, –50 дб}, {4000 Гц и выше,500 дб}. Отфильтрованные сигналы используются только для подсчета усиления системы.

Подсчитываются квадраты средних величин выборок исходного речевого сигнала и кодированного сигнала.

Вычисляются коэффициенты усиления и применяются для выравнивания как исходного X(t), так и кодированногоY(t) речевых сигналов к одному уровню. Полученные сигналы обозначаютсяXS(t) иYS(t).

Irs фильтрация (Intermediate Reference System)

Допускается, что при проведении прослушивающих тестов (субъективной оценки) используются IRSприемные или модифицированныеIRSприемные характеристики в телефонной трубке. Познавательная модель оценки человеком качества речи должна речи должна учитывать это для моделирования сигналов, которые фактически слышны субъектам.

В PESQэто осуществляется с помощью быстрого преобразование Фурье по длине файла, с фильтрацией в частотной области фильтром с кусочно-линейной характеристикой схожей с приемной характеристикойIRS, после чего следует обратное быстрое преобразование Фурье по всей длине речевого файла. Результатом этого процесса являются отфильтрованныеXIRSS(t)иYIRSS(t)масштабированных входного и выходного сигналовXS(t) иYS(t). ОдиночныйIRS-подобный приемный фильтр используется вPESQнезависимо от того, использовалась лиIRSили модифицированнаяIRSфильтрация в реальном субъективном эксперименте. Причина такого приближения заключается в том, что в большинстве случаев точное фильтрование не является известным, и если даже фильтр близок по характеристикам к идеальному, то восприятие сигнала человеком не изучено до конца. Следовательно, использование реальных методов не влияет на фильтрацию самого сигнала.

IRS-фильтрованные сигналы используются как для процедур временного выравнивания, так и для построения натуральных моделей.

Временное выравнивание

Процедуры временной коррекции формируют натуральную модель по величинам временных задержек, чтобы дать возможность сравнивать части исходного и кодированного сигналов. Процесс коррекции включает в себя несколько стадий:

  • процесс оценки задержек исходного и ухудшенного сигналов, полученные на основе построения огибающих;

  • разделение сигнала на несколько субсекций, так называемых выражений;

  • определение задержек выражений;

  • точная корреляционная идентификация задержки с ближайшим по характеристикам экземпляром;

  • разделение выражений и рекоррекция временных интервалов для изучения изменений задержек в ходе речи;

  • после составления натуральной модели, идентификация и рекоррекция блоков ошибок для поиска ошибок выравнивания.

Соседние файлы в папке Лабораторная работа 2