
- •Факультет «Информатика и системы управления»
- •Лабораторная работа
- •Оценка качества речи, передаваемой по каналу gsm
- •Содержание
- •Задание
- •Теоретическая часть Введение
- •Субъективная оценка качества речи
- •АлгоритмPesq
- •ОсновыPesq
- •Предпроцесс временного и уровневого выравнивания Вычисление общего усиления системы.
- •Irs фильтрация (Intermediate Reference System)
- •Временное выравнивание
- •Кадровая коррекция
- •Точная временная коррекция
- •Разделение выражений
- •Натуральная рекоррекция
- •Коэффициент усиления громкости
- •Irs-приемная фильтрация
- •Вычисление активных интервалов речи.
- •Короткое быстрое преобразование Фурье
- •Расчет уровней плотностей мощности
- •Частичная компенсация исходного уровня плотности частоты для уравновешивания функции преобразования.
- •Частичная компенсация преобразованного уровня плотности мощности для непостоянных во времени вариаций усиления между исходным и кодированным сигналами.
- •Расчет плотностей громкости
- •Расчет плотности возмущения
- •Кадрово–ориентированное умножение с асимметричным фактором
- •Группировка плотности ошибок по частоте и фазе на тихих частях исходного сигнала
- •Обнуление возмущений кадров, в ходе которого значительно уменьшаются задержки
- •Рекоррекция неудачных интервалов
- •Группировка ошибки по вторичным интервалам
- •Часть 2.
- •Варианты заданий
Предпроцесс временного и уровневого выравнивания Вычисление общего усиления системы.
Характеристики системы не определены однозначно и могут сильно меняться. Кроме того, не имеется никакого единственного уровня, в котором сигнал будет сохранен. Таким образом, очень важно выровнять уровни исходного X(t)и кодированногоY(t)сигналов по мощности. Уровень слышимости вPESQпринят равным 79 дб. Алгоритм выравнивания вPESQработает следующим образом:
Обрабатываются заранее отфильтрованные исходный и кодированный сигналы. Фильтр блокирует компоненты до 250 Гц, пассивен до 2000 Гц, и имеет резко уменьшающуюся пропускную характеристику проходя через следующие точки: {2000 Гц, 0 дб}, {2500 Гц, –5 дб }, {3000 Гц,10 дб}, {3150 Гц,20 дб}, {3500 Гц, –50 дб}, {4000 Гц и выше,500 дб}. Отфильтрованные сигналы используются только для подсчета усиления системы.
Подсчитываются квадраты средних величин выборок исходного речевого сигнала и кодированного сигнала.
Вычисляются коэффициенты усиления и применяются для выравнивания как исходного X(t), так и кодированногоY(t) речевых сигналов к одному уровню. Полученные сигналы обозначаютсяXS(t) иYS(t).
Irs фильтрация (Intermediate Reference System)
Допускается, что при проведении прослушивающих тестов (субъективной оценки) используются IRSприемные или модифицированныеIRSприемные характеристики в телефонной трубке. Познавательная модель оценки человеком качества речи должна речи должна учитывать это для моделирования сигналов, которые фактически слышны субъектам.
В PESQэто осуществляется с помощью быстрого преобразование Фурье по длине файла, с фильтрацией в частотной области фильтром с кусочно-линейной характеристикой схожей с приемной характеристикойIRS, после чего следует обратное быстрое преобразование Фурье по всей длине речевого файла. Результатом этого процесса являются отфильтрованныеXIRSS(t)иYIRSS(t)масштабированных входного и выходного сигналовXS(t) иYS(t). ОдиночныйIRS-подобный приемный фильтр используется вPESQнезависимо от того, использовалась лиIRSили модифицированнаяIRSфильтрация в реальном субъективном эксперименте. Причина такого приближения заключается в том, что в большинстве случаев точное фильтрование не является известным, и если даже фильтр близок по характеристикам к идеальному, то восприятие сигнала человеком не изучено до конца. Следовательно, использование реальных методов не влияет на фильтрацию самого сигнала.
IRS-фильтрованные сигналы используются как для процедур временного выравнивания, так и для построения натуральных моделей.
Временное выравнивание
Процедуры временной коррекции формируют натуральную модель по величинам временных задержек, чтобы дать возможность сравнивать части исходного и кодированного сигналов. Процесс коррекции включает в себя несколько стадий:
процесс оценки задержек исходного и ухудшенного сигналов, полученные на основе построения огибающих;
разделение сигнала на несколько субсекций, так называемых выражений;
определение задержек выражений;
точная корреляционная идентификация задержки с ближайшим по характеристикам экземпляром;
разделение выражений и рекоррекция временных интервалов для изучения изменений задержек в ходе речи;
после составления натуральной модели, идентификация и рекоррекция блоков ошибок для поиска ошибок выравнивания.