Группировка плотности ошибок по частоте и фазе на тихих частях исходного сигнала

Плотность возмущения D(f)_nи асимметричная плотность возмущенияDA(f)_nинтегрированы по оси частот с использованием двух разных нормLp и весовых коэффициентов по кадрам:

где M_n– коэффициент умножения,1/ (мощность исходного кадра + константа)^0,04результирующая в фазу ошибок, которые возникают в течение периодов тишины в исходном речевом файле, аW_f- серия констант, пропорциональных ширине модифицированных Барк отсчетов. После этих умножений, значения ошибок в кадрах лимитированы числом 45. Эти сгруппированные значения,D_n, иDA_n, так называемые ошибки кадров.

Обнуление возмущений кадров, в ходе которого значительно уменьшаются задержки

Если кодированный сигнал содержит уменьшение задержки большее, чем 16 мс (половина окна), производится модификация, описанная выше (в пункте «Короткое быстрое преобразование Фурье»). Целесообразно игнорировать кадровые возмущения в таких случаях в ходе объективной (автоматической) оценки качества речи. Как следствие, кадровые возмущения в таких случаях обнуляются. Результирующие кадровые возмущения обозначаются D'_nиDA'_n^.

Рекоррекция неудачных интервалов

Следующие друг за другом кадры с возмущением кадра, большей чем порог, называют неудачными интервалами. В редких случаях реальные измерения предсказывают большие искажения при минимальном количество плохих кадров из-за неправильных временных задержек, полученных на этапе предварительной обработки. Для подобных, так называемых неудачных, интервалов оценивается новое значение задержки с помощью максимизации корреляции между исходным и кодированным сигналами, подстроенной под задержки, которые получены на предобработке. Когда максимальная корреляция меньше порога, делается заключение, что интервал удовлетворяет условиям, и его больше не считают неудачным, и обработка по интервалу прекращается. В других случаях кадровое возмущение в неудачных интервалах пересчитывается и, если она меньше, заменяет исходное кадровое возмущение. Результат заключен в итоговых кадровых возмущениях D''_nandDA''_n, которые используются для расчетов качества.

Группировка ошибки по вторичным интервалам

Вслед за этим значения возмущения кадра и асимметричные значения возмущения кадра группируются по разделенным вторичным интервалам из 20 кадров (перекрытие примерно 320 мс) используя L₆нормы, высшееp значение как группировка по длине файла речи. Эти интервалы также перекрываются на 50% и не используются кадровая функция.

Группировка ошибки по длительности речевого файла (около 10 с), включая фактор повторяемости

Возмущения в доли секунды и асимметричные значения возмущения в доли секунды группируются по активному интервалу речи (корреспондирующие кадры) с использованием L₂норм. Большее значениеp используется для группировки интервалов доли секунды по сравнению с меньшим значениемp группировки по файлу речи. Это связано с тем фактом, что при искажении вторичных интервалов они теряют смысл, в то время как, если первое предложение искажено, качество остальных неизменно.

ОценкаPESQ

Конечная оценка PESQ– это линейная комбинация среднего значения ошибки и среднего значения асимметричного возмущения. Диапазон оценкиPESQот –0.5 до 4.5. Для большинства случаев эти значения лежат в пределах 1.0 до 4.5.

Рис. 1.2 Процедура юстировки, используемой в PESQ, для определения задержки на каждом временном интервале

Рис. 1.3 Обзор ядра натуральной модели

Рис. 1.4 Получения конечной оценки PESQ

Практическая часть

Часть 1.

В соответствии с выбранным вариантом задания из тестовых таблиц создать звуковые файлы *.wavдля каждого слова.
Используя программную модель системы GSM900/1800 получить звуковые файлы *.wv2 для каждого тестового слова. Установить значения вероятности ошибки от 0 до 10%. Для того, чтобы при работе программной модели с вероятностями ошибок более 2-3% компьютер не подвисал, необходимо заменить исходную библиотекуsvertka.dllдинамической библиотекой, взятой из папки SverkaQuickly, в которой ограничена глубина просмотра циклического кода
Обработать полученные результаты в программной модели PESQ. Для этого необходимо сменить расширение *.wv2 на *.wavи указать пути к исходному и кодированному файлу. Причем в первой строчке указывается исходный файл. Получить оценкуPESQ.
Прослушать звуковые файлы, полученные на выходе кодека и сравнить акустическое качество речи с оценкой PESQ.
Построить графики зависимости оценки PESQот вероятности ошибки в канале.
Сделать выводы

<<< < Предыдущая 1 2 3 4 5 67 / 87 8 > Следующая >>>

Соседние файлы в папке Лабораторная работа 2

#
10.02.2015367.1 Кб24P862E (PESQ).doc
#
10.02.2015733.7 Кб32Методичка.doc