
- •Факультет «Информатика и системы управления»
- •Лабораторная работа
- •Оценка качества речи, передаваемой по каналу gsm
- •Содержание
- •Задание
- •Теоретическая часть Введение
- •Субъективная оценка качества речи
- •АлгоритмPesq
- •ОсновыPesq
- •Предпроцесс временного и уровневого выравнивания Вычисление общего усиления системы.
- •Irs фильтрация (Intermediate Reference System)
- •Временное выравнивание
- •Кадровая коррекция
- •Точная временная коррекция
- •Разделение выражений
- •Натуральная рекоррекция
- •Коэффициент усиления громкости
- •Irs-приемная фильтрация
- •Вычисление активных интервалов речи.
- •Короткое быстрое преобразование Фурье
- •Расчет уровней плотностей мощности
- •Частичная компенсация исходного уровня плотности частоты для уравновешивания функции преобразования.
- •Частичная компенсация преобразованного уровня плотности мощности для непостоянных во времени вариаций усиления между исходным и кодированным сигналами.
- •Расчет плотностей громкости
- •Расчет плотности возмущения
- •Кадрово–ориентированное умножение с асимметричным фактором
- •Группировка плотности ошибок по частоте и фазе на тихих частях исходного сигнала
- •Обнуление возмущений кадров, в ходе которого значительно уменьшаются задержки
- •Рекоррекция неудачных интервалов
- •Группировка ошибки по вторичным интервалам
- •Часть 2.
- •Варианты заданий
Группировка плотности ошибок по частоте и фазе на тихих частях исходного сигнала
Плотность возмущения D(f)n и асимметричная плотность возмущенияDA(f)n интегрированы по оси частот с использованием двух разных нормLp и весовых коэффициентов по кадрам:
где Mn – коэффициент умножения,1/ (мощность исходного кадра + константа)0,04результирующая в фазу ошибок, которые возникают в течение периодов тишины в исходном речевом файле, аWf - серия констант, пропорциональных ширине модифицированных Барк отсчетов. После этих умножений, значения ошибок в кадрах лимитированы числом 45. Эти сгруппированные значения,Dn , иDAn, так называемые ошибки кадров.
Обнуление возмущений кадров, в ходе которого значительно уменьшаются задержки
Если кодированный сигнал содержит уменьшение задержки большее, чем 16 мс (половина окна), производится модификация, описанная выше (в пункте «Короткое быстрое преобразование Фурье»). Целесообразно игнорировать кадровые возмущения в таких случаях в ходе объективной (автоматической) оценки качества речи. Как следствие, кадровые возмущения в таких случаях обнуляются. Результирующие кадровые возмущения обозначаются D'nиDA'n.
Рекоррекция неудачных интервалов
Следующие друг за другом кадры с возмущением кадра, большей чем порог, называют неудачными интервалами. В редких случаях реальные измерения предсказывают большие искажения при минимальном количество плохих кадров из-за неправильных временных задержек, полученных на этапе предварительной обработки. Для подобных, так называемых неудачных, интервалов оценивается новое значение задержки с помощью максимизации корреляции между исходным и кодированным сигналами, подстроенной под задержки, которые получены на предобработке. Когда максимальная корреляция меньше порога, делается заключение, что интервал удовлетворяет условиям, и его больше не считают неудачным, и обработка по интервалу прекращается. В других случаях кадровое возмущение в неудачных интервалах пересчитывается и, если она меньше, заменяет исходное кадровое возмущение. Результат заключен в итоговых кадровых возмущениях D''nandDA''n , которые используются для расчетов качества.
Группировка ошибки по вторичным интервалам
Вслед за этим значения возмущения кадра и асимметричные значения возмущения кадра группируются по разделенным вторичным интервалам из 20 кадров (перекрытие примерно 320 мс) используя L6 нормы, высшееp значение как группировка по длине файла речи. Эти интервалы также перекрываются на 50% и не используются кадровая функция.
Группировка ошибки по длительности речевого файла (около 10 с), включая фактор повторяемости
Возмущения в доли секунды и асимметричные значения возмущения в доли секунды группируются по активному интервалу речи (корреспондирующие кадры) с использованием L2 норм. Большее значениеp используется для группировки интервалов доли секунды по сравнению с меньшим значениемp группировки по файлу речи. Это связано с тем фактом, что при искажении вторичных интервалов они теряют смысл, в то время как, если первое предложение искажено, качество остальных неизменно.
ОценкаPESQ
Конечная оценка PESQ– это линейная комбинация среднего значения ошибки и среднего значения асимметричного возмущения. Диапазон оценкиPESQот –0.5 до 4.5. Для большинства случаев эти значения лежат в пределах 1.0 до 4.5.
Рис. 1.2 Процедура юстировки, используемой в PESQ, для определения задержки на каждом временном интервале
Рис. 1.3 Обзор ядра натуральной модели
Рис. 1.4 Получения конечной оценки PESQ
Практическая часть
Часть 1.
В соответствии с выбранным вариантом задания из тестовых таблиц создать звуковые файлы *.wavдля каждого слова.
Используя программную модель системы GSM900/1800 получить звуковые файлы *.wv2 для каждого тестового слова. Установить значения вероятности ошибки от 0 до 10%. Для того, чтобы при работе программной модели с вероятностями ошибок более 2-3% компьютер не подвисал, необходимо заменить исходную библиотекуsvertka.dllдинамической библиотекой, взятой из папки SverkaQuickly, в которой ограничена глубина просмотра циклического кода
Обработать полученные результаты в программной модели PESQ. Для этого необходимо сменить расширение *.wv2 на *.wavи указать пути к исходному и кодированному файлу. Причем в первой строчке указывается исходный файл. Получить оценкуPESQ.
Прослушать звуковые файлы, полученные на выходе кодека и сравнить акустическое качество речи с оценкой PESQ.
Построить графики зависимости оценки PESQот вероятности ошибки в канале.
Сделать выводы