Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЦОС, УПОиС (Витязев В.В.).doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
6.03 Mб
Скачать

3.11. Аудиокодеки: психоакустическая модель стандарта mpeg.

Самое широкое распространение получила SMR – модель (отношение сигнал/маска). С помощью данной модели для каждой субполосы кодирования n вычисляется отношение SMR(n). Оно представляет собой отношение энергии звукового сигнала к максимально возможному значению энергии искажения квантования в субполосе кодирования, при котором они еще маскируются полезным сигналом.

Значение функции SMR(n) для всех субполос кодирования образует глобальный порог маскирования, определяющий требуемое количество бит для кодирования в каждой полосе кодирования.

Рассмотрим психоакустическую модель, обычно используемую для компрессии Layer 3. Характерными особенностями модели данного уровня являются:

1. Разделение спектра выборки звукового сигнала на полосы психоакустического анализа (М полос, несовпадающие с критическими полосами слуха). Критическая полоса слуха – полоса частот, в пределах которой слух интегрирует сигнал возбуждения в одной полосе, не различая его тонкую структуру внутри полосы. Таких полос 24, которые определены стандартом MPEG. При этом число полос М = 62 для частоты дискретизации 48 кГц, М = 63 при 44.1 кГц, М = 59 при 32 кГц.

2. Все расчеты одновременно выполняются как для длинных (N = 1024), так и для коротких выборок (N = 256) звукового сигнала.

Реализация психоакустической модели включает в себя следующие операции:

1. Вычисление М – точечного БПФ с использованием оконной функции Ханна. В результате каждой k – ой спектральной компоненте Ỳ(k), при k = 0, N-1, вычисляется амплитуда и фаза:

R(k) = | Ỳ(k) |, φ(k) = arg Ỳ(k).

2. Вычисление предсказанных значений R’(k) и φ’(k), для каждой спектральной компоненты. Для этого в памяти кодера хранятся массивы модуля и фаз спектральных составляющих двух предшествующих блоков отсчета звукового сигнала.

3. Расчет меры непредсказуемости для каждой k – ой спектральной компоненты текущего блока выборок. Она учитывает наличие корреляции между текущим и двумя предшествующими блоками выборок. На основании меры непредсказуемости делается вывод о степени близости сигнала в каждой полосе анализа к тону или шуму, маскирующие свойства которых различны.

4. Рассчитывается энергия и взвешенное значение меры непредсказуемости текущего блока выборок в каждой полосе анализа. В каждую полосу анализа попадает несколько спектральных компонент.

5. Расчет развертывающей функции – индивидуальная кривая маскировки, которая учитывает избирательные свойства слуха в различных частотных диапазонах. Далее рассчитываются свертки энергии сигнала в полосе анализа и взвешенных значений меры непредсказуемости с вычислением ранее развертывающей функции с целью учета влияния соседних полос.

6. Рассчитывается ОСШ SNR*(m) в полосе анализа m = 0, N-1, представляющее собой наименьшее значение отношения энергий полезного сигнала и шума, при котором еще маскируется полезный сигнал для заданной полосы анализа. Чем меньше ОСШ, тем больше уровень шума в полосе анализа.

7. Рассчитывается максимально допустимая энергия шума (глобальный порог маскировки) в полосе анализа, при котором он еще маскируется полезным сигналом.

8. Расчет максимально допустимой энергии шума в полосе кодирования (их число = 32).

9. Вычисляется энергия сигнала в полосах кодирования и рассчитывается отношение полезного сигнала к допустимому значению энергии шума SMR для каждой из полос кодирования.