Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
345
Добавлен:
15.03.2016
Размер:
2.59 Mб
Скачать

3.2.6. Сжатие звукоданных Эффект маскирования и психоакустическая модель слуха

Из-за повышенной чувствительности уха к искажениям сжатие звуковых сигналов оказывается более сложной задачей, чем видеокомпрессия. В то же время некоторые психофизиологические особенности слухового восприятия позволяют даже при значительной компрессии (6:1 и более) обеспечить «прозрачный» канал, то есть канал, звучание выходного сигнала которого субъективно неотличимо от звучания сигнала источника.

Для понимания этих особенностей ознакомимся с некоторыми механизмами слухового восприятия. Как и во всякой системе с преобразованием из временнóй в частотную область, в слуховой системе имеется некоторая неопределенность в разделении отдельных частотных составляющих. Несовершенное разделение по частоте приводит к тому, что ухо не в состоянии различить звуки с близкими частотами, этот эффект называетсячастотным маскированием. Граница восприятия вблизи маскирующего тона называетсяпорогом маскирования.

Рис. 3.9.Критические полосы человеческого слуха

В результате длительных исследований удалось измерить ширину и расположение частотных полос, в пределах которых действует маскирование. Эти полосы получили название критических, и в полосе слухового восприятия их насчитывается 25. В области низких слышимых частот ширина критической полосы менее 100 Гц, в районе 2 кГц она равна 300 Гц и возрастает до 4 кГц в области высших воспринимаемых частот (рис. 3.9). Измеряется ширина критической полосы в Барках (в относительных значениях полосы звуковых частот) и рассчитываются по формуле [14]:

Кроме частотного (статического), имеет место и временнóе(динамическое)маскирование. «Временнóе маскирование», то есть эффект, при котором звук достаточной амплитуды маскирует другие звуки, непосредственно предшествующие ему или следующие за ним по времени (рис. 3.10). Когда звук маскируется следующим за ним по временисигналом, такое маскирование называется маскированием назад. Типичный промежуток времени, в пределах которого действует маскирование назад, составляет 5…50 мс. Если звук маскируется предшествующим ему сигналом, то такое маскирование называется маскированием вперед, характерные интервалы времени для которого составляют от 50 до 200 мс в зависимости от уровней маскирующего и маскируемого сигналов. Несовершенство временнóго разделения связано с резонансным характером восприятия.

Использование эффекта маскирования позволяет существенно сократить объем звукоданных, сохраняя приемлемое качество звучания. Принцип здесь достаточно простой: «Если какая-то составляющая не слышна, то и передавать ее не следует». На практике это означает, что в области маскирования можно снизить число бит на отсчет до такой степени, чтобы шум квантования все еще оставался ниже порога маскирования. Таким образом, для работы звукового кодера необходимо знать пороги маскирования при различных комбинациях воздействующих сигналов. Вычислением этих порогов занимается важный узел в кодере – психоакустическая модель слуха(ПАМ). Она анализирует входной сигнал в последовательных отрезках времени и определяет для каждого блока отсчетов спектральные компоненты и соответствующие им области маскирования. Входной сигнал анализируется в частотной области, для этого блок отсчетов, взятых во времени, с помощью дискретного преобразования Фурье преобразуется в набор коэффициентов при компонентах частотного спектра сигнала. Разработчики кодеров компрессии имеют значительную свободу в построении модели, точность ее функционирования зависит от требуемой степени сжатия.

Соседние файлы в папке 399_Mamchev-Cifrovoe_televizionnoe_veschanie_2012