Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
вопросы госы 2021.docx
Скачиваний:
243
Добавлен:
01.06.2021
Размер:
10.49 Mб
Скачать
  1. Основы устранения избыточности и сжатия аудиоданных с потерями

1. Метод «Частной маскировки»

Нормально слышимый звук накрывается громким звуком близкой частоты – «эффект оглушения».

 

Звуки B, C не будут слышны. Звук D вне критической полосы хорошо слышен. 

2. Метод «Временной маскировки»

Частотная маскировка дополнена временной. 

Звуки B, C не слышны из-за оглушения звуком A.

Сжатие звука с потерями.

Сжатие аудиоданных с потерями основывается на несовершенстве человеческого слуха при восприятии звуковой информации. Неспособность человека в определенных случаях различать тихие звуки в присутствии более громких, называемая эффектом маскировки, была использована в алгоритмах сокращения психоакустической избыточности. Эффекты слухового маскирования зависят от спектральных и временных характеристик маскируемого и маскирующего сигналов и могут быть разделены на две основные группы:

  1. частотное (одновременное) маскирование

  2. временное (неодновременное) маскирование

Первые стандарты появились в начале 90, в частности MPEG1.

MPEG1  Layer3 – MP3

В основе алгоритма сжатия – преобразование фрагментов звуковых данных, соответствующие им спектральные области (СО).

Разделение СО по полосам, уменьшение числа бит, которыми предоставлен сигнал в каждой исходной полосе из оценки порога слышимости.

ДПФ – дискретное преобразование Фурье

ПАМ – психоакустическая модель

ААНБ – адаптивные алгоритм назначение

ФВП – формирователь выходного потока 

СИ – сопроводительная информация

СЖ – служебные данные

РСМ – входной поток (16 бит* 44,1 кГц) SMR – signal to Mask Ration

Вход РСМ поток фрагментируется по пачкам. По каждой из пачек вычисляется спектральный образ и разделяется по полосам. Для каждой полосы вычисляется SMR. В адаптивном алгоритме назначения битов отсекаются лишние биты, соответствующие сигналам ниже SMR.

В каждой полосе уменьшается число бит пропорционально тому, какой динамический диапазон восприятия остается данной полосе. Данная операция носит название переквантования в каждой полосе. За счет переквантования снижается объем аудиоданных более чем в 10 раз без заметной потери качества.

Далее в ФВП кодируются (сжимаются). На выходе получаются аудиоданные со сжатием в 10 – 20 раз. 

Различия наиболее остро проявляются в области, где мало бит. Различия в низкочастотных областях хорошо слышимы при малых искажениях и больших АС.

Происходит маскировка сжатых аудио звуков искажениями электро-акустического тракта. 

Другой негативный фактор – полосовая обработка. Приводит к частичной нормализации гистограммы USD.

Наряду с этим используется передискретизация. Все это делает звук менее живым.

В 1999 году появились первые версии улучшенного формата со сжатием ААС/mp4. Преобразование Фурье двумерное и выписывался по частотной области. Файл .aac на 30% меньше по объему, чем mp3.

Соседние файлы в предмете Государственный экзамен