Основы устранения избыточности и сжатия аудиоданных с потерями

Добавил:

ysveta99 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный университет аэрокосмического приборостроения

Предмет:

Государственный экзамен

Файл:

вопросы госы 2021.docx

Скачиваний:

253

Добавлен:

01.06.2021

Размер:

10.49 Mб

Скачать

☆

<<< < Предыдущая 14 15 16 17 18 19 20 21 22 23 24 2526 / 4026 27 28 29 30 31 32 33 34 35 36 37 38 > Следующая >>>

Основы устранения избыточности и сжатия аудиоданных с потерями

1. Метод «Частной маскировки»

Нормально слышимый звук накрывается громким звуком близкой частоты – «эффект оглушения».

Звуки B, C не будут слышны. Звук D вне критической полосы хорошо слышен.

2. Метод «Временной маскировки»

Частотная маскировка дополнена временной.

Звуки B, C не слышны из-за оглушения звуком A.

Сжатие звука с потерями.

Сжатие аудиоданных с потерями основывается на несовершенстве человеческого слуха при восприятии звуковой информации. Неспособность человека в определенных случаях различать тихие звуки в присутствии более громких, называемая эффектом маскировки, была использована в алгоритмах сокращения психоакустической избыточности. Эффекты слухового маскирования зависят от спектральных и временных характеристик маскируемого и маскирующего сигналов и могут быть разделены на две основные группы:

частотное (одновременное) маскирование
временное (неодновременное) маскирование

Первые стандарты появились в начале 90, в частности MPEG1.

MPEG1 Layer3 – MP3

В основе алгоритма сжатия – преобразование фрагментов звуковых данных, соответствующие им спектральные области (СО).

Разделение СО по полосам, уменьшение числа бит, которыми предоставлен сигнал в каждой исходной полосе из оценки порога слышимости.

ДПФ – дискретное преобразование Фурье

ПАМ – психоакустическая модель

ААНБ – адаптивные алгоритм назначение

ФВП – формирователь выходного потока

СИ – сопроводительная информация

СЖ – служебные данные

РСМ – входной поток (16 бит* 44,1 кГц) SMR – signal to Mask Ration

Вход РСМ поток фрагментируется по пачкам. По каждой из пачек вычисляется спектральный образ и разделяется по полосам. Для каждой полосы вычисляется SMR. В адаптивном алгоритме назначения битов отсекаются лишние биты, соответствующие сигналам ниже SMR.

В каждой полосе уменьшается число бит пропорционально тому, какой динамический диапазон восприятия остается данной полосе. Данная операция носит название переквантования в каждой полосе. За счет переквантования снижается объем аудиоданных более чем в 10 раз без заметной потери качества.

Далее в ФВП кодируются (сжимаются). На выходе получаются аудиоданные со сжатием в 10 – 20 раз.

Различия наиболее остро проявляются в области, где мало бит. Различия в низкочастотных областях хорошо слышимы при малых искажениях и больших АС.

Происходит маскировка сжатых аудио звуков искажениями электро-акустического тракта.

Другой негативный фактор – полосовая обработка. Приводит к частичной нормализации гистограммы USD.

Наряду с этим используется передискретизация. Все это делает звук менее живым.

В 1999 году появились первые версии улучшенного формата со сжатием ААС/mp4. Преобразование Фурье двумерное и выписывался по частотной области. Файл .aac на 30% меньше по объему, чем mp3.

<<< < Предыдущая 14 15 16 17 18 19 20 21 22 23 24 2526 / 4026 27 28 29 30 31 32 33 34 35 36 37 38 > Следующая >>>

Соседние файлы в предмете Государственный экзамен

#
01.06.2021592.9 Кб88БД.pdf
#
01.06.202110.49 Mб253вопросы госы 2021.docx