Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Серов.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.41 Mб
Скачать

3.8. Кодирование аудио: основные идеи

Кодирование аудио выполняется очень похоже на кодирование видео (рис. 3.19): здесь мы также встречаем DCT и энтропийное кодирование. Но есть и существенные отличия. В частности, кодирование производится в гра­ницах узких полос частот (всего этих полос 32), "вырезаемых" из сигнала по­лосовыми фильтрами. Кодирование внутри каждой такой "полосы" произво­дится отдельно, с параметрами, определяемыми "блоком управления" на ос­новании психоакустической модели.

Разбиение на полосы позволяет очень гибко кодировать звук в разных диапа­зонах частот. Как мы помним, не все частоты человеческое ухо одинаково хорошо воспринимает — поэтому "плоховоспринимаемые" частоты можно кодировать с большим сжатием и худшим качеством, что позволяет получить более низкий битрейт для всего сигнала в целом.

Рис. 3.19. Упрощенная схема кодера звука

После разбиения на полосы, каждая такая полоса преобразуется при помощи дискретно-косинусного преобразования (DCT), которое мы встречали ранее, когда говорили о видеокомпрессии.

Звуковой сигнал представляет собой сложное колебание в диапазоне частот от 20 Гц до 20 000 Гц. Математиками доказано, что такое сложное колебание может быть представлено как сумма синусоидальных и косинусоидальных колебаний разных частот и амплитуд. Совокупность этих колебаний называ­ется спектром. Суть преобразования DCT для звука и состоит в том, что ис­ходное колебание преобразуется в набор частот и амплитуд колебаний спек­тра. Таким образом, отпадает необходимость передавать через канал связи само колебание — можно передать только числа, характеризующие спектр: список частот и амплитуд колебаний спектра, сумма которых и даст исходное звуковое колебание. Когда мы рассматривали компрессирование изображе­ния, мы на самом деле делали то же самое, только для случая двумерного (т. е. графически представляемого на плоскости) сигнала.

После разбиения на участки выполняется энтропийное кодирование, подоб­ное описанному ранее для компрессии видео.