Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
19-23_otvety.docx
Скачиваний:
3
Добавлен:
01.04.2025
Размер:
314.47 Кб
Скачать

22. Mpeg1,2 Layer 1.

Структурная схема кодера на рисун­ке. Перед началом обработки непрерывная последовательность от­счетов входного сигнала делится на кадры. Каждый из кадров, соответ­ствующий уровню Layer 1, содержит 384 отсчета и обрабатывается (как в кодере, так и в декодере) независимо друг от друга.

Расположенный на входе кодера блок цифровых полифазных фильтров делит весь диапазон сигнала на 32 узкополосных частотных поддиапазо­на. Использование полифазных фильтров объясняется тем, что такие фильтры просты в реализации, имеют небольшое время задержки сигна­ла и способны компенсировать искажения, возникающие на границах со­седних поддиапазонов [33]. Все поддиапазоны имеют одинаковую шири­ну ΔF, которая зависит от частоты дискретизации fd, входного сигнала:

ΔF = fd/2n, (2.4) где n — число поддиапазонов.

Таким образом, при частоте дискретизации fd = 48 кГц, ширина поддиа­пазона ΔF = 750 Гц.

Полученные после фильтрации отсчеты каждого из поддиапазонов объединяются в одну группу, и по значению максимального отсчета этой группы определяется коэффициент масштабирования. Он является общим для всех отсчетов группы. Все коэффициенты масштабирования кодируются 6-разрядными кодовыми словами и передаются декодеру в общем потоке данных. Каж­дому шагу квантования с 6-разрядной точностью соответствует 2дБ уси­ления выходного сигнала, что позволяет получить динамический диапа­зон более 120 дБ (2дБ х 26 = 2дБ х 64 = 128дБ).

Коэффициент масштабирования характеризует степень уменьшения шума квантования в данном под диа­пазоне.

Одновременно с разделением входного сигнала на поддиапазоны с по­мощью банка фильтров, психоакустический процессор также анализиру­ет спектр этого сигнала путем выполнения быстрого преобразования Фурье (БПФ). Алгоритм обработки по первому уровню (Layer 1) предус­матривает разложение по 512 точкам. Данная процедура производится с целью определения относительного порога слышимости спектраль­ных компонент входного сигнала и расчета на его основе глобального порога маскирования, учитывающего маскирующее действие всех спек­тральных компонент сигнала. Исходя из полученного результата определяется величина отношения «сигнал/уровень маскирования», которое определяет требуемую величину шага квантования.

После расчета отношения «сигнал/уровень маскирования», для каж­дого поддиапазона рассчитываются размеры шагов квантования и число разрядов, необходимое для кодирования присутствующих в каждом под­диапазоне отсчетов, величины которых превышают глобальный порог маскирования. Общее число разрядов, предназначенных для кодирова­ния, определяется психоакустическим процессором, исходя, прежде все­го, из заданной скорости потока бит на выходе кодера. Распределение же общего числа разрядов между поддиапазонами осуществляется таким образом, чтобы при кодировании сигналов в каждом из поддиапазонов уровень шума квантования оставался ниже границы маскирования.

Все данные, подлежащие передаче, поступают на мультиплексор, ко­торый формирует из них стандартные кадры. Структура кадра звуковых данных, соответствующая стандарту MPEG1, 2 Layer 1, показана на ри­сунке.

Часть кадра, обозначенная словом «Header» («заголовок») и состоящая из 32 разрядов, включает в себя синхронизирующую группу (12 разрядов) и массив служебных данных (20 разрядов).

Вслед за заголовком расположены 16 разрядов кода CRC, который используется декодером для обнаружения ошибок в принятом кадре.

После кодового слова CRC располагается массив данных (Bit Allocation), характеризующий распределение разрядов, использованных для кодирования квантованных отсчетов в каждом из 30 поддиапазонов (отсчеты последних двух поддиапазонов – 31-го и 32-го, не кодируются и не передаются). Эти данные представлены 30 либо 4-разрядными кодовыми словами (для MPEG1), либо кодовыми словами переменной разрядности (от двух до четырех — для MPEG2). Эта функция известна как кодеру, так и декодеру. Поэтому при декодиро­вании число разрядов восстанавливается.

Далее следует массив, состоящий из 6-разрядных коэффициентов мас­штабирования отсчетов каждого из поддиапазонов (Scalefactors).

Массив данных, обозначенный как «Subband Samples», содержит зна­чения самих отсчетов, объединенных в 12 блоков по 32 отсчета в каж­дом. Длина отсчетов неодинакова и может изменяться от 0 до 15 бит.

Завершает кадр массив данных, обозначенный как «AUX». В случае стандарта MPEG1 здесь могут располагаться дополнительные данные, которые определяются пользователем. В стандарте же MPEG2 сюда помещаются данные о дополнительных каналах, которые декодерами MPEG1 не декодируются.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]