
22. Mpeg1,2 Layer 1.
Структурная схема кодера на рисунке. Перед началом обработки непрерывная последовательность отсчетов входного сигнала делится на кадры. Каждый из кадров, соответствующий уровню Layer 1, содержит 384 отсчета и обрабатывается (как в кодере, так и в декодере) независимо друг от друга.
Расположенный на входе кодера блок цифровых полифазных фильтров делит весь диапазон сигнала на 32 узкополосных частотных поддиапазона. Использование полифазных фильтров объясняется тем, что такие фильтры просты в реализации, имеют небольшое время задержки сигнала и способны компенсировать искажения, возникающие на границах соседних поддиапазонов [33]. Все поддиапазоны имеют одинаковую ширину ΔF, которая зависит от частоты дискретизации fd, входного сигнала:
ΔF = fd/2n, (2.4) где n — число поддиапазонов.
Таким образом, при частоте дискретизации fd = 48 кГц, ширина поддиапазона ΔF = 750 Гц.

Полученные после фильтрации отсчеты каждого из поддиапазонов объединяются в одну группу, и по значению максимального отсчета этой группы определяется коэффициент масштабирования. Он является общим для всех отсчетов группы. Все коэффициенты масштабирования кодируются 6-разрядными кодовыми словами и передаются декодеру в общем потоке данных. Каждому шагу квантования с 6-разрядной точностью соответствует 2дБ усиления выходного сигнала, что позволяет получить динамический диапазон более 120 дБ (2дБ х 26 = 2дБ х 64 = 128дБ).
Коэффициент масштабирования характеризует степень уменьшения шума квантования в данном под диапазоне.
Одновременно с разделением входного сигнала на поддиапазоны с помощью банка фильтров, психоакустический процессор также анализирует спектр этого сигнала путем выполнения быстрого преобразования Фурье (БПФ). Алгоритм обработки по первому уровню (Layer 1) предусматривает разложение по 512 точкам. Данная процедура производится с целью определения относительного порога слышимости спектральных компонент входного сигнала и расчета на его основе глобального порога маскирования, учитывающего маскирующее действие всех спектральных компонент сигнала. Исходя из полученного результата определяется величина отношения «сигнал/уровень маскирования», которое определяет требуемую величину шага квантования.
После расчета отношения «сигнал/уровень маскирования», для каждого поддиапазона рассчитываются размеры шагов квантования и число разрядов, необходимое для кодирования присутствующих в каждом поддиапазоне отсчетов, величины которых превышают глобальный порог маскирования. Общее число разрядов, предназначенных для кодирования, определяется психоакустическим процессором, исходя, прежде всего, из заданной скорости потока бит на выходе кодера. Распределение же общего числа разрядов между поддиапазонами осуществляется таким образом, чтобы при кодировании сигналов в каждом из поддиапазонов уровень шума квантования оставался ниже границы маскирования.

Все данные, подлежащие передаче, поступают на мультиплексор, который формирует из них стандартные кадры. Структура кадра звуковых данных, соответствующая стандарту MPEG1, 2 Layer 1, показана на рисунке.
Часть кадра, обозначенная словом «Header» («заголовок») и состоящая из 32 разрядов, включает в себя синхронизирующую группу (12 разрядов) и массив служебных данных (20 разрядов).
Вслед за заголовком расположены 16 разрядов кода CRC, который используется декодером для обнаружения ошибок в принятом кадре.
После кодового слова CRC располагается массив данных (Bit Allocation), характеризующий распределение разрядов, использованных для кодирования квантованных отсчетов в каждом из 30 поддиапазонов (отсчеты последних двух поддиапазонов – 31-го и 32-го, не кодируются и не передаются). Эти данные представлены 30 либо 4-разрядными кодовыми словами (для MPEG1), либо кодовыми словами переменной разрядности (от двух до четырех — для MPEG2). Эта функция известна как кодеру, так и декодеру. Поэтому при декодировании число разрядов восстанавливается.
Далее следует массив, состоящий из 6-разрядных коэффициентов масштабирования отсчетов каждого из поддиапазонов (Scalefactors).
Массив данных, обозначенный как «Subband Samples», содержит значения самих отсчетов, объединенных в 12 блоков по 32 отсчета в каждом. Длина отсчетов неодинакова и может изменяться от 0 до 15 бит.
Завершает кадр массив данных, обозначенный как «AUX». В случае стандарта MPEG1 здесь могут располагаться дополнительные данные, которые определяются пользователем. В стандарте же MPEG2 сюда помещаются данные о дополнительных каналах, которые декодерами MPEG1 не декодируются.