Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебники / Цифровое телевизионное вещание под редакцией Г. В. Мамчев, 2014

.pdf
Скачиваний:
3
Добавлен:
29.05.2026
Размер:
20.33 Mб
Скачать

110

3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕНИИ

Интенсивность

маскируемого звука

Продолжительность

маскирующего тона

.. ..

50

 

Маскирование

 

 

Маскирование

 

 

 

назад

 

 

вперед

 

 

OL

--------L~~----

L---------

~=

-----..

~

 

~

 

..

 

т

 

 

200 мс

 

 

50 мс

 

 

 

 

Рис. 3.10. Проявление временн6го маскирования

разом, для работы звукового кодера необходимо знать пороги маскирова­

ния при различных комбинациях воздействующих сигналов. Вычислением

этих порогов занимается важный узел в кодере - nсихоакустическая мо­

дель слуха (ПАМ). Она анализирует входной сигнал в последовательных

отрезках времени и определяет для каждого блока отсчетов спектральные компоненты и соответствующие им области маскирования. Входной сиг­ нал анализируется в частотной области, для этого блок отсчетов, взятых во времени, с помощью дискретного преобразования Фурье преобразуется в

набор коэффициентов при компонентах частотного спектра сигнала. Раз­

работчики кодеров компрессии имеют значительную свободу в построении

модели, точность ее функционирования зависит от требуемой степени

сжатия.

Полосное кодирование и блок фильтров

Наилучшим методом кодирования звука, учитывающим эффект мас­

кирования, оказывается полосное кодирование. Сущность его заключается в следующем. Группа отсчетов входного звукового сигнала, называемая

кадром, поступает на блок фильтров (БФ), который содержит, как правило, 32 полосовых фильтра. Учитывая сказанное ранее о критических полосах и маскировании, хорошо бы иметь в блоке фильтров полосы пропускания, по

возможности совпадающие с критическими. Однако практическая реали­

зация цифрового блока фильтров с неравными полосами достаточно слож­

на и оправдана только в устройствах самого высокого класса. Обычно ис­

пользуется блок фильтров на основе квадратурно-зеркальных фильтров (КЗФ) с равными полосами пропускания, охватывающих с небольшим вза­ имным перекрытием всю полосу слышимых частот (рис. 3.11). В этом слу­ чае полоса пропускания фильтра равна n/32Т, а центральные частоты по­ лос равны (2k + 1) n/64 Т, где Т - период дискретизации; k = О, 1, ... , 31. При частоте дискретизации 48 КГц полоса пропускания секции фильтра составляет 750 Гц [27].

3.2. Международный стандарт кодирования с информационным сжатием МPEG-2

111

о

 

 

 

 

 

 

 

rv

 

r'yv {"УУ' "'уу' r'y", "'у'" r'Y'"l {"УУ'

",уу

{"у", "'у'" r'y",

r"

f

 

 

 

 

 

 

 

-0,05 r-

Относительный

уровень, дБ

Рис. 3.11. Нормированная АЧХ блока фильтров

На выходе каждого фильтра оказывается та часть входного сигнала, которая попадает в полосу пропускания данного фильтра. Далее в каждой полосе с помощью ПАМ анализируется спектральный состав сигнала и оценивается, какую часть сигнала следует передавать без сокращений, а какая лежит ниже порога маскирования и может быть переквантована на

меньшее число бит. Поскольку в реальных звуковых сигналах максималь­ ная энергия обычно сосредоточена в нескольких частотных полосах, может

оказаться, что сигналы в других полосах не содержат различимых звуков и

могут вообще не передаваться. Наличие, например, сильного сигнала в од­ ной полосе означает, что несколько вышележащих полос будут маскиро­ ваться и могут кодироваться меньшим числом бит.

Для сокращения максимального динамического диапазона определя­ ется максимальный отсчет в кадре и вычисляется масштабирующий мно­

житель, который приводит этот отсчет к верхнему уровню квантования.

Эта операция аналогична компандированию в аналоговом вещании. На этот же множитель умножаются и все остальные отсчеты. Масштабирую­

щий множитель передается к декодеру вместе с кодированными данными

для коррекции коэффициента передачи последнего. После масштабирова­

ния производится оценка порога маскирования и осуществляется перерас­

пределение общего числа бит между всеми полосами.

Квантование и распределение бит

Все вышеописанные операции не сокращали заметно объем данных, они были как бы подготовительным этапом к собственно сжатию звуко­

данных. Как и при компрессии цифровых видеосигналов, основное сжатие

происходит в квантователе. Исходя из принятых ПАМ решений о пере­

квантовании отсчетов в отдельных частотных полосах, квантователь изме­

няет шаг квантования таким образом, чтобы приблизить шум квантования

в данной полосе к вычисленному порогу маскирования. При этом на отсчет

может понадобиться вместо 16 ... 20 всего 4 или 5 бит [14].

Принятие решения о передаваемых компонентах сигнала в каждой

частотной полосе происходит независимо от других, и требуется некий «диспетчер», который выделил бы каждому из 32 полосных сигналов часть

112

3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии

 

 

из общего ресурса бит, соответствующую значимости этого сигнала в об­ щем ансамбле. Роль такого диспетчера выполняет устройство динамиче­ ского распределения бит.

Возможны три стратегии распределения бит.

В системе с прямой адаптацией кодер производит все расчеты и по­ сылает результаты декодеру. Преимущество данного способа в том, что алгоритм распределения бит может обновляться и изменяться, не затраги­ вая работы декодера. Однако для пересылки дополнительных данных де­ кодеру расходуется заметная часть общего запаса бит.

Система с обратной адаптацией осуществляет одинаковые расчеты и в кодере, и в декодере, поэтому нет необходимости пересылать декодеру дополнительные данные. Однако сложность и стоимость декодера значи­ тельно выше, чем в предыдущем варианте, и любое изменение алгоритма требует обновления или переделки декодера.

Компромиссная система с прямой и обратной адаптацией разделяет функции расчета распределения бит между кодером и декодером таким

образом, что кодер производит наиболее сложные вычисления и посылает

декодеру только ключевые параметры, затрачивая на это относительно не­

много бит, декодер проводит лишь несложные вычисления. В такой систе­ ме кодер не может быть существенно изменен, но настройка некоторых

параметров допустима.

Обобщенная схема звукового кодера и декодера, выполняющих циф­

ровое сжатие согласно описанному алгоритму с прямой адаптацией, при­

ведена на рис. 3.12, а. Сигналы на выходе частотных полос объединяются

в единый цифровой поток с помощью мультиплексора.

а) Распределение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

бит

 

 

 

 

 

 

 

 

 

 

 

 

 

Канал

 

 

 

 

 

 

 

 

 

 

Анализиру­

 

Кванто­

 

 

Мульти-

Демульти-

 

Восстановле-

 

Синтезиру­

 

 

 

 

 

 

 

 

 

 

 

 

ющий БФ

 

ватель

 

 

плексор

 

плексор

 

ние сигнала

 

ющий БФ

 

 

 

 

 

 

 

 

 

 

 

 

 

Квантованные

 

 

 

 

 

Распределе-t--___----- '

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

значения

 

 

 

 

,--_ни_е_б_и_т---,

Распределение бит

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Канал

 

 

 

 

 

 

 

 

 

 

Анализиру-

 

Кванто-

 

 

Мульти-

 

 

 

 

 

 

Синтезиру­

-~

 

г-

г-

г-

 

 

 

 

 

 

ющий БФ

ватель

плексор

 

 

 

 

 

 

ющий БФ

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Распределе-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ние бит

 

 

 

 

 

 

 

 

вание оги­

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

бающей

 

 

 

 

 

 

L-.

 

Кодирование

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

огибающей

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 3.12. Обобщенная структурная схема звукового кодера и декодера:

а) с прямой адаптацией; б) с обратной адаптацией

3.2. Международный стандарт кодирования с информационным сжатием МPEG-2

113

в декодере процессы происходят в обратном порядке. Сигнал демуль­ типлексируется, делением на масштабирующий множитель восстанавли­ ваются исходные значения цифровых отсчетов в частотных полосах и по­ ступают на объединяющий блок фильтров, который формирует на выходе поток звукоданных, адекватный входному с точки зрения психофизиоло­

гического восприятия звукового сигнала человеческим ухом.

Вариант схемы с обратной адаптацией показан на рис. 3.12, б.

Уровни обработки звукоданных

Сжатие звукоданных в стандарте МPEG-2 базируется на принципах

полосного кодирования и отличается от сжатия видеоданных: отсутствуют

аналоги 1-, р- и В-кадров, не используется двунаправленное кодирование,

звуковые кадры всегда передаются в своей естественной последовательно­

сти, кадр содержит одинаковое количество данных. В зависимости от ис­

пользуемого алгоритма определены три Уровня (Layer) обработки, обозна­ чаемых латинскими цифрами 1, П, ПI и различающихся сложностью деко­

дера и особенно кодера и степенью сжатия.

Важнейшим свойством МPEG-2 является полная обратная совмести­ мость всех трех уровней. Это означает, что каждый декодер может декоди­

ровать сигналы не только своего, но и нижележащих уровней.

В основу алгоритма Уровня 1 положен разработанный компанией Phil-

ips для записи на компакт-кассеты формат DCC (Digital Compact Cassette).

Кодирование первого уровня применяется там, где не очень важна степень

компрессии и решающими факторами являются сложность и стоимость

кодера и декодера. Кодер Уровня 1 обеспечивает высококачественный звук

при скорости цифрового потока 384 кбит/с на стереопрограмму.

Уровень П требует более сложного кодера и несколько более сложно­ го декодера, но обеспечивает лучшее сжатие - «прозрачность» канала дос­

тигается уже при скорости 256 кбит/с. Он допускает до 8 кодирова­ ний/декодирований без заметного ухудшения качества звука. В основу ал­ горитма Уровня П положен популярный в Европе формат МUSICAМ.

Самый сложный Уровень ПI включает все основные инструменты сжатия: полосное кодирование, дополнительное ДКП, энтропийное коди­ рование, усовершенствованную ПАМ. Ценой усложнения кодера и деко­ дера он обеспечивает высокую степень компрессии - считается, что «про­

зрачный» канал формируется на скорости 128 кбит/с, хотя высококачест­

венная передача возможна и на более низких скоростях.

В стандарте рекомендованы две психоакустические модели: более простая Модель 1 и более сложная, но и более высококачественная Модель 2. Они отличаются алгоритмом обработки отсчетов. Обе модели могут ис­

пользоваться для всех трех уровней, но Модель 2 имеет специальную мо­ дификацию для Уровня ПI.

МPEG-2 оказался одним из первых международных стандартов циф­ рового сжатия звуковых сигналов и это обусловило его широкое примене-

114

3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии

 

 

ние во многих областях: вещании, звукозаписи, связи и мультимедийных приложениях. Наиболее широко используется Уровень П, он вошел со­ ставной частью в европейские стандарты спутникового, кабельного и на­ земного цифрового телевизионного вещания, в стандарты звукового веща­ ния, записи на DVD, Рекомендации МСЭ BS.1115 и J.52 [27]. Уровень ПI (его еще называют МР-3) нашел широкое применение в цифровых сетях с интегральным обслуживанием (ISDN) и в сети Интернет, подавляющее большинство музыкальных файлов в сети записаны именно в этом стан­ дарте. МPEG-2 нормирует для всех трех уровней следующие номиналы

скоростей цифрового потока: 32, 48, 56, 64, 96, 112, 192, 256, 384 и

448 кбит/с. Частота дискретизации может составлять 32, 44,1 или 48 кГц, число уровней квантования входного сигнала - от 16 до 24. Стандартным входным сигналом для кодера МPEG-2 принят цифровой сигнал AES/EBU. Предусматриваются следующие режимы работы звукового кодера: 1) оди­ ночный канал (моно); 2) двойной канал (стерео или два моноканала); 3) joint stereo (сигнал с частичным разделением правого и левого каналов).

3.2.7. Алгоритмы сжатия звукоданных кодерами

различных уровней

Особенности работы кодера первого уровня

Рассмотрим более подробно работу кодера первого уровня (рис. 3.13) [14]. БФ обрабатывает одновременно 384 отсчета звукоданных и распределя­ ет их с соответствующей субдискретизацией в 32 полосы, по 12 отсчетов в

каждой полосе с частотой дискретизации 48/32 = 1,5 кГц. Длительность кадра

при частоте дискретизации 48 кГц составляет 8 мс. Упрощенная ПАМ оцени­

вает только частотное маскирование по наличию и «мгновенному» уровню

компонентов сигнала в каждой полосе. По результатам оценки для каждой полосы назначается как можно более грубое квантование, но так, чтобы шум квантования не превышал порога маскирования. Масштабирующие множи­

тели имеют разрядность 6 бит и перекрывают динамический диапазон 120 ДБ

с шагом 2 ДБ (26 = 64 ~120/2). В цифровом потоке передаются также 32 кода

распределения бит. Они имеют разрядность 4 бита и указывают на длину ко­

дового слова отсчета в данной полосе после переквантования.

В декодере (рис. 3.14) отсчеты каждой частотной полосы выделяются

демультиплексором и поступают на перемножитель, который восстанавли­

вает их первоначальный динамический диапазон. Перед этим восстанавли­ вается исходная разрядность отсчетов - отброшенные в квантователе младшие разряды заменяются нулями. Коды распределения бит помогают

демультиплексору разделить в последовательном потоке кодовые слова,

принадлежащие разным отсчетам и передаваемые кодом с переменной

длиной слова. Затем отсчеты всех 32 каналов подаются на синтезирующий

БФ, который проводит повышающую дискретизацию и расставляет отсчеты

должным образом во времени, восстанавливая исходную форму сигнала.

3.2. Международный стандарт кодирования с информационным сжатием МPEG-2

115

 

 

 

 

 

 

 

31

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Масштабирующее

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

32-полосный

 

1-----1

1-----1

Мультиплексор

-

 

~

 

БФ

 

 

 

 

устройство и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

квантовател ь

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

г-----.,

 

 

ПАМ

 

 

 

 

 

 

 

 

 

 

 

 

I

I

Распределение

 

 

 

 

 

 

Кодирование

 

 

 

L.I

БПФ ~

битов и масшта-

f-

 

 

 

~

дополнительной

 

 

 

 

 

 

 

I

512 точек I

 

бирующих

 

 

 

 

 

 

информации

 

 

 

I______

.JI

 

 

 

 

 

 

 

 

 

 

 

 

 

коэффициентов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 3.13. Структурная схема звукового кодера MPEG-2 первого

и второго уровней (пунктиром показан модуль быстрого преобразования Фурье (БПФ), добавляемый на втором уровне)

-

 

 

 

 

 

 

 

31

 

 

 

 

 

 

Восстановление

 

Инверсный

 

 

 

 

 

 

Демультиплексор

·

 

·

32-полосный

 

 

 

 

 

 

·

 

 

 

·

 

 

 

·

 

отсчетов

·

БФ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Декодер

 

 

 

 

 

 

 

 

 

дополнительной

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

информации

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 3.14. Структурная схема звукового декодера MPEG-2

первого и второго уровней

Принципы функционирования кодера второго уровня

В кодере второго уровня устранены основные недостатки базовой мо­

дели полосного кодирования, связанные с несоответствием критических

полос слуха и реальных полос БФ, из-за чего в низкочастотных участках

диапазона эффект маскирования практически не использовался. Величина

кадра увеличена втрое, до 24 мс при дискретизации 48 кГц, одновременно

обрабатываются уже 1152 отсчета (3 субкадра по 384 отсчета). В качестве

входного сигнала дЛЯ ПАМ используются не полосные сигналы с выхода

БФ, а спектральные коэффициенты, полученные в результате 512-точеч­

ного преобразования Фурье входного сигнала кодера. Благодаря увеличе­ нию и временн6й длительности кадра и точности спектрального анализа

эффективность работы ПАМ возрастает [14].

На втором уровне применен более сложный алгоритм распределения бит. Полосы с номерами от О до 1О обрабатываются с четырехразрядным кодом распределения (выбор любой из 15 шкал квантования), для полос с номерами от 11 до 22 выбор сокращается до 3 разрядов (выбор одной из 7

116 3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии

шкал), полосы с номерами от 23 до 26 предоставляют выбор одной из 3 шкал (двухбитовый код), а полосы с номерами от 27 до 31 (выше 20 кГц) не передаются. Если шкалы квантования, выбранные для всех блоков кадра,

оказываются одинаковыми, то номер шкалы передается только один раз.

Еще одно существенное отличие алгоритма второго уровня в том, что

не все масштабирующие множители передаются по каналу связи. Если различие множителей трех последовательных субкадров превышает 2 дБ не более чем в течение 10% времени, передается только один набор мно­ жителей и это дает экономию расходуемых бит. Если в данной полосе про­ исходят быстрые изменения уровня звука, передаются два или все три набо­ ра масштабирующих множителей. Соответственно декодер должен запоми­ нать номера выбранных шкал квантования и масштабирующие множители и применять их при необходимости к последующему субкадру.

Алгоритм сжатия звукоданных кодерами третьего уровня

Кодер Уровня III использует усовершенствованный алгоритм коди­ рования с дополнительным ДКП. Структурная схема кодера показана на

рис. 3.15 [14].

Основной недостаток кодеров второго уровня - неэффективная обра­

ботка быстро изменяющихся переходов и скачков уровня звука - устраняет­ ся благодаря введению двух видов блоков ДКП - «длинного» с 18 отсчета­ ми и «короткого» с 6 отсчетами. Выбор режима осуществляется адаптивно

путем переключения оконных функций в каждой из 32 частотных полос.

Длинные блоки обеспечивают лучшее частотное разрешение сигнала со стандартными характеристиками, в то время как короткие блоки улучшают обработку быстрых переходов. В одном кадре могут быть как длинные, так

и короткие блоки, однако общее число коэффициентов ДКП не изменяется,

так как вместо одного длинного передаются три коротких блока.

 

 

 

 

31

 

I

 

31

 

575

 

 

Q)

'::S:

 

 

 

 

ro

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I

 

 

 

 

 

 

 

 

 

 

 

 

 

 

'::s:

 

 

 

 

 

 

1::

О

 

 

 

Q)

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

'::s:

 

 

::I:

 

 

 

 

 

 

 

 

::s:

О

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

О

Q)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J5

 

 

~

::s:

 

 

 

 

 

 

U

~

 

 

 

::I:

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

::I:

 

 

О

:::1"

 

 

 

 

 

 

Q)

.:::::;

 

 

 

ro

1::

 

 

 

 

U

 

 

ro

~

 

 

 

 

 

 

::S:

1::[

 

 

 

ID

 

 

 

 

 

ое

 

 

~

::I:

 

 

 

 

 

 

::I:

,::s:

 

 

 

О

О

 

 

 

 

al..Q

 

 

1-

»

 

 

 

 

 

~

О

 

 

 

::s:

О

 

-

 

~

 

 

 

0-&

 

 

 

 

 

 

О

::I:

 

 

 

о...

'-

г--­

 

 

 

1::

 

 

 

 

 

 

 

 

 

 

 

2:

ID

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0...::I:

 

 

 

 

 

 

 

 

 

I

 

 

ro

,::s:

 

 

 

 

 

 

 

 

 

0...0

 

 

 

 

N

 

 

0...0

 

 

 

 

 

 

::s:

Q)

 

 

 

О

о...

 

 

 

 

М

 

 

::I:

 

 

 

 

 

1::[2:

 

 

 

e~

 

 

 

 

 

 

 

 

 

 

 

 

 

О Q)

1-----1

 

 

 

 

 

 

 

О

 

 

 

 

 

 

 

 

 

 

 

 

о

 

 

о

 

 

 

 

 

:::с:о...

 

 

 

 

:::1"

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

БПФ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4-

1024

1-----1

ПАМ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

точки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 3.15. Структурная схема звукового

кодера третьего уровня

3.2. Международный стандарт кодирования с информационным сжатием МPEG-2

117

Для улучшения кодирования применяются также следующие усовер­

шенствования:

1. Неравномерное квантование (квантователь возводит отсчеты в сте­ пень 3/4 перед квантованием для улучшения отношения сигнал/шум; соот­ ветственно, декодер возводит их в степень 4/3 для обратной линеаризации).

2. В отличие от кодеров первого и второго уровней, на третьем уровне масштабирующие множители присваиваются не каждой из 32 частотных полос БФ, а полосам масштабирования - участкам спектра, несвязанным с

этими полосами и примерно соответствующим критическим полосам.

3. Энтропийное кодирование квантованных коэффициентов кодом Хаффмана.

4. Наличие «резервуара бит» - запаса, который кодер создает в перио­

ды стационарного входного сигнала.

Улучшение частотного разрешения при введении дополнительного

ДКП влечет за собой значительное ухудшение временн6го разрешения, проявляющееся в виде пред-эхо. В кодере имеются средства для борьбы с этим явлением. Во-первых, ПАМ модифицирована для обнаружения усло­

вий возникновения пред-эхо, во-вторых, имеется резервуар неиспользо­

ванных бит, из которого кодер может занять на короткое время необходи­ мые ему биты для снижения шумов квантования, в-третьих, кодер может переключаться в режим коротких блоков.

Существенное отличие кодера третьего уровня от кодеров нижних уровней - сложный адаптивный алгоритм распределения бит. Он включает

две вложенные одна в другую итерационные петли: внутреннюю - петлю

скорости потока, и внешнюю - петлю управления шумами квантования.

Расчет параметров кодирования начинается со значения масштабирующего множителя, равного 1. Если в первый момент скорость потока на выходе

кодера Хаффмана превышает заданную, увеличивается шаг квантования до

тех пор, пока скорость не войдет в заданные пределы. Далее рассчитывает­

ся шум квантования в данной частотной полосе и сравнивается с порогом

маскирования, сообщенным психоакустической моделью. Масштабирую­ щий множитель изменяется таким образом, чтобы сблизить эти значения. Однако новое значение масштабирующего множителя означает изменение

шага квантования и, следовательно, скорости потока, а потому внутренняя

петля должна каждый раз отрабатывать и вычислять новое значение коэф­ фициента усиления и шага квантования. Если итерационный процесс во

внутренней петле всегда сходится, то во внешней петле он может расхо­

диться. Итерационный процесс заканчивается в одном из трех случаев:

1. Шумы квантования во всех полосах масштабирования не превыша­

ют допустимых.

2. Следующая итерация приведет к возрастанию усиления в одной из

полос выше допустимого.

3. Очередная итерация требует увеличения усиления во всех полосах масштабирования.

118

 

3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕНИИ

 

 

 

 

 

 

 

 

 

 

 

 

 

Заголовок

CRC

Распределе-

Масштабирую-

Группа

Группа

 

Группа

Дополни­

 

 

 

тельные

 

 

 

 

 

ние бит

щие множители

1

2

 

12

данные

 

Скорость

ФлагID Уровень потока

Синхрослово

12 битов

Частота дискретизации

Рис. 3.16. Структура потока звукового кодера 1 и 11 уровней

в реальных кодерах накладывается еще и временн6е ограничение.

Кодер третьего уровня более полно обрабатывает стереосигнал в формате joint stereo. Если кодеры нижележащих уровней работают только

в режиме кодирования по интенсивности, когда левый и правый каналы в

полосах выше 2 кГц кодируются как один сигнал (но снезависимыми масштабирующими множителями), кодер третьего уровня может работать

и в режиме «сумма-разность», обеспечивая более высокую степень сжатия

разностного канала.

При одной и той же скорости передачи двоичных символов в выход­ ном потоке данных кодирование более высокого уровня обеспечивает бо­

лее высокое качество воспроизводимого звука.

Это обусловлено тем, что более точно учитываются свойства сжимае­ мого сигнала, более гибко изменяются параметры квантования, а на уровне Layer III значительно повышается разрешающая способность по частоте.

Структура элементарных потоков звукоданных несколько различается для разных уровней. На рис. 3.16 показана последовательность звукодан­ ных Уровня 1. Пакет начинается с заголовка длиной 32 бита, имеющего

одинаковую структуру для всех уровней, который включает синхрослово

из 12 единиц и более десятка указателей и флагов. Флаг ID указывает при­ надлежность потока (<<О» - МPEG-2), флаг уровня идентифицирует уро­ вень кодирования (<<01» = 1, «10» = 2, «11» = 3), четырехбитовый указатель

скорости потока ссылается на стандартизованную таблицу, где перечисле­ ны возможные скорости потока, табулированы также значения частоты

дискретизации, которые сообщает соответствующий указатель (для МPEG-2 48,44,1 и 32 кГц), флаг режима определяет число каналов звука.

Следующее поле после заголовка занимают коды распределения бит, затем в потоке передаются 32 масштабирующих множителя и 384 отсчета

звукового кадра, группами по 32 отсчета (по одному отсчету из каждого поддиапазона). Замыкает пакет поле дополнительных данных переменной длины, используемое в стандарте МPEG-2 дЛЯ передачи многоканальных

сигналов, отсчетов с пониженной частотой дискретизации.

Отличие формата Уровня II ОТ Уровня 1 незначительно и заключается в передаче дополнительной информации о выборе шкалы квантования для ка-