- •3. Практическое использование видеокомпрессии в телевидении
- •3.1. Задача сжатия информации и пути ее решения
- •3.2. Международный стандарт кодирования с информационным сжатием mpeg-2
- •3.2.1. Профили и уровни стандарта кодирования mpeg-2
- •Профили, уровни, согласованные точки стандарта mpeg-2
- •3.2.2. Компрессия видеоданных
- •3.2.3. Кодируемые кадры
- •3.2.4. Компенсация движения
- •3.2.5. Использование дкп в стандарте кодирования mpeg-2
- •Матрица квантования яркостного сигнала для блоков изображений I-кадров
- •Матрица квантования цветоразностных сигналов для блоков изображений I-кадров
- •3.2.6. Сжатие звукоданных Эффект маскирования и психоакустическая модель слуха
- •П Рис. 3.10.Проявление временнóго маскированияолосное кодирование и блок фильтров
- •Квантование и распределение бит
- •Уровни обработки звукоданных
- •3.2.7. Алгоритмы сжатия звукоданных кодерами различных уровней Особенности работы кодера первого уровня
- •Принципы функционирования кодера второго уровня
- •Алгоритм сжатия звукоданных кодерами третьего уровня
- •3.2.8. Реализация цифрового многоканального звука, поддерживаемая стандартом mpeg-2
- •Иерархия многоканальных звуковых систем согласно Рекомендации bs.775
- •Система улучшенного кодирования звука аас
- •3.2.9. Формирование транспортного потока данных в устройствах кодирования mpeg-2 Структура транспортного потока
- •Значения идентификаторов piDдля потока информацииSi
- •3.2.10. Качество телевизионных изображений при кодировании по стандарту mpeg-2
- •3.3. Стандарт представления медиа-объектов mpeg-4
- •3.3.1. Описание сцены в стандарте mpeg-4
- •3.3.2. Принципы доставки потоков данных
- •3.3.3. Кодирование визуальных объектов
- •3.3.4. Кодирование звуковых объектов
- •3.3.5. Профили и уровни стандарта mpeg-4
- •Профили и типы объектов mpeg-4 видео
- •Параметры потока для некоторых профилей mpeg-4 видео
- •Параметры предлагаемого студийного профиля стандарта mpeg-4
- •Требования к декодеру звука масштабируемого профиля
- •Профили и типы объектов mpeGаудио
- •Профили графических средств и описаний сцены в mpeg-4
- •3.3.6. Идентификация и защита интеллектуальной собственности
- •3.4. Стандарт кодированного представления визуальной информации н.264/avCилиMpeg-4Part10
- •3.4.1. Структура стандарта видеокомпрессии н.264 Основные механизмы кодирования, используемые в стандарте н.264
- •Формирование закодированных снимков
- •Моды слоев стандарта н.264
- •Синтаксис элементов макроблока
- •Используемые типы карт распределения макроблоков по группам слоев
- •Профили, используемые стандартом н.264
- •Формат закодированных данных
- •3.4.2. Базовый профиль Особенности кодирования, обусловленные базовым профилем
- •Использование ссылочных снимков
- •Мгновенная очистка буфера декодера
- •Лишний кодированный снимок
- •Произвольный порядок слоев
- •Прогнозирование макроблоков
- •Древовидная структура компенсации движения
- •Предсказание векторов движения
- •Прогноз в моде intra
- •Деблочный фильтр
- •Условия фильтрации
- •Преобразование и квантование
- •3.4.3. Основной профиль Особенности кодирования в основном профиле
- •Ссылочные снимки
- •Опции прогноза
- •Опции прогнозов для макроблоков в-слоев
- •Двунаправленный прогноз
- •Прямой прогноз
- •Чересстрочная развертка
- •Контекстно-адаптивное арифметическое кодирование (савас)
- •Экспоненциальные коды Голомба
- •Процесс кодирования
- •Контекстные модели для первого бита
- •Контекстные модели
- •Контекстные модели
- •Модуль арифметического кодирования
- •3.4.4. Расширенный профиль
- •Слои sPиSi
- •Слои деления данных
- •3.4.5. Транспортный механизм стандарта н.264 Структура кодированной видеопоследовательности
- •Элементы rbsp
- •Параметрические множества
- •Передача и хранение единиц nal
- •3.4.6. Кодек стандарта н.264
- •3.5. Стандарт описания мультимедийной информации mpeg-7
- •3.5.1. Общие сведения о стандарте mpeg-7
- •3.5.2. Основные части стандарта mpeg-7
- •3.5.3. Описание главных функций стандарта mpeg-7 Системы стандарта mpeg-7
- •Язык описания определений mpeg-7
- •Аудио mpeg-7
- •Визуальный mpeg-7
- •Основные объекты и схемы описания мультимедиа mpeg-7
- •Эталонные программы mpeg-7: модель экспериментов (eXperimentationModel)
- •3.5.4. Области применения стандарта mpeg-7
- •Контрольные вопросы
Алгоритм сжатия звукоданных кодерами третьего уровня
Кодер Уровня III использует усовершенствованный алгоритм кодирования с дополнительным ДКП. Структурная схема кодера показана на рис. 3.15 [14].
Основной недостаток кодеров второго уровня – неэффективная обработка быстро изменяющихся переходов и скачков уровня звука – устраняется благодаря введению двух видов блоков ДКП – «длинного» с 18 отсчетами и «короткого» с 6 отсчетами. Выбор режима осуществляется адаптивно путем переключения оконных функций в каждой из 32 частотных полос. Длинные блоки обеспечивают лучшее частотное разрешение сигнала со стандартными характеристиками, в то время как короткие блоки улучшают обработку быстрых переходов. В одном кадре могут быть как длинные, так и короткие блоки, однако общее число коэффициентов ДКП не изменяется, так как вместо одного длинного передаются три коротких блока.

Рис. 3.15.Структурная схема звукового кодера третьего уровня
Для улучшения кодирования применяются также следующие усовершенствования:
1. Неравномерное квантование (квантователь возводит отсчеты в степень 3/4 перед квантованием для улучшения отношения сигнал/шум;соответственно, декодер возводит их в степень4/3 для обратной линеаризации).
2. В отличие от кодеров первого и второго уровней, на третьем уровне масштабирующие множители присваиваются не каждой из 32 частотных полос БФ, а полосам масштабирования – участкам спектра, несвязанным с этими полосами и примерно соответствующим критическим полосам.
3. Энтропийное кодирование квантованных коэффициентов кодом Хаффмана.
4. Наличие «резервуара бит» – запаса, который кодер создает в периоды стационарного входного сигнала.
Улучшение частотного разрешения при введении дополнительного ДКП влечет за собой значительное ухудшение временнóго разрешения, проявляющееся в виде пред-эхо. В кодере имеются средства для борьбы с этим явлением. Во-первых, ПАМ модифицирована для обнаружения условий возникновения пред-эхо, во-вторых, имеется резервуар неиспользованных бит, из которого кодер может занять на короткое время необходимые ему биты для снижения шумов квантования, в-третьих, кодер может переключаться в режим коротких блоков.
Существенное отличие кодера третьего уровня от кодеров нижних уровней – сложный адаптивный алгоритм распределения бит. Он включает две вложенные одна в другую итерационные петли: внутреннюю – петлю скорости потока, и внешнюю –петлю управления шумами квантования. Расчет параметров кодирования начинается со значения масштабирующего множителя, равного 1. Если в первый момент скорость потока на выходе кодера Хаффмана превышает заданную, увеличивается шаг квантования до тех пор, пока скорость не войдет в заданные пределы. Далее рассчитывается шум квантования в данной частотной полосе и сравнивается с порогом маскирования, сообщенным психоакустической моделью. Масштабирующий множитель изменяется таким образом, чтобы сблизить эти значения. Однако новое значение масштабирующего множителя означает изменение шага квантования и, следовательно, скорости потока, а потому внутренняя петля должна каждый раз отрабатывать и вычислять новое значение коэффициента усиления и шага квантования. Если итерационный процесс во внутренней петле всегда сходится, то во внешней петле он может расходиться. Итерационный процесс заканчивается в одном из трех случаев:
1. Шумы квантования во всех полосах масштабирования не превышают допустимых.
2. Следующая итерация приведет к возрастанию усиления в одной из полос выше допустимого.
3. Очередная итерация требует увеличения усиления во всех полосах масштабирования.

Рис. 3.16.Структура потока звукового кодераIиIIуровней
В реальных кодерах накладывается еще и временное ограничение.
Кодер третьего уровня более полно обрабатывает стереосигнал в формате jointstereo. Если кодеры нижележащих уровней работают только в режиме кодирования по интенсивности, когда левый и правый каналы в полосах выше 2 кГц кодируются как один сигнал (но с независимыми масштабирующими множителями), кодер третьего уровня может работать и в режиме «сумма-разность», обеспечивая более высокую степень сжатия разностного канала.
При одной и той же скорости передачи двоичных символов в выходном потоке данных кодирование более высокого уровня обеспечивает более высокое качество воспроизводимого звука.
Это обусловлено тем, что более точно учитываются свойства сжимаемого сигнала, более гибко изменяются параметры квантования, а на уровне LayerIIIзначительно повышается разрешающая способность по частоте.
Структура элементарных потоков звукоданных несколько различается для разных уровней. На рис. 3.16 показана последовательность звукоданных Уровня I. Пакет начинается с заголовка длиной 32 бита, имеющего одинаковую структуру для всех уровней, который включает синхрослово из 12 единиц и более десятка указателей и флагов. ФлагIDуказывает принадлежность потока («0» –MPEG-2), флаг уровня идентифицирует уровень кодирования («01» = 1, «10» = 2, «11» = 3), четырехбитовый указатель скорости потока ссылается на стандартизованную таблицу, где перечислены возможные скорости потока, табулированы также значения частотыдискретизации, которые сообщает соответствующий указатель (для MPEG-248, 44,1 и 32 кГц), флаг режима определяет число каналов звука.
Следующее поле после заголовка занимают коды распределения бит, затем в потоке передаются 32 масштабирующих множителя и 384 отсчета звукового кадра, группами по 32 отсчета (по одному отсчету из каждого поддиапазона). Замыкает пакет поле дополнительных данных переменной длины, используемое в стандарте MPEG-2 для передачи многоканальных сигналов, отсчетов с пониженной частотой дискретизации.
Отличие формата Уровня II от Уровня I незначительно и заключается в передаче дополнительной информации о выборе шкалы квантования для каждой из 32 полос, так как не все масштабирующие множители могут передаваться в потоке. Более сложная структура пакета у кодера третьего уровня. Здесь для каждого звукового кадра передаются заголовок, дополнительная информация и основные данные, причем неиспользованная часть области основных данных предшествующих кадров (резервуар бит) может быть заимствована последующим кадром, испытывающим нехватку бит (рис. 3.17).
Рис. 3.17.Структура потока звукового кодераIIIуровня
