- •3. Практическое использование видеокомпрессии в телевидении
- •3.1. Задача сжатия информации и пути ее решения
- •3.2. Международный стандарт кодирования с информационным сжатием mpeg-2
- •3.2.1. Профили и уровни стандарта кодирования mpeg-2
- •Профили, уровни, согласованные точки стандарта mpeg-2
- •3.2.2. Компрессия видеоданных
- •3.2.3. Кодируемые кадры
- •3.2.4. Компенсация движения
- •3.2.5. Использование дкп в стандарте кодирования mpeg-2
- •Матрица квантования яркостного сигнала для блоков изображений I-кадров
- •Матрица квантования цветоразностных сигналов для блоков изображений I-кадров
- •3.2.6. Сжатие звукоданных Эффект маскирования и психоакустическая модель слуха
- •П Рис. 3.10.Проявление временнóго маскированияолосное кодирование и блок фильтров
- •Квантование и распределение бит
- •Уровни обработки звукоданных
- •3.2.7. Алгоритмы сжатия звукоданных кодерами различных уровней Особенности работы кодера первого уровня
- •Принципы функционирования кодера второго уровня
- •Алгоритм сжатия звукоданных кодерами третьего уровня
- •3.2.8. Реализация цифрового многоканального звука, поддерживаемая стандартом mpeg-2
- •Иерархия многоканальных звуковых систем согласно Рекомендации bs.775
- •Система улучшенного кодирования звука аас
- •3.2.9. Формирование транспортного потока данных в устройствах кодирования mpeg-2 Структура транспортного потока
- •Значения идентификаторов piDдля потока информацииSi
- •3.2.10. Качество телевизионных изображений при кодировании по стандарту mpeg-2
- •3.3. Стандарт представления медиа-объектов mpeg-4
- •3.3.1. Описание сцены в стандарте mpeg-4
- •3.3.2. Принципы доставки потоков данных
- •3.3.3. Кодирование визуальных объектов
- •3.3.4. Кодирование звуковых объектов
- •3.3.5. Профили и уровни стандарта mpeg-4
- •Профили и типы объектов mpeg-4 видео
- •Параметры потока для некоторых профилей mpeg-4 видео
- •Параметры предлагаемого студийного профиля стандарта mpeg-4
- •Требования к декодеру звука масштабируемого профиля
- •Профили и типы объектов mpeGаудио
- •Профили графических средств и описаний сцены в mpeg-4
- •3.3.6. Идентификация и защита интеллектуальной собственности
- •3.4. Стандарт кодированного представления визуальной информации н.264/avCилиMpeg-4Part10
- •3.4.1. Структура стандарта видеокомпрессии н.264 Основные механизмы кодирования, используемые в стандарте н.264
- •Формирование закодированных снимков
- •Моды слоев стандарта н.264
- •Синтаксис элементов макроблока
- •Используемые типы карт распределения макроблоков по группам слоев
- •Профили, используемые стандартом н.264
- •Формат закодированных данных
- •3.4.2. Базовый профиль Особенности кодирования, обусловленные базовым профилем
- •Использование ссылочных снимков
- •Мгновенная очистка буфера декодера
- •Лишний кодированный снимок
- •Произвольный порядок слоев
- •Прогнозирование макроблоков
- •Древовидная структура компенсации движения
- •Предсказание векторов движения
- •Прогноз в моде intra
- •Деблочный фильтр
- •Условия фильтрации
- •Преобразование и квантование
- •3.4.3. Основной профиль Особенности кодирования в основном профиле
- •Ссылочные снимки
- •Опции прогноза
- •Опции прогнозов для макроблоков в-слоев
- •Двунаправленный прогноз
- •Прямой прогноз
- •Чересстрочная развертка
- •Контекстно-адаптивное арифметическое кодирование (савас)
- •Экспоненциальные коды Голомба
- •Процесс кодирования
- •Контекстные модели для первого бита
- •Контекстные модели
- •Контекстные модели
- •Модуль арифметического кодирования
- •3.4.4. Расширенный профиль
- •Слои sPиSi
- •Слои деления данных
- •3.4.5. Транспортный механизм стандарта н.264 Структура кодированной видеопоследовательности
- •Элементы rbsp
- •Параметрические множества
- •Передача и хранение единиц nal
- •3.4.6. Кодек стандарта н.264
- •3.5. Стандарт описания мультимедийной информации mpeg-7
- •3.5.1. Общие сведения о стандарте mpeg-7
- •3.5.2. Основные части стандарта mpeg-7
- •3.5.3. Описание главных функций стандарта mpeg-7 Системы стандарта mpeg-7
- •Язык описания определений mpeg-7
- •Аудио mpeg-7
- •Визуальный mpeg-7
- •Основные объекты и схемы описания мультимедиа mpeg-7
- •Эталонные программы mpeg-7: модель экспериментов (eXperimentationModel)
- •3.5.4. Области применения стандарта mpeg-7
- •Контрольные вопросы
Матрица квантования яркостного сигнала для блоков изображений I-кадров
|
8 |
16 |
19 |
22 |
26 |
27 |
29 |
34 |
|
16 |
16 |
22 |
24 |
27 |
29 |
34 |
37 |
|
19 |
22 |
26 |
27 |
29 |
34 |
34 |
38 |
|
22 |
22 |
26 |
27 |
29 |
34 |
37 |
40 |
|
22 |
26 |
27 |
29 |
32 |
35 |
40 |
48 |
|
26 |
27 |
29 |
32 |
35 |
40 |
48 |
58 |
|
26 |
27 |
29 |
34 |
38 |
46 |
56 |
69 |
|
27 |
29 |
35 |
38 |
46 |
56 |
69 |
83 |
Таблица 3.3
Матрица квантования цветоразностных сигналов для блоков изображений I-кадров
|
17 |
18 |
24 |
47 |
99 |
99 |
99 |
99 |
|
18 |
21 |
26 |
66 |
99 |
99 |
99 |
99 |
|
24 |
26 |
56 |
99 |
99 |
99 |
99 |
99 |
|
47 |
66 |
99 |
99 |
99 |
99 |
99 |
99 |
|
99 |
99 |
99 |
99 |
99 |
99 |
99 |
99 |
|
99 |
99 |
99 |
99 |
99 |
99 |
99 |
99 |
|
99 |
99 |
99 |
99 |
99 |
99 |
99 |
99 |
|
99 |
99 |
99 |
99 |
99 |
99 |
99 |
99 |
При декодировании на приемной стороне коэффициенты матрицы ДКП, значения которых были переданы по каналам связи, умножаются на элементы матрицы квантования, что восстанавливает верные значения коэффициентов, но с ошибкой округления, значение которой мало для низкочастотных компонентов блока отсчетов изображения, но велико для высокочастотных.
Для увеличения степени сжатия необходимо повышать значения коэффициентов в таблицах квантования. С целью передачи приемным телевизионным устройствам таблицы (матрицы) квантования записываются в файлы вместе со сжатыми видеоданными.
Массив коэффициентов, извлекаемых из матрицы ДКП, содержит некоторое количество нулевых значений. Для того чтобы способствовать объединению нулевых элементов в группы и преобразованию в одномерную последовательность, используется зигзагообразное сканирование матрицы, начиная с левого верхнего угла. В этом случае коэффициенты выстраиваются в порядке возрастания частот, причем если пространственные частоты одинаковы, то впереди следуют коэффициенты для меньших вертикальных частот. Зигзаг-сканирование (z-упорядочивание) позволяет сгруппировать самый большой массив нулевых коэффициентов, обычно располагающийся в правой нижней части блока ДКП.
П
Рис. 3.7. Графическое
представление процесса ДКП,
квантования
и зигзагообразного сканирования в
аппаратуре
кодирования по стандартуMPEG-2
Последний алгоритм сокращения избыточности связан с кодами, образующими комбинации переменной длительности (VLC – Variable Length Code). При этом те коэффициенты ДКП, которые повторяются наиболее часто, кодируются короткими кодовыми комбинациями, а редкие значения коэффициентов – более длинными (по этому же принципу построена азбука Морзе).
Для экономного представления двоичных сообщений в стандарте MPEG-2 используетсякод Хаффмана,позволяющий практически в 1,22 раза сократить поток данных по сравнению с равномерным кодированием. Покажем принцип построения кода Хаффмана на простом примере. Пусть алфавит источника насчитывает четыре символаa,b,c,dс вероятностями появления соответственно 0,5, 0,25, 0,125, 0,125. Если каждому из символов присвоить двухбитовые значения 00, 01, 10, 11 средняя длина кодового слова составит, очевидно, 2 бита на символ. Присвоим теперь символуaзначение 0, символуb– значение 10, символамсиd– значения соответственно 110 и 111. Нетрудно рассчитать, что в среднем для передачи одного символа расходуется 10,5 + 20,25 +230,125 = 1,75 бит. Хотя максимальная длина символа возросла, число бит, требуемых для передачи сообщения, сократилось. По своей эффективностирассматриваемый код приближается к теоретическому пределу расхода бит и поэтому называется энтропийным. Адаптивная версия кода Хаффмана применяется в том случае, когда вероятность появления кодовых слов изменяется в процессе передачи. При кодировании символов сообщения комбинациями переменной длины обычно возникает проблема отделения одной комбинации от другой. КодХаффмана обладает свойством префиксности, то есть ни одна его кодовая комбинация не является началом другой комбинации, что позволяет обойтись в тексте кодированного сообщения без разделителей между комбинациями.
К группе энтропийных относится и арифметический код. Процедура кодирования состоит в том, что всей совокупности символов сообщения ставится в соответствие интервал [0, 1], который разбивается на участки, соответствующие исходным вероятностям символов, и это разбиение сообщается декодеру. После поступления очередного символа интервал пересчитывается на новые пределы, соответствующие вероятности появления этого символа, и вновь разбивается пропорционально исходным вероятностям. С наступлением каждого нового символа размер интервала уменьшается, причем в строгом соответствии с вероятностями символов. Более часто встречающиеся символы меньше сужают интервал, чем редкие, и добавляют меньше бит в код интервала. По окончании цикла кодирования формируется некоторый, весьма узкий интервал, однозначно характеризующий передаваемую последовательность символов, и она легко может быть восстановлена в декодере по любому числу из этого интервала.
Энтропийный кодер в устройстве кодирования с информационным сжатием MPEG-2 должен иметь многокадровый буферный накопитель, в котором происходит накопление данных для их оптимального использования. Например, в случае, если содержание изображения изменяется с очень большой интенсивностью, возможно изменение скорости передачи данных для сохранения соответствующего качества изображения. Однако на практике при передаче и распределении телевизионных программ колебания скорости передачи данных могут быть недопустимы. В этом случае используется режим работы энтропийного кодера, при котором обеспечивается фиксированная скорость выходного потока данных. Для чего данные заносятся в буферный накопитель с переменной скоростью, а считываются с постоянной. Для предотвращения переполнения буферного накопителя или полного стирания информации в нем, что может привести к сбоям в работе системы видеокомпрессии, используется адаптивное квантование. Сведения о степени заполнения буферной памяти служат сигналом управления, регулирующим шкалу квантования. Если, например, кодируемое изображение характеризуется высокой детальностью, то число ненулевых элементов матриц коэффициентов ДКП увеличивается. Возрастает и объем передаваемых данных, поэтому буферный накопитель заполняется с повышенной скоростью. Благодаря обратной связи (через регулятор скорости потока данных, см. рис. 3.1) квантование становится более грубым и скорость поступления данных в буферную память уменьшается, но за счет увеличения шумов квантования и ухудшения качества изображения. Если кодируется простое по структуре изображение с малой детальностью, то число нулевых элементов сигнальных матриц коэффициентов ДКП увеличивается и скорость поступления данных в буферную память снижается по сравнению со средней величиной. Тогда квантование становится менее грубым (большое число коэффициентов ДКП квантуется на максимальное число уровней). Таким образом, скорость заполнения буферного накопителя в среднем поддерживается на постоянном уровне.
О
Рис. 3.8.Графическое представление структуры
декодирования в декодерахMPEG-2
На приемном конце упрощенная структура декодирования графически может быть представлена рис. 3.8.
