- •3. Практическое использование видеокомпрессии в телевидении
- •3.1. Задача сжатия информации и пути ее решения
- •3.2. Международный стандарт кодирования с информационным сжатием mpeg-2
- •3.2.1. Профили и уровни стандарта кодирования mpeg-2
- •Профили, уровни, согласованные точки стандарта mpeg-2
- •3.2.2. Компрессия видеоданных
- •3.2.3. Кодируемые кадры
- •3.2.4. Компенсация движения
- •3.2.5. Использование дкп в стандарте кодирования mpeg-2
- •Матрица квантования яркостного сигнала для блоков изображений I-кадров
- •Матрица квантования цветоразностных сигналов для блоков изображений I-кадров
- •3.2.6. Сжатие звукоданных Эффект маскирования и психоакустическая модель слуха
- •П Рис. 3.10.Проявление временнóго маскированияолосное кодирование и блок фильтров
- •Квантование и распределение бит
- •Уровни обработки звукоданных
- •3.2.7. Алгоритмы сжатия звукоданных кодерами различных уровней Особенности работы кодера первого уровня
- •Принципы функционирования кодера второго уровня
- •Алгоритм сжатия звукоданных кодерами третьего уровня
- •3.2.8. Реализация цифрового многоканального звука, поддерживаемая стандартом mpeg-2
- •Иерархия многоканальных звуковых систем согласно Рекомендации bs.775
- •Система улучшенного кодирования звука аас
- •3.2.9. Формирование транспортного потока данных в устройствах кодирования mpeg-2 Структура транспортного потока
- •Значения идентификаторов piDдля потока информацииSi
- •3.2.10. Качество телевизионных изображений при кодировании по стандарту mpeg-2
- •3.3. Стандарт представления медиа-объектов mpeg-4
- •3.3.1. Описание сцены в стандарте mpeg-4
- •3.3.2. Принципы доставки потоков данных
- •3.3.3. Кодирование визуальных объектов
- •3.3.4. Кодирование звуковых объектов
- •3.3.5. Профили и уровни стандарта mpeg-4
- •Профили и типы объектов mpeg-4 видео
- •Параметры потока для некоторых профилей mpeg-4 видео
- •Параметры предлагаемого студийного профиля стандарта mpeg-4
- •Требования к декодеру звука масштабируемого профиля
- •Профили и типы объектов mpeGаудио
- •Профили графических средств и описаний сцены в mpeg-4
- •3.3.6. Идентификация и защита интеллектуальной собственности
- •3.4. Стандарт кодированного представления визуальной информации н.264/avCилиMpeg-4Part10
- •3.4.1. Структура стандарта видеокомпрессии н.264 Основные механизмы кодирования, используемые в стандарте н.264
- •Формирование закодированных снимков
- •Моды слоев стандарта н.264
- •Синтаксис элементов макроблока
- •Используемые типы карт распределения макроблоков по группам слоев
- •Профили, используемые стандартом н.264
- •Формат закодированных данных
- •3.4.2. Базовый профиль Особенности кодирования, обусловленные базовым профилем
- •Использование ссылочных снимков
- •Мгновенная очистка буфера декодера
- •Лишний кодированный снимок
- •Произвольный порядок слоев
- •Прогнозирование макроблоков
- •Древовидная структура компенсации движения
- •Предсказание векторов движения
- •Прогноз в моде intra
- •Деблочный фильтр
- •Условия фильтрации
- •Преобразование и квантование
- •3.4.3. Основной профиль Особенности кодирования в основном профиле
- •Ссылочные снимки
- •Опции прогноза
- •Опции прогнозов для макроблоков в-слоев
- •Двунаправленный прогноз
- •Прямой прогноз
- •Чересстрочная развертка
- •Контекстно-адаптивное арифметическое кодирование (савас)
- •Экспоненциальные коды Голомба
- •Процесс кодирования
- •Контекстные модели для первого бита
- •Контекстные модели
- •Контекстные модели
- •Модуль арифметического кодирования
- •3.4.4. Расширенный профиль
- •Слои sPиSi
- •Слои деления данных
- •3.4.5. Транспортный механизм стандарта н.264 Структура кодированной видеопоследовательности
- •Элементы rbsp
- •Параметрические множества
- •Передача и хранение единиц nal
- •3.4.6. Кодек стандарта н.264
- •3.5. Стандарт описания мультимедийной информации mpeg-7
- •3.5.1. Общие сведения о стандарте mpeg-7
- •3.5.2. Основные части стандарта mpeg-7
- •3.5.3. Описание главных функций стандарта mpeg-7 Системы стандарта mpeg-7
- •Язык описания определений mpeg-7
- •Аудио mpeg-7
- •Визуальный mpeg-7
- •Основные объекты и схемы описания мультимедиа mpeg-7
- •Эталонные программы mpeg-7: модель экспериментов (eXperimentationModel)
- •3.5.4. Области применения стандарта mpeg-7
- •Контрольные вопросы
3.3. Стандарт представления медиа-объектов mpeg-4
3.3.1. Описание сцены в стандарте mpeg-4
Для описания сцены и ее динамического изменения в MPEG-4 используется специально разработанный двоичный язык BIFS (Binary Format for Scenes – двоичный формат описания сцен). Описание сцены указывает декодеру, где и когда воспроизводить объекты, входящие в сцену, и как реагировать на воздействие пользователя. Чтобы увязать ЭП с медиа-объектами в сцене, используются дескрипторы объекта. Они переносят информацию о числе и свойствах ЭП, связанных с конкретными медиа-объектами. Сами дескрипторы также переносятся в одном или нескольких ЭП, поэтому нетрудно добавить или удалить объект во время сеанса. Потоки дескрипторов могут рассматриваться как описания потоковых ресурсов для представления, а описание сцены служит для изменения пространственно-временнóго размещения объектов в сцене. MPEG-4 определил специальный язык синтаксических описаний для точного описания синтаксиса потоков, переносящих информацию о медиа-объектах и описания сцен. Он представляет собой расширение языка С++ и позволяет дать точное описание синтаксиса и в то же время упростить проверку на соответствие.
BIFSоперирует двумя протоколами модификации сцены во времени – командным (BIFS-Command) и анимационным (BIFS-Anim) [31]. Командные потокиBIFSпозволяют загружать новую сцену, изменять свойства объектов, вводить и уничтожать объекты. ПотокиBIFS-Animуправляют процессами анимации сцены, например, изменением точки взгляда, перемещением, трансформацией размера, плавным изменением цвета, освещенности и т.д. Синхронизация потоков осуществляется путем временнóй привязки. Как и в предыдущих стандартахMPEG, один вид временнóй метки обеспечивает синхронизацию тактовых частот кодера и декодера, метки другого вида, привязанные к функциональным единицам аудиовизуальных данных, содержат желаемое время декодирования (для единиц доступа) или время завершения компоновки (для компоновочных единиц).
Основные принципы BIFSзаимствованы из языкаVRML(VirtualRealityModelingLanguage–язык моделирования виртуальной реальности), разработанного для создания 3Dграфики. Это широко распространенный и в значительной степени бесплатный язык программирования, точнее, эффективный 3Dформат обмена, как бы объемный аналогHTML. Дело в том, что некоторые виды информации лучше воспринимаются в объемном виде – игры, результаты научных исследований, архитектурные решения.VRMLобеспечивает интеграцию трехмерных, двумерных, текстовых и мультимедийных объектов в связную модель. Он оперирует объектами, каждый из которых имеет различныеатрибуты. Объект называетсяузлом, а атрибуты –полями. Число полей зависит от типа узла. Полный перечень узлов и полей известен какграф(разветвленная древообразная структура).VRMLвключает большинство используемых в 3Dприложениях средств: иерархические трансформации, источники света, выбор точки взгляда, анимацию, свойства материала, отображение текстуры и т.д.
Язык BIFSпозаимствовал уVRMLструктуру описания сцены в виде графа, модели поведения, графические примитивы для построения 3D-изображений: конусы, сферы, сетки, текстовые примитивы, текстурирование и подсветку (всего их 36). В то же времяBIFSимеет существенные отличия отVRML, в него внесены новые решения:
1) VRML–язык высокого уровня,BIFS–двоичный, благодаря этому объем сообщений в нем в 10…15 раз меньше, чем вVRML; хотя объем описаний сцены обычно меньше, чем аудиовизуальной информации, эти описания передаются непрерывно и могут в результате составить заметную часть передаваемых данных, поэтому сжатие потоковBIFSдостаточно актуально;
2) VRMLработает с файлами, предварительно загружаемыми в процессор,aBIFSпредназначен в первую очередь для потоковой передачи в реальном времени;
3) BIFSпозволяет работать как с 2D, так и с 3D объектами, осуществлять масштабирование, перемещение, вращение, более того, впервые решена задача представления в одной сцене и 2D, и 3D объектов.
Во второй версии стандарта в нем расширен BIFS, введены спецификации языковHTML4.0 иMPEG-J, спецификация файла .mр4 для хранения и транспортировки данныхMPEG-4 [32]. Новая версияBIFSпредусматривает анимацию фигуры, улучшенную модель направленности источника звука, модель окружающей звуковой среды в интерактивной виртуальной сцене, учитывающую отражение звука от стен помещения (реверберацию, эффект Доплера, наличие препятствия между источником звука и пользователем), введение иерархических 3D сеток.
