Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебники / Цифровое телевизионное вещание под редакцией Г. В. Мамчев, 2014

.pdf
Скачиваний:
3
Добавлен:
29.05.2026
Размер:
20.33 Mб
Скачать

140

3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕНИИ

 

L..Q

31

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-5

30,5

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

:.:

30

 

\.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~ 29,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

"\.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

29

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

28,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

"

'"

 

I~

 

 

 

 

 

 

 

 

 

 

 

 

~

28

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

"'

-

 

 

 

 

 

 

 

 

 

 

 

 

u

27,5

 

 

 

-....

 

 

 

 

 

 

 

 

 

 

 

~

27

 

 

 

 

 

 

1'--..2

 

 

 

 

 

 

 

 

 

~

26,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

........

.......

 

 

 

---

 

 

 

 

24,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

:3

26

 

 

 

 

 

 

 

 

 

 

 

.........

 

.........

 

 

 

 

~

25,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ь

25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

24

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

3

4

 

5

 

6

7

8

 

 

1

 

 

Число перекодирований

1 - с технологией MOLE; 2 - без технологии MOLE

Рис. 3.26. Зависимость отношения сигнал/шум видеосигнала, подвергнутого видеокомпрессии по стандарту MPEG-2, от числа перекодирований:

1 - с технологией MOLE; 2 - без технологии MOLE

3.3. Стандарт представления медиа-объектов MPEG-4

3.3.1. Описание сцены в стандарте MPEG-4

Для описания сцены и ее динамического изменения в МPEG-4 исполь­

зуется специально разработанный двоичный язык BIFS (Binary Format for Scenes - двоичный формат описания сцен). Описание сцены указывает

декодеру, где и когда воспроизводить объекты, входящие в сцену, и как реа­ гировать на воздействие пользователя. Чтобы увязать ЭП с медиа­ объектами в сцене, используются дескрипторы объекта. Они переносят ин­

формацию о числе и свойствах ЭП, связанных с конкретными медиа­

объектами. Сами дескрипторы также переносятся в одном или нескольких ЭП, поэтому нетрудно добавить или удалить объект во время сеанса. Пото­

ки дескрипторов могут рассматриваться как описания потоковых ресурсов

для представления, а описание сцены служит для изменения пространствен­

но-временн6го размещения объектов в сцене. МPEG-4 определил специаль­

ный язык синтаксических описаний для точного описания синтаксиса пото­

ков, переносящих информацию о медиа-объектах и описания сцен. Он пред­

ставляет собой расширение языка С++ и позволяет дать точное описание

синтаксиса и в то же время упростить проверку на соответствие.

BIFS оперирует двумя протоколами модификации сцены во времени­

командным (BIFS-Command) и анимационным (BIFS-Anim) [31]. Команд­

ные потоки BIFS позволяют загружать новую сцену, изменять свойства

объектов, вводить и уничтожать объекты. Потоки BIFS-Anim управляют

процессами анимации сцены, например, изменением точки взгляда, пере­

мещением, трансформацией размера, плавным изменением цвета, осве­ щенности и т.д. Синхронизация потоков осуществляется путем временн6й

ality Modeling Language -

3.3. Стандарт представления медиа-объектов МPEG-4

141

привязки. Как и в предыдущих стандартах МPEG, один вид временнои метки обеспечивает синхронизацию тактовых частот кодера и декодера, метки другого вида, привязанные к функциональным единицам аудиовизу­ альных данных, содержат желаемое время декодирования (для единиц дос­ тупа) или время завершения компоновки (для компоновочных единиц).

Основные принципы BIFS заимствованы из языка VRМL (Virtual Re- язык моделирования виртуальной реальности), разработанного для создания 3D графики. Это широко распространенный

и в значительной степени бесплатный язык программирования, точнее, эффективный 3D формат обмена, как бы объемный аналог HTМL. Дело в том, что некоторые виды информации лучше воспринимаются в объемном

виде - игры, результаты научных исследований, архитектурные решения.

YRМL обеспечивает интеграцию трехмерных, двумерных, текстовых и мультимедийных объектов в связную модель. Он оперирует объектами, каждый из которых имеет различные атрибуты. Объект называется узлом, а атрибуты - ПОЛЯМИ. Число полей зависит от типа узла. Полный перечень узлов и полей известен как граф (разветвленная древообразная структура).

YRМL включает большинство используемых в 3D приложениях средств:

иерархические трансформации, источники света, выбор точки взгляда,

анимацию, свойства материала, отображение текстуры и т.д.

Язык BIFS позаимствовал у YRМL структуру описания сцены в виде

графа, модели поведения, графические примитивы для построения 3D- изображений: конусы, сферы, сетки, текстовые примитивы, текстурирова­ ние и подсветку (всего их 36). В то же время BIFS имеет существенные от­

личия от YRМL, в него внесены новые решения:

1) yRМL - язык высокого уровня, BIFS - двоичный, благодаря этому объем сообщений в нем в 1О ... 15 раз меньше, чем в VRМL; хотя объем

описаний сцены обычно меньше, чем аудиовизуальной информации, эти

описания передаются непрерывно и могут в результате составить замет­

ную часть передаваемых данных, поэтому сжатие потоков BIFS достаточ­

но актуально;

2) yRМL работает с файлами, предварительно загружаемыми в про­

цессор, а BIFS предназначен в первую очередь для потоковой передачи в

реальном времени;

3) BIFS позволяет работать как с 2D, так и с 3D объектами, осуществ­

лять масштабирование, перемещение, вращение, более того, впервые ре­ шена задача представления в одной сцене и 2D, и 3D объектов.

Во второй версии стандарта в нем расширен BIFS, введены специфи­ кации языков HTМL 4.0 и МPEG-J, спецификация файла .тр4 для хране­ ния и транспортировки данных МPEG-4 [32]. Новая версия BIFS преду­ сматривает анимацию фигуры, улучшенную модель направленности ис­

точника звука, модель окружающей звуковой среды в интерактивной вир­

туальной сцене, учитывающую отражение звука от стен помещения (ре-

142

3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии

верберацию, эффект Доплера, наличие препятствия между источником звука и пользователем), введение иерархических 3D сеток.

3.3.2. Принципы доставки потоков данных

Полученные в результате кодирования элементарные потоки необхо­ димо доставить к декодеру. Для этого МPEG-4 предлагает двухуровневый механизм мультиплексирования, показанный на рис. 3.27. Элементарные

потоки поступают на мультиплексирование, пройдя уровень синхрониза­

цИИ SL (Sync Layer), где в заголовки пакетированных элементарных пото­ ков (ПЭП) вводятся временнь'Iе метки.

Первый уровень, названный FlexMux, играет вспомогательную роль в мультиплексировании, он объединяет низкоскоростные потоки с одинако­ выми требованиями к качеству передачи, чтобы уменьшить их число в сложных сценах и сократить время передачи. Использование FlexMux не является обязательным, и он может быть пустым, если следующий уровень обеспечивает все необходимые функции. FlexMux не имеет собственных

средств защиты от ошибок.

Второй уровень, TransMux (Transport Multiplexing), предлагает транс­

портные услуги по передаче потоков с заданным качеством обслуживания. Условия передачи предполагают необходимую пропускную способность, допустимый уровень ошибок, максимальное время задержки, приоритет и т.д. TransMux не является транспортным протоколом как таковым, он пред-

Элементарные потоки (ЭП)

и нтер феисu ЭП

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

SL

 

SL

 

 

 

 

~~

 

 

 

 

Передача

 

SL

~

 

 

Уровень

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

файлов

 

 

 

 

 

синхронизации

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

\

 

 

 

 

/

 

 

Пак~тироваНН)lе элементарные

П9ТОКИ (ПЭП)

Интерфейс DMIF

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I

 

 

 

 

I

 

 

I

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

приложений

 

 

 

 

I

 

 

 

 

I

 

 

 

I

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I

 

 

 

 

 

 

 

 

 

 

 

I

Flex

Mux I

 

IFlex Mux I

IFlex Mux

 

 

 

 

 

 

Уровень DMIF

 

 

 

 

 

 

 

 

 

 

 

 

 

Потоки

 

 

 

DMIF

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

\

 

/

 

 

 

 

 

 

 

I{ан~л

Т,;пsМuх

\

 

 

/

 

 

 

 

 

Сетевой интерфейс DMIF

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I

 

 

I

I

 

 

 

 

 

 

 

I

 

I

 

 

I

I

 

 

 

 

 

 

I

r-)-l--- г----- __ l_L ___ ,

I

I

 

 

 

 

 

 

 

 

 

 

I Пер:дача : I

Вещание: :Инт:раКТИВ-1 1 MPEG-2

 

UDPjIP 1 1 AAL2j

11 Цифровое ра-

 

 

L

 

______фаилов

I I

 

_____

I I

ныи канал I

ТП

 

 

 

 

 

 

 

АТМ

 

диовещание

 

I

 

 

 

 

 

 

 

 

 

 

_______

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~L

 

 

 

J~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Потоки ТгапsМuх

 

 

 

 

 

t, уровеньtтгапsмuх t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(не входит в MPEG-4)

 

Транспортная среда

Рис. 3.27. Двухуровневый механизм мультиплексирования

цифрового потока в стандарте MPEG-4

3.3. Стандарт представления медиа-объектов МPEG-4

143

ставляет собой скорее интерфейс между кодером МPEG-4 и стандартным

транспортным протоколом. В качестве такового могут использоваться про­

токольные стыки RTPIUDP/IP, AAL5/ATM, транспортный поток МPEG-2.

Взаимодействие с транспортной средой управляется протоколом DМIF

(Delivery Multimedia Integration Framework - мультимедийная интегриро­

ванная система доставки). DMIF, как его определяет стандарт, - сеансовый

протокол для управления потоковой передачей в произвольных средах. По­

сле запуска он устанавливает соединение с удаленным абонентом, выбирает

подлежащие передаче потоки и посылает запрос на их передачу. Порт DMIF

посылает отметки к тем точкам, откуда будут передаваться потоки, и уста­

навливает соединение. Функции DМIF по связи с транспортными прото­

колами реализуются через интерфейс DAI (DМIF Application Interface), ко­ торый получает ПЭП от уровня синхронизации и переводит запросы DМIF

в команды, воспринимаемые конкретным протоколом. Команды для разных

протоколов могут быть различными.

На приемном конце индивидуальные ЭП выделяются из пришедшего

транспортного потока путем демультиплексирования. На этом этапе DMIF не отвечает за работу транспортного протокола, он подключается только

при наличии потоков FlexMux. Выделенные после демультиплексирования пакеты ПЭП обрабатываются с целью извлечения из них информации о синхронизации. Эта информация переносится в заголовках пакетов, гене­

рируемых на уровне синхронизации.

Во второй версии стандарта введены два дополнительных механизма, облегчающие транспортировку и опознавание элементарных потоков. Пер­

вый предназначен для организации передачи файлов и имеет вид специ­ ального файлового формата представления контента с расширением .тр4. Он содержит большой объем описательной информации, позволяющей пе­ редавать файлы с помощью любых протоколов, редактировать их содер­

жимое и воспроизводить его на разных терминалах. В основу положен по­

пулярный формат Quick Time.

Второй механизм - интерфейс программных приложений МPEG-4 с

кодами известного языка программирования Java - призван облегчить ин­ теграцию Jаvа-приложений в структуру МPEG-4. Он будет принимать ЭП Jаvа-приложений, обрабатывать их и направлять к соответствующим ком­ понентам МPEG-4 плеера.

Усовершенствование протокола DMIF во второй версии стандарта ка­ сается введения возможности работы с мобильными средствами связи, обеспечения более широкого класса параметров качества обслу~ивания

(QoS), поддержания сеансовой работы одновременно с несколькими сете­ выми провайдерами, имеющими собственные порты, и т.д.

144

3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕНИИ

3.3.3. Кодирование визуальных объектов

Первоначально предполагалось ограничить пределы скорости цифро­ вого потока MPEG-4 видео значениями 4,8 кбит/с снизу и б4 кбит/с сверху. Однако в ходе разработки стало ясно, что заложенные принципы кодиро­

вания значительно мощнее, чем только кодирование на сверхнизких ско­

ростях. Предел сверху был расширен до 10 Мбит/с в первой версии, до 38 Мбит/с во второй версии и ведется работа по его дальнейшему расши­

рению. Тем не менее визуальная часть стандарта не предназначена для ве­

щательного телевидения, хотя и может обеспечить очень высокое качество изображения.

Основные требования, заложенные в разработку второй части стан­ дарта, сводились к трем условиям: эффективное кодирование натуральных и синтетических изображений; высокая функциональность в интерактив­ ном окружении; устойчивость в среде распространения с ошибками [14].

Средства представления натурального видео в МPEG-4 обеспечивают

стандартизованную технологию обработки, хранения и передачи текстуры, изображений и видео для мультимедийных применениЙ. В отличие от МPEG-2, где вся сцена раскладывалась до пикселя и затем осуществлялось однородное кодирование всего изображения, в МPEG-4 сцена разбивается

на видеообъекты, для каждого объекта описываются его форма, текстура, местоположение, оптические характеристики (яркость, цвет, положение светотени), параметры движения - перемещение, вращение, изменение

масштаба, данные кодируются со сжатием, упаковываются в отдельные

ЭП (по несколько потоков на каждый объект), мультиплексируются и пе­

редаются декодеру. Визуальная сцена может состоять из одного или не­ скольких объектов. Каждый объект характеризуется пространственной и

временн6й информацией в виде формы, текстуры и движения. Для некото­

рых приложений введение понятия визуального объекта оказывается неоп­ равданно сложным, для них МPEG-4 допускает кодирование прямоуголь­ ными кадрами, которые представляют собой вырожденный случай объекта

произвольной формы.

Пользователь может восстановить сцену в ее исходном виде, а может произвести определенные манипуляции - исключить часть объектов или вве­ сти новые, изменить точку взгляда, масштаб, цвет и т.д. Разумеется, пользо­

ватель может внести только те изменения, которые предусмотрел автор.

Стандарт обработки визуальных объектов поддерживает широкий диапазон изменения входных параметров видеопоследовательности. Раз­ вертка может быть прогрессивной и чересстрочной, пространственное раз­

решение по яркости - от 8х8 до 2048х2048 пикс. (SQCIF, QCIF, CIF, 4CIF, Рек. ВТ.б01); в цветовом пространстве допускаются сигналы монохромный и YD , Св, CR ; пространственное разрешение по цветности «4:0:0», «4:2:0» и «4:2:2» (только в студийном профиле); частота кадров может изменяться от О до 30 Гц и более, причем может меняться от кадра к кадру; раз-

3.3. Стандарт представления медиа-объектов МPEG-4

145

Уровень 1

Уровень 2

Рис. 3.28. Структура визуального цифрового потока

рядность квантования - 8 бит с возможностью изменения от 4 до 12 бит. Нетрудно убедиться, что возможности выбора параметров значительно шире, чем даже в МPEG-2.

Визуальный цифровой поток МPEG-4 можно изобразить иерархиче­

ской последовательностью уровней как показано на рис. 3.28. Последова­

тельность визуальных объектов (VS - Visual Object Sequence) в этой ие­

рархии соответствует видеопоследовательности в МPEG-2 и отображает сцену с произвольным числом 2D и 3D натуральных и синтетических объ­

ектов и их улучшающих слоев. Видеообъект (УО) соответствует обычно­

му двумерному объекту в сцене. В самом простом случае он может быть

прямоугольным кадром, в общем случае - объектом произвольной формы. Слой видеообъекта (VOL) - соответствует каждому ЭП, описывающему видеообъект. VOL может быть полнофункциональным или с укороченным

заголовком, в этом случае он совместим с потоком стандарта Н.263. Каж­ дый видеообъект дискретизируется во времени и такой временн6й срез

(отсчет) видеообъекта называется плоскостью видеообъекта (УОР). Не­

сколько плоскостей могут объединяться в группу плоскостей видеообъек­

та (GOV). Не правда ли, эта иерархия очень напоминает структуру видео­

последовательности МPEG-2? Плоскости видеообъекта могут кодировать­

ся независимо (I-кодирование), или совместно, с применением компенса­ ции движения (р- и В-кодирование). Обобщенная схема кодера МPEG-4 показана на рис. 3.29. Она включает кодирование формы и компенсацию движения, а также кодирование текстуры, базирующееся на ДКП (стандар-

146

 

 

 

 

 

3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕНИИ

--

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кодирование

 

 

Вычита-

 

 

 

 

 

 

 

f --

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ДКП

 

Квантователь

 

t

 

 

движения и

 

 

 

ние

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

текстуры

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Восстановле-

 

 

 

 

 

--

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ние отсчетов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Мулыиплек-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

сирование

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Обратное

 

 

 

 

 

 

 

 

 

 

f--

Предска-

-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ДКП

 

 

 

 

 

 

 

 

 

 

 

 

 

 

затель 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

......

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Предска-

-

 

Хранение

 

 

 

 

 

 

 

 

 

 

 

 

 

~

Q<::;

f--

 

1--

Сумматор

 

 

 

 

 

 

 

 

 

затель 2

 

кадра

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f--

Предска-

-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-

 

 

затель 3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

------

 

Оценка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

движения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кодирование

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

формы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 3.29. Обобщенная структурная схема видеокодера MPEG-4

 

 

тное или адаптивное к форме объекта). Каждый видеообъект кодируется отдельно, затем цифровые потоки объединяются.

В стандарте МPEG-4 применяются два метода кодирования информа­ ции о форме объекта - бинарное и градационное. При бинарном кодирова­

нии оперируют матрицей того же размера, что и плоскость видеообъекта, элементы которой могут принимать значения только 1 или О в зависимости от того, находятся ли они внутри объекта или вне его. Градационное коди­ рование более гибкое, оно описывает элементы матрицы 8-битовыми сло­

вами и позволяет кодировать «полупрозрачные» и «затуманенные» изо­

бражения.

Для цифрового сжатия плоскости видеообъектов, содержащие инфор­

мацию о перемещении и текстуре, разбиваются на макроблоки размером 8х8 или 16х16 пикселей, содержащие блоки отсчетов яркости и цветности, к этим последним применяется ДКП с последующим квантованием и ко­

дированием квантованных разностей. Процесс схож с обычным цифровым

сжатием из предыдущих стандартов МPEG.

При кодировании текстуры поступают следующим образом. На плос­ кость видеообъекта накладывают решетку с ячейками 8х8 элементов. Те

ячейки, которые полностью разместились внутри объекта, кодируются обычным ДКП, за исключением того, что после квантования производится дополнительное предсказание коэффициентов блока на основе соседних блоков. Блоки, которые оказались на границе видеообъекта, дополняются

3.3. Стандарт представления медиа-объектов МPEG-4

147

до размера 8х8 по определенным правилам и только после этого кодиру­ ются (так называемое Shape-Adaptive DCT - ДКП, адаптивное к форме).

Более эффективный метод кодирования текстуры и неподвижных изображений поддерживается специальным режимом кодирования в МPEG-4, основанным на волновом nреобразовании с нулевым деревом. На­ ряду с высокой эффективностью сжатия этот метод обеспечивает про­ странственную масштабируемость (до 11 уровней) и непрерывную мас­ штабируемость по качеству.

Масштабируемость в МPEG-4 обеспечивается передачей для видео­ объекта нескольких цифровых потоков - VOL, один из которых базовый, остальные - улучшающие. При пространственном масштабировании может быть достигнуто улучшенное пространственное разрешение, временн6е масштабирование сглаживает движение. На рис. 3.30 показано, как в этом случае кодер и декодер обрабатывают поступающие потоки. Пред­ процессор субдискретизирует поступающие УОР и разделяет их на базо­ вый и улучшающий слои. Поток базового слоя передается обычным путем,

а в канале улучшающего слоя передается только разность между сигналом,

поступившим от процессора, и сигналом, восстановленным промежуточ­

ным процессором путем повышающей дискретизации. На приеме процес­ сы происходят в обратном порядке.

Дальнейшему сокращению цифрового потока способствует глобаль­

ная компенсация движения, основанная на передаче статических сnрай­ mов. Сnрайmом называется часть видеообъекта, которая устойчиво nрисутствует в нем практически без изменений на протяжении до­ вольно длительного времени. Это могут быть, например, панорамный

задний план или группа неподвижных предметов, закрывающая значи­

тельную часть кадра. Такое почти статическое изображение может быть

передано полностью один раз, в начале трансляции, а затем корректиро­

ваться декодером по мере необходимости. Информация о форме и текстуре

 

 

 

 

 

 

 

 

г--

 

-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кодер

 

 

 

 

 

r-

Декодер

 

 

 

 

 

 

 

 

 

 

 

улучшающего

f--

 

 

 

 

улучшающего

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

слоя

 

 

 

cl..

 

 

 

слоя

 

 

 

 

 

 

 

 

 

 

 

t

 

cl..

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

-

 

 

 

 

 

 

о

 

u

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

Промежу-

 

~

--1r-

Q.)

 

 

 

Промежу-

 

 

 

 

 

 

Пред-

 

 

 

Q.)

<::;

 

 

 

 

 

Пост-

 

 

 

 

 

<::;

1::

 

 

 

 

 

 

 

 

 

 

 

 

 

 

точный

 

1::

:s:

 

 

 

точный

 

 

 

 

г--

 

процессор

 

 

 

:s:

1-

 

 

 

 

процессор

 

 

 

 

...Q

 

 

 

 

 

 

 

 

 

 

 

 

 

процессор

 

1-

 

<::;

 

 

 

процессор

 

 

 

 

 

 

 

 

 

 

 

...Q

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

<::;

 

»

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

»

 

2:

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

::::Е

 

Q.)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с:::[

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кодер

 

 

 

 

 

r-

Декодер

 

 

 

 

 

 

 

 

 

 

 

 

базового

f--

 

 

 

 

базового

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

слоя

 

' ---

 

-

 

 

 

слоя

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 3.30. Масштабируемое кодирование/декодирование в стандарте MPEG-4

148

3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии

спрайта кодируется как 1-УОР. ДЛЯ каждого следующего изображения в последовательности кодируются только 8 параметров глобального дви­ жения, описывающих движения телекамеры. Чтобы снизить задержку, сначала передают часть информации спрайта с грубым квантованием, а за­ тем добавляют более тонкие структурные особенности. Можно также пе­ редать часть изображения, необходимую для реконструкции первых УОР,

а затем дослать по частям остальные участки спраЙта. На практике приме­

няется сочетание обоих методов.

В цифровом потоке визуальной информации применяются дополни­ тельные меры для повышения устойчивости к ошибкам:

Ресинхронизация: после определенного количества бит в поток вво­

дятся маркеры, отмечающие точки, к которым декодер переходит при по­

тере части бит в потоке.

Разделение данных: данные о перемещении и о текстуре разделяются на более мелкие порции для облегчения маскирования.

Код расширения заголовка: вводится дополнительная кодозащита в

заголовок пакета, повышающая его устойчивость к ошибкам.

Реверсивное кодирование с переменной длиной: кодовые слова ревер­ сивного кода могут декодироваться как с начала, так и с конца. Если деко­ дер встречает поврежденные биты, он не отбрасывает всю оставшуюся

часть слова, а декодирует его с противоположного конца до поврежденно­

го участка, минимизируя потери.

Синтетические объекты представляют значительный раздел компьютер­

ной графики. В стандарт МPEG-4 включены следующие операции с объекта­

ми такого рода: параметрические описания синтезированного лица и фи­ гуры; кодирование статических и динамических сеток с отображением текстуры; кодирование текстуры для nроективных приложений.

Метод анимации предполагает однократную передачу базового стати­ ческого образа и последующую досылку сообщений, описывающих дина­ мические изменения объекта. В первой версии стандарта этот метод ис­ пользуется для передачи синтезированного человеческого лица. За основу берется обобщенный шаблон лица с нейтральным выражением - один из хранимых в базе или специально загружаемый на передающей стороне. Он

дополняется индивидуальными чертами, текстурой, выражением с помо­

щью управляющих параметров (Facial Definition Parameters - параметры, определяющие лицо), другая группа параметров (Facial Animation Parameters - параметры анимации лица) изменяет выражение лица, вводит мими­

ку, артикуляцию. Параметры передаются в отдельных потоках, для сжатия используется кадровое кодирование с ДКП.

Двумерная сетка представляет собой часть плоскости, поделенную на полигональные (многоугольные) участки. Точки пересечения линий назы­ ваются узлами. МPEG-4 рассматривает только треугольные сетки. Сетка может быть заполнена текстурой, тогда ее называют контентно-наполнен-

3.3. Стандарт представления медиа-объектов МPEG-4

149

ной (content-based). Для описания сетки в динамике достаточно передать

геометрию сетки и описать движение всех ее узлов. При этом треугольные

участки текущего кадра получаются путем деформации треугольных уча­ стков опорного кадра, текстура также деформируется путем параметриче­ ского отображения векторов перемещения узлов сетки.

Двумерное моделирование может быть использовано для эффективно­

го сжатия, если передавать опорные ключевые кадры и посылать векторы

перемещения и информацию о текстуре для восстановления промежуточ­

ных кадров.

Во второй версии стандарта добавлены новые технологии и алгорит­ мы, позволившие повысить эффективность кодирования, устойчивость к ошибкам, улучшить временн6е разрешение при малой задержке в буфере. В частности, введен режим глобальной компенсации движения, точность компенсации повысилась до 1/4 пикселя, внедрены три новых инструмента кодирования текстуры и неподвижных изображений: волновое кодирова­ ние с разделением на небольшие самостоятельно кодируемые участки, масштабируемое кодирование формы, сегментация и пакетирование для

повышения устойчивости к ошибкам.

Интересным новшеством второй версии является возможность коди­

рования кратных изображений (стереоскопических или полученных с близких точек) с устранением избыточности между ними. Этот режим ос­ нован на методе градационного кодирования формы объекта и использует

дополнительные возможности данного метода.

В области синтетических изображений основными нововведениями

второй версии можно считать средства анимации человеческой фигуры (теми же методами, что и лица в первой версии) и кодирование трехмер­

ных полигональных сеток.

3.3.4. Кодирование звуковых объектов

Широкие возможности представляет стандарт МPEG-4 дЛЯ кодирова­ ния звука. Впервые используются раздельные алгоритмы для кодирования

звуков музыкального происхождения и речи, введены мощные средства

создания и обработки синтезированного звука [14].

Наиболее широкий круг звуковых объектов, от низкоскоростных моно

до многоканального звука вещательного качества, относится к категории

Универсального звука (GA - General Audio). В качестве основного алго­

ритма кодирования звуков различного происхождения принят известный

нам из МPEG-2 алгоритм ААС с незначительными усовершенствованиями.

Одно из них касается введения режима PNS (Perceptual Noise Substitution-

nерцеnmуальное замещение шумом). Суть данного метода заключается в обнаружении в приходящем сигнале шумоподобных составляющих и ис­ ключении их из общего процесса кодирования. Декодеру передается ин­ формация о мощности шумовых компонентов в отдельных участках спек-