Учебники / Цифровое телевизионное вещание под редакцией Г. В. Мамчев, 2014
.pdf190 |
3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕНИИ |
|
|
3.4.7. Транспортный механизм стандарта Н.264 |
|
|
Структура кодированной видеопоследовательности |
|
|
Кодированная видеопоследовательность в стандарте Н.264 состоит |
|
из |
единиц NAL, каждая |
из которых содержит элементы типа RBSP |
(табл.3.21). |
|
|
|
Кодированные слои |
(включая слои деления данных и IDR-слои), а |
также концы последовательностей RBSP определяются как единицы VCL NAL, а все остальные элементы являются просто единицами NAL.
На рис. 3.54 показан пример типичной последовательности единиц RВPS. Каждая из этих единиц передается в виде отдельной единицы NAL. Заголовок единицы NAL (один байт) сообщает тип RВSP, за которым сле дует тело единицы NAL.
|
|
|
|
|
|
|
|
Таблица 3.21 |
||
|
|
|
|
|
Элементы RВSP |
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
ТипRВSР |
|
|
|
|
Описание |
|
|
|
|
Параметрическое |
|
Глобальные параметры последовательности: размер сним- |
||||||||
множество |
|
ков, видеоформат, карта распределения макроблоков и т.п. |
||||||||
Дополнительная |
|
Посторонние сообщения, которые не важны для коррект- |
||||||||
уточняющая ин- |
|
ного декодирования видеоряда |
|
|
|
|||||
формация |
|
|
|
|
|
|
|
|
|
|
Ограничитель |
|
Граница между видеоснимками (опционная). Если она от- |
||||||||
снимка |
|
сутствует, то декодер определяет границы на основе числа |
||||||||
|
|
|
кадров, записанного в каждом заголовке слоя |
|||||||
|
|
|
|
|
|
|
|
|
|
|
Кодированный |
|
Заголовок и данные слоя; этот RВSP содержит фактические |
||||||||
слой |
|
видеоданные |
|
|
|
|
||||
Слои деления |
|
Три единицы, в которых хранятся части деления данных |
||||||||
данных А, В и С |
|
(удобны при защищенном от помех декодировании). Часть |
||||||||
|
|
|
А содержит заголовок данных макроблоков слоя, часть В |
|||||||
|
|
|
состоит из iпtrа-кодированных данных, а часть С - из inter- |
|||||||
|
|
|
кодированнь~даннь~ |
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
Конец последо- |
|
Указывает на то, что следующий кадр (в порядке декоди- |
||||||||
вательности |
|
рования) является снимком IDR. (Несущественно для кор- |
||||||||
|
|
|
ректного декодирования.) |
|
|
|
|
|||
Конец потока |
|
Указывает на то, что за ним больше нет снимков битового |
||||||||
|
|
|
потока. (Несущественно для корректного декодирования.) |
|||||||
Данные напол- |
|
Состоит из «холостых» дaHHЬ~ (может служить для запол- |
||||||||
нения |
|
нения пусть~ мест в последовательности). (Несущественно |
||||||||
|
|
|
для корректного декодирования.) |
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
Параметр |
|
|
Параметр |
|
Ограничитель |
|
|
|
|
|
множество после- |
|
SEL |
множество |
Р-слой |
Р-слой |
Р-слой |
|
||
|
|
снимка |
|
|||||||
|
довательностей |
|
|
снимков |
|
|
|
|
||
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
Рис. 3.54. Пример последовательности элементов RВSP
3.4. Стандарт кодированного иредставления визуальной информации И.264/АУС или MPEG-4 |
191 |
Параметрические множества
Стандарт Н.264 вводит понятие параметрического множества, в кото ром записывается информация, применяемая к большому семейству коди рованных снимков. Параметрическое множество последовательности
состоит из параметров, которые применяются к видеопоследовательности
в целом (как к множеству кодированных последовательных снимков). Элементы этого параметрического множества включают идентификатор (seq~arameter ограничители числа кадров и порядкового счетчика снимков, число ссылочных кадров, которые могут быть использованы при декодировании (включая ссылочные кадры с близкими и давними срока ми), ширину и высоту кодируемых кадров, выбор прогрессивной или че
ресстрочной развертки кадров или полукадров. Параметрическое множе
ство снимков состоит из параметров, которые применяются к одному или
нескольким снимкам последовательности. Каждое параметрическое мно
жество снимков включает (помимо прочих параметров) идентификатор
(pic~arameter_set_id), выбранный параметр seq~arameter_set_id, флаг вы
бора энтропийного кодера VLC или САВАС, число используемых групп
слоев (и определение типа карты групп слоев), число ссылочных снимков в
списке О и в списке 1, которые могут использоваться в прогнозах, началь
ные параметры квантователя и флаг, указывающий, надо ли модифициро вать параметры деблочного фильтра, принятые по умолчанию.
Обычно одно или несколько параметрических множеств последова
тельности и снимков посылаются декодеру до начала декодирования заго
ловков слоев и данных слоев. Закодированный заголовок слоя ссылается
на pic~arameter_set_id, и этим он активирует данное параметрическое
множество снимков. Активированные параметры снимков остаются в силе до тех пор, пока другое параметрическое множество снимков не будет ак
тивировано ссылкой на него в se~arameter_set_id. Активированное пара метрическое множество действует (то есть его параметры применяются ко всем последующим снимкам) до тех пор, пока новое параметрическое
множество последовательности не будет активировано.
Механизм параметрических множеств позволяет кодеру сигнализиро
вать о важных, редко меняющихся параметрах последовательности и
снимков отдельно от передачи самих кодированных слоев. Параметриче ское множество может быть послано задолго до того, как некоторый слой
сошлется на него, или его можно переслать другим транспортным меха
низмом (например, по другому надежному каналу связи или даже путем его прошивки в «железной» реализации декодера). Каждый кодированный
слой может «вызвать» нужное ему параметрическое множество с помощью
соответствующего сигнала VLC (pic~arameter_set_id) в своем заголовке.
Передача и хранение единиц NAL
Метод передачи единиц NAL не специфицирован стандартом, но не
которые различия сделаны между передачей на основе пакетного транс-
192 |
3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии |
портного механизма (то есть в пакетных сетях) и передачей с помощью непрерывных потоков данных (например, в сетях с коммутацией каналов). В сетях на основе пакетной передачи каждая единица NAL может достав ляться отдельным пакетом, и поэтому она должна быть организована в ви
де правильной последовательности до начала декодирования. В сети с
коммутацией каналов перед каждой единицей NAL помещается стартовый префикс (однозначно декодируемый ограничительный код) для организа ции потока байт до начала передачи. Это дает возможность декодеру иден тифицировать поток, обнаружив стартовый префикс, который означает на чало единицы NAL.
В типичном приложении бывает необходимо передать или сохранить
закодированное видео вместе с ассоциированными звуковыми дорожками
и другой сторонней информацией. Для этих целей можно использовать
различные транспортные механизмы, такие как протокол реального време
ни и пользовательский дейтаграммный протокол RTP/UDP (Real Time
Protocol/User Datagram Protocol).
3.4.8. Кодек стандарта Н.264
Как и в предыдущих стандартах компрессии рекомендация Н.264 не
дает конкретного описания «кодека» (то есть пары КОдер/ДЕКодер). Вме
сто этого делается описание синтаксиса закодированного битового видео потока вместе с методом его декодирования. Фактически, на практике ре
альные кодер и декодер будут состоять из функциональных элементов, по казанных на рис. 3.55 и 3.56. За исключением деблокирующего фильтра большинство функциональных элементов (устройства прогноза, преобразо вания, квантования, энтропийного кодирования) присутствовали и в преды дyщиx стандартах (МPEG-2, МPEG-4). Однако, в стандарте Н.264 осущест влена существенная переработка всех функциональных элементов [33].
Кодер (см. рис. 3.55) имеет два направления потоков данных: прямое (слева направо) и реконструированное (справа налево). Поток данных в декодере (см. рис. 3.56) изображен в направлении справа налево для того,
чтобы подчеркнуть его схожесть с потоком данных кодера.
Рассмотрим прямое направление потока данных в кодере. Входной кадр или полукадр F n обрабатывается единицами макроблоков. Каждый
макроблок кодируется в моде intra или inter, и для каждого блока макро блока, то есть подмакроблока, формируется прогноз PRED на основе ре конструкции пикселей изображения (снимка). В моде intra прогноз PRED формируется с помощью пикселей текущего слоя, ранее закодированных,
декодированных и реконструированных (nF~). При формировании прогно
за PRED используются нефильтрованные элементы изображения. В моде inter прогноз PRED строится с помощью компенсации движения по одному или двум ссылочным кадрам. На рис. 3.55 ссылочный кадр показан в виде
ранее закодированного снимка F~-l, а ссылочный прогноз для каждой час-
3.4. Стандарт кодированного иредставления визуальной информации И.264/АУС или MPEG-4 |
193 |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
+ |
|
Устройство |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Fn |
|
|
|
|
|
|
|
|
|
|
|
|
переупоря- |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
(теущий |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
дочивания |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
кадр) |
|
|
|
|
|
МЕ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Энтро- |
|
F~-l |
|
|
|
|
|
|
|
|
|
|
inter |
|
|
|
NAL |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
пийный |
|||
(ссылочный |
I |
-+-----~ |
|
МС |
|
|
|
|
|
|||||||
кадр) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
кодер |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
р |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(1 или 2 |
|
|
|
|
Устройство |
|
|
|
|
|
|
|
|
|
|
|
закодиро |
|
|
|
|
|
|
Прогноз |
|
|
|
|
|
|
|||
|
|
|
|
|
выбора |
|
|
|
|
|
|
|
|
|||
ванных |
|
|
|
|
|
|
|
intra |
intra |
|
|
|
|
|
||
|
|
|
|
прогноза |
|
|
|
|
|
|
|
|||||
кадра) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
F~ |
|
|
|
|
|
|
|
|
nF~ |
|
|
|
|
|
|
|
(реконстру- |
|
|
|
|
|
Фильтр |
|
|
|
|
|
|
|
|
|
|
ированный |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
кадр) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис. 3.55. Функциональная схема кодирующего устройства стандарта Н.264
NАЧ
|
Fn |
|
|
|
|
|
|
|
inter |
|
|
|
|
|
|
|
Энтро- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
пийный |
|||
|
(текущий |
|
|
|
МС |
|
IL р |
|
|
|
декодер |
|||||||
|
кадр) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
(1 или 2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Прогноз |
|
|
|
|
|
|
|
|
Устройство |
||||
|
закодиро- |
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
f------ |
|
|
|
|
|
|
|
переупоря- |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
ванных |
|
|
|
|
intra |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
intra |
|
|
|
|
|
|
|
дочивания |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
кадра) |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
F~ |
|
|
|
|
|
nF~ |
+ |
|
Dh |
|
|
|
|
|
|||
|
(реконстру- |
~ |
Фильтр |
|
|
|
|
г |
1 |
о-1 |
||||||||
|
|
|
|
|
||||||||||||||
|
ированный |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
+ |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||
|
кадр) |
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис. 3.56. Функциональная схема декодирующего устройства стандарта Н.264
ти макроблока СВ моде inter) может быть взят из прошлых или будущих снимков Св порядке их отображения на телевизионном экране), которые уже были закодированы ранее, реконструированы и отфильтрованы.
Прогноз PRED вычитается из текущего блока, и их разность, которую для удобства назовем остатком, обозначается символом Dn . Далее, после блока Dn к остатку применяется соответствующее преобразование, резуль
тат квантуется, и создается блок х. Полученное множество квантованных коэффициентов переупорядочивается и кодируется энтропийным кодером. Выходные коэффициенты энтропийного кодера вместе с некоторой допол нительной информацией, необходимой при декодировании каждого блока
194 |
3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии |
данного макроблока (мода прогноза, параметры квантователя, информация о векторах движения и т.п.), записываются в битовый поток, который про ходит через абстрактный сетевой модуль NAL дЛЯ дальнейшей передачи
или хранения.
Каждый закодированный и переданный блок макроблока декодирует
ся (реконструируется) самим кодером для получения ссылочного материа
ла последующих прогнозов. При этом коэффициенты х деквантуются (Q-l),
и к результату применяется обратное преобразование (T-1) дЛЯ получения
разностного (остаточного) блока D~. Прогнозный блок PRED складывает ся с блоком D~ дЛЯ образования реконструированного блока nF~ (декоди
рованная версия исходного блока, и означает, что он не фильтрован). Затем применяется фильтр для погашения эффекта блочной дисторсии (искаже ния). В итоге реконструированный ссылочный кадр строится по ряду бло
ков F~.
Декодер (см. рис. 3.56) получает сжатый битовый поток из NAL, и
сначала применяет энтропийный декодер для получения элементов дан
ных, из которых формируются множества квантованных коэффициентов х. Эти коэффициенты деквантуются, к результату применяется обратное пре
образование, и получается блок D~ (идентичный блоку D~ кодера). Ис
пользуя информационный заголовок, извлеченный из битового потока, де
кодер создает блок-прогноз PRED, который в точности совпадает с исход
ным блоком PRED кодера. Этот блок складывается с D~ дЛЯ получения блока nF~, который затем фильтруется для формирования декодированно
го блока F~.
3.5. Стандарт описания мультимедийной информации MPEG-7
3.5.1. Общие сведения о стандарте MPEG-7
Переход телевидения к цифровым технологиям и быстрое развитие техники цифрового сжатия вызвали в последние годы столь же быстрый рост объема аудиовизуальной информации. Информация может быть представлена в различных формах (неподвижные изображения, видео, графика, 3D модель, звук, речь).
В отличие от мультимедийного стандарта цифровой компрессии
МPEG-4 стандарт МPEG-7 служит для описания различной мультимедий
ной информации.
Следует подчеркнуть, что описание мультимедийной информации в стандарте МPEG-7 - это не методы сжатия данных, а это описание мета данных, также известных как «данные о данных». Метаданные - это цифровая информация, которая описывает содержание других цифро вых данных.
3.5. Стандарт описания мультимедийной информаиии МPEG-7 |
195 |
Стандарт МPEG-7 называется «Интерфейс описания мультимедийно
го контента» и нацелен на стандартизацию следующих основных элемен
тов [14]:
•базового набора дескрипторов (D - Descriptor), используемых для опи
сания различных признаков мультимедийного контента;
•совокупности структур дескрипторов и соотношений между ними, на
зываемых схемами описания (СО) (DS - Description Schemes);
•языка определения дескрипторов и схем описания, названного язык оп
ределения описания (DDL - Description Definition Language);
•путей кодирования описаний.
3.5.2. Основные части стандарта MPEG-7
Стандарт МPEG-7 состоит из следующих частей [35]:
1. Системы МPEG-7, то есть средства, которые необходимы при под готовке описаний МPEG-7 для эффективной передачи и записи, и для обес
печения синхронизации между материалом и описаниями. Эти средства имеют также отношение к охране интеллектуальной собственности.
2. Язык описания определений МPEG-7. Язык для определения новых
схем описания и, возможно, новых дескрипторов.
3. МPEG-7 Audio - дескрипторы и схемы описания, имеющие отно
шение исключительно к описанию аудиоматериала.
4. МPEG-7 Visual - дескрипторы и схемы описания, имеющие отно
шение исключительно к описанию визуального материала.
5. МPEG-7 Multimedia Description Schemes - дескрипторы и схемы
описания, имеющие отношение к общим характеристикам описаний муль
тимедиа.
6. МPEG-7 Reference Software - программные реализации соответст
вующих частей стандарта МPEG-7.
7. МPEG-7 Conformance - базовые принципы и процедуры тестирова
ния рабочих характеристик практических реализаций МPEG-7. В стандарте используются дескрипторы четырех типов:
Дескрипторы первого типа передают непосредственно содержание
материала (content description - описание контента) и могут быть низкого и
высокого уровня.
Дескрипторы низкого уровня передают структуру материала:
•цвет, текстуру, форму;
•параметры движения для видео;
•высоту тона, тембр, темп, интенсивность - для звука, и т.п.
Дескрипторы высокого уровня описывают смысловое содержание
контента.
Второй тип дескрипторов (content management - управление кон тентом) содержит информацию о времени и цели создания материала, об авторстве и правах собственности.
196 |
3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии |
Третий тип (content organization - организация контента) позволяет классифицировать материал по различным признакам и может использо
ваться для его анализа и исследований.
Четвертый тип (navigation and access - навигация и доступ) - для быстрого поиска контента по краткому описанию содержания.
3.5.3. Описание главных функций стандарта MPEG-7
Системы стандарта MPEG-7
Системы МPEG-7 будут включать в себя средства, которые необхо димы для подготовки описаний МPEG-7 для эффективной транспортиров
ки и запоминания, а также позволяют синхронизовать мультимедийный материал и описания и средства, сопряженные с управлением и защитой
интеллектуальной собственности. Стандарт определяет архитектуру тер минала и нормативных интерфейсов.
Язык описания определений MPEG-7
Согласно определению в МPEG-7 язык описания определений DDL (De- представляет собой: « .. .язык, который позволяет формировать новые схемы описания и, возможно, дескрипторы. Он также
позволяет расширение и модификацию существующих схем описания». Язык описания дескрипторов (DDL) базируется на языке XМL (eXten-
расширенный язык разметки) и, в частности, XМL Schema, созданного для описания структурных элементов. Однако, так как XМL Schema изначально не предусмотрен для описания аудиовизуальной информации, МPEG-7 немного его расширяет.
Аудио MPEG-7
Окончательный проект аудио МPEG-7 представляет шесть техноло
гий: система аудио описаний (которая включает в себя дерево шкал и низ коуровневые дескрипторы), средства описания звуковых эффектов, сред
ства описания тембра инструмента, описание голосового материала, сег мент молчания и дескрипторы мелодии, облегчающие обработку запросов.
Визуальный MPEG-7
Средства визуального описания МPEG-7 состоят из базовых структур
и дескрипторов, которые характеризуют следующие визуальные характе
ристики: цвет, текстура, форма, движение, локализация, прочие.
Каждая категория состоит из элементарных и сложных дескрипторов.
Основные объекты и схемы описания мультимедиа MPEG-7
Базисом схем описания мультимедиа МDS (Multimedia Description Schemes) является стандартизация набора средств описания (дескрипторы и схемы описания), имеющих дело с общими и мультимедийными объектами.
3.5. Стандарт описания мультимедийной информаиии МPEG-7 |
197 |
Общими объектами являются характеристики, которые используются
в аудио, видео и текстовых описаниях и, следовательно, характеризуют все
медийные типы материала. Такими характеристиками могут быть, напри
мер, вектор, время и т.д.
Помимо этого набора общих средств описания стандартизованы более сложные средства описания. Они используются, когда нужно описать бо лее одного вида медийного материала (например, аудио и видео - АУ). Эти средства описания могут быть сгруппированы в 5 различных классов со гласно их функциональному предназначению:
•описание материала: представление воспринимаемой информации;
•управление материалом: информация о характере медийного материала,
формирование и использование АV материала;
•организация материала: представление анализа и классификации не
скольких АV материалов;
•поиск и доступ: спецификация кратких характеристик и изменений АV
материала;
•взаимодействие с пользователем: описание предпочтений пользователя
и истории использования мультимедийного материала.
Эталонные программы MPEG-7: модель экспериментов
(eXperimentation Model)
Программное обеспечение модели ХМ (eXperimentation Model) пред ставляет собой систему моделирования для дескрипторов МPEG-7 (D), схем описания (DS), схем кодирования (CS), языка описания определений (DDL). Кроме нормативных компонентов, системе моделирования необхо
димы некоторые дополнительные элементы, существенные при исполне
нии некоторых процедурных программ. Структуры данных и процедурные программы образуют приложения. Приложения ХМ образуют две разно
видности: приложения клиента и сервера.
3.5.4. Области применения стандарта MPEG-7
Элементы, которые стандартизует МPEG-7, будут поддерживать ши
рокий диапазон приложений (например, мультимедийные цифровые биб
лиотеки, выбор широковещательного медийного материала, мультимедий
ное редактирование, домашние устройства для развлечений и т.д.). МPEG-7
сделает возможным мультимедийный поиск в WEB столь же простым, как и текстовый. Это станет применимо для огромных архивов, которые будут доступны для широкой публики, это придаст новый стимул для электрон
ной торговли, так как покупатели смогут искать нужный товар по видео
образцам. Информация, используемая для извлечения материала, может также применяться агентами для отбора и фильтрации широковещательно го материала или целевой рекламы. Кроме того, описания МPEG-7 позво-
198 |
3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии |
лят быстрые и эффективные с точки зрения затрат полуавтоматические
презентации и редактирование.
Все области применения, базирующиеся на мультимедиа, выиграют от использования МPEG-7. Ниже предлагается список возможных приложе нийМРЕG-7:
•архитектура, недвижимость и интерьерный дизайн (например, поиск идей);
•выбор широковещательного медийного канала (например, радио, ТУ);
•услуги в сфере культуры (исторические музеи, картинные галереи и
т.д.);
•цифровые библиотеки (например, каталоги изображений, музыкальные
словари, биомедицинские каталоги изображений, фильмы, видео и ра диоархивы);
•электронная коммерция (например, целевая реклама, каталоги реально
го времени, каталоги электронных магазинов);
•образование (например, депозитарии мультимедийных курсов, мульти медийный поиск дополнительных материалов);
•домашние развлечения (например, системы управления личной муль
тимедийной коллекцией, включая манипуляцию содержимым, напри
мер, редактирование домашнего видео, поиск игр, караоке);
•исследовательские услуги (например, распознавание человеческих осо
бенностей, экспертизы);
•журналистика (например, поиск речей определенного политика, ис
пользуя его имя, его голос или его лицо);
•мультимедийные службы каталогов (например, Желтые страницы, ту
ристская информация, географические информационные системы);
•мультимедийное редактирование (например, персональная электронная
служба новостей, персональная медийная среда для творческой дея
тельности);
•удаленное опознавание (например, картография, экология, управление
природными ресурсами);
•осуществление покупок (например, поиск одежды, которая вам нравится);
•надзор (например, управление движением, транспортом, неразрушаю
щий контроль в агрессивной среде).
•реализация системы второго экрана (Second Screen). В действительно
сти, при просмотре фильмов зрителей может заинтересовать биография
кого-то из актеров, дальнейший сюжет, отзывы кинокритиков, сборы в прокате. При просмотре научно-популярных или новостных передач
иногда хочется получать более детальную информацию о темах, в них затронутых. Практика телевизионного вещания показала, что подобный информационный голод испытывают в разной степени телезрители по всему миру. Один единственный телевизионный экран уже не может удовлетворить потребности общества в информации, а массовое рас-
3.5. Стандарт описания мультимедийной информаиии МPEG-7 |
199 |
пространение мобильных устройств, таких как смартфоны и планшет ные компьютеры, совместно с развитием сетей беспроводного доступа с высокой пропускной способностью сделали возможным доставку и отображение такой дополнительной информации практически в любой точке мира. Таким образом, планшетные компьютеры и смартфоны
сейчас становятся тем самым вторым монитором, которого так не
хватало еще несколько лет назад. На сегодняшний день уже ясно, что
развитие сервисов для поддержки второго экрана станет одной из самых
приоритетных задач для телекомпаний на ближайшие несколько лет, если они хотят быть конкурентно способными в современном информа ционном мире. При создании системы второго экрана требуется реше
ние достаточно сложной задачи автоматического распознавания в ре
альном времени транслируемого видеоконтента (ACR - Automated Content Recognition). Для реализации режима ACR необходим переход на телевизионное вещание с использованием стандарта МPEG-7, кото рый поддерживает передачу информационных таблиц описания контен та в формате XМL.
3.6. Стандарт описания среды мультимедийного контента MPEG-21
3.6.1. Общие сведения о стандарте MPEG-21
МPEG-21 описывает среду, в которой разрабатывается мультимедий ный контент [36].
Стандарт МPEG-21 имеет целью определить ориентиры для создате лей, дистрибьюторов и сервис-провайдеров мультимедийного контента в
открытом рынке мультимедиа.
МPEG-21 визируется ни двух важных концепциях: определении базо
вой единицы распределения и соглашения (Digital Нет - цифровой объект) и концепции взаимодействия пользователей и цифровых объектов. Цифро
вой объект может рассматриваться как предмет мультимедийных соглаше
ний (например, видео коллекция, музыкальный альбом), а пользователи,
как субъекты мультимедийных соглашений.
Таким образом, цель разработки стандарта МPEG-21 может быть
сформулирована следующим образом: определение технологии, необхо
димой для поддержки пользователей при обмене, доступе, продаже и дру
гих манипуляциях цифровыми объектами. При этом предполагается обес печить максимальную эффективность и прозрачность этих операций.
3.6.2. Основные части стандарта MPEG-21
Стандарт МPEG-21 состоит из следующих частей:
