Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ш .doc
Скачиваний:
59
Добавлен:
02.05.2015
Размер:
182.78 Кб
Скачать
    1. Основные понятия цифрового видео

Кодирование цвета. Карты захвата видео предоставляют

возможность сохранить поток данных в таком же виде, в каком

они выходят с чипа оцифровки видео. Эти чипы выдают инфор-

мацию не в привычном для компьютера формате в виде набора

цветовых компонентов RGB (red, green, blue), а в виде яркостной

и двух цветовых составляющих (YUV). Причем для группы из

двух последовательно идущих пикселей сохраняются два значе-

ния яркости и по одному значению цветовых компонентов,

т. е. получается 4 байта на 2 пикселя или 16 бит на пиксель. Та-

кой метод называют chroma subsampling, а способ записи назы-

вают кодированием цвета YUV2 (или YUYV, или 4:2:2). Из-за

особенностей человеческого зрения разницу с обычным RGB-

представлением увидеть практически невозможно: глаз более

чувствителен к яркости, чем к цвету (точнее, разрешающая спо-

собность глаза по яркости выше, чем по цвету, за счет разной

концентрации колбочек и палочек на сетчатке). Этот метод по-

зволяет значительно снизить объем информации для оцифро-

ванного видео: если сохранять привычные 24 бита на пиксель

вместо 16, то потребуется в 1,5 раза больше места, поскольку

информация с карты захвата поступает уже в YUV2.

Также распространен метод кодирования YUV12

(или 4:1:1) – в нем общие значения цветовых компонентов име-

ют группы 2×2 пикселя. Для 4 пикселей сохраняется 4 байта яр-

кости, 1 байт цветности U и 1 байт цветности V, в среднем по-

лучается 12 бит на пиксель (отсюда название).

Поток данных (bitrate). Потоком данных называют количе-

ство информации в сжатом виде, приходящееся на единицу вре-

мени для какой-либо записи и измеряемое в битах в секунду или

байтах в секунду. При захвате видеосигнала происходит сжатие

информации. При этом используются два способа ее сжатия: с

постоянным потоком данных (CBR, constant bitrate) и с пере-

менным потоком данных (VBR, variable bitrate). В первом вари-

анте каждый блок данных сжатого файла (который имеет опре-

деленную длительность при воспроизведении) имеет постоян-

ный размер. Соответственно поток данных не меняется на про-

тяжении всего файла. В случае переменного потока данных ка-

ждый блок по выбору кодера может иметь больший или мень-

ший размер. Поскольку реальные сигналы имеют постоянно из-

меняющуюся сложность, метод кодирования с переменным по-

током данных оказался эффективнее.

Примечание. Кодер (coder) – программа для кодирования

сжимаемой информации. Декодер (decoder) – программа для

декодирования сжатой информации.

С точки зрения изменения сложности для сжатия видеоин-

формация существенно сложнее, чем звуковая. Статичные сце-

ны, где из кадра в кадр меняется лишь малая часть изображения,

сменяются динамичными, где во время взрывов и погонь слож-

но найти два одинаковых кадра. Первые реализации MPEG-

кодеров использовали сжатие видео с постоянным потоком дан-

ных (в частности стандарт Video CD, MPEG-1-сжатие). Однако

это давало настолько удовлетворительные результаты, что сжа-

тие видео с постоянным потоком данных не используется.

Поток данных в формате MPEG может содержать три типа

кадров: ключевые кадры (keyframe, intra-frame, I-frame), проме-

жуточные (predictable, forward predictable, P-frame) и двунаправ-

ленные (backward predictable, bi-directional, BiDir, B-frame).

Ключевой кадр содержит всю информацию об изображении

в кадре и не зависит от других кадров.

Промежуточный кадр может ссылаться на блоки изображе-

ния в предыдущем ключевом или предыдущих промежуточных

кадрах. Это позволяет делать промежуточные кадры по размеру

меньше ключевых, так как в них записано меньше информации

об изображении. Для того чтобы полностью отобразить промежу-

точный кадр, необходимо взять ближайший перед ним ключевой

кадр, а потом последовательно декодировать промежуточные

кадры. Очевидно, что такой способ хорош при воспроизведении

видео (когда все кадры отображаются последовательно: декодеру

нужно лишь сохранять в памяти нужные предыдущие кадры).

При монтаже такой способ хранения информации менее удобен:

во-первых, потому что возрастает среднее время декодирования

одного кадра (для декодирования промежуточного кадра нужно

декодировать не один, а несколько кадров), во-вторых, разрезать

и склеивать видеоряд возможно только так, чтобы первый кадр в

отрезанном куске видеоряда был ключевым.

Двунаправленный кадр также содержит не все изображение.

Но в отличие от промежуточного кадра он может ссылаться и на

следующие за ним кадры, вплоть до следующего промежуточ-

ного кадра (отсюда и происходит его название). Двунаправлен-

ные кадры занимают еще меньше места, чем промежуточные.

Способ декодирования двунаправленного кадра еще сложнее,

чем декодирование промежуточного кадра: сначала по описан-

ной выше схеме декодируется следующий за двунаправленным

промежуточный кадр, далее, используя информацию о соседних

кадрах, декодируется двунаправленный кадр.

Как видно из вышесказанного, чем чаще в видеозаписи рас-

положены ключевые кадры, тем быстрее осуществляется доступ

к произвольному кадру. Но поскольку ключевые кадры занима-

ют наибольший размер, хуже будет сжатие видеозаписи.

Группы кадров. Группой кадров (GOP, Group of Pictures)

называют последовательность между двумя ключевыми кадра-

ми. Подгруппой кадров (Sub GOP) называют последователь-

ность между двумя промежуточными кадрами. Очевидно, когда

в видеоряде сменилась сцена (новый кадр содержит абсолютно

не похожее на предыдущий кадр изображение), имеет смысл

начать новую сцену с ключевого кадра. Алгоритм, который

вставляет ключевой кадр в начале новой сцены, называется «оп-

ределением смены сцены» (scene change detection), он реализо-

ван во всех современных MPEG-4-кодерах.

Поскольку все MPEG-4-кодеры содержат алгоритм обнару-

жения смены сцены, этот параметр традиционно достаточно ве-

лик и равен по умолчанию примерно 10 с (240 – 300 кадров).

Ключевые кадры добавляются кодером в случае необходимости,

а ограничение длины группы кадров больше нужно для облег-

чения перемотки.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]