- •Пояснительная записка
- •Задание
- •Оглавление
- •Реферат
- •Обработка видео на компьютере
- •Цифровое видео
- •Видеосигналы: характеристики и способы передачи
- •Основные понятия цифрового видео
- •Формат контейнера видеозаписи
- •Методы сжатия видео mpeg-4-кодеров
- •Контроль параметров цифрового видео
- •Что такое mpeg Структура mpeg-последовательности.
- •Использование mpeg mpeg-1
- •Видео киоски.
- •Видео по требованию (Video on Demand) .
- •Видео по телефону.
- •Обучение.
- •Презентации.
- •Видеобиблиотеки.
- •Кабельное телевидение (catv: Cable Television)
- •Направленное спутниковое вещание (dbs: Direct Broadcast Satellite).
- •Твч – телевидение высокой четкости (hdtv: High-Definition Television)
- •Различия между mpeg и QuickTime с Indeo
- •Video-cd
- •Заключение.
Основные понятия цифрового видео
Кодирование цвета. Карты захвата видео предоставляют
возможность сохранить поток данных в таком же виде, в каком
они выходят с чипа оцифровки видео. Эти чипы выдают инфор-
мацию не в привычном для компьютера формате в виде набора
цветовых компонентов RGB (red, green, blue), а в виде яркостной
и двух цветовых составляющих (YUV). Причем для группы из
двух последовательно идущих пикселей сохраняются два значе-
ния яркости и по одному значению цветовых компонентов,
т. е. получается 4 байта на 2 пикселя или 16 бит на пиксель. Та-
кой метод называют chroma subsampling, а способ записи назы-
вают кодированием цвета YUV2 (или YUYV, или 4:2:2). Из-за
особенностей человеческого зрения разницу с обычным RGB-
представлением увидеть практически невозможно: глаз более
чувствителен к яркости, чем к цвету (точнее, разрешающая спо-
собность глаза по яркости выше, чем по цвету, за счет разной
концентрации колбочек и палочек на сетчатке). Этот метод по-
зволяет значительно снизить объем информации для оцифро-
ванного видео: если сохранять привычные 24 бита на пиксель
вместо 16, то потребуется в 1,5 раза больше места, поскольку
информация с карты захвата поступает уже в YUV2.
Также распространен метод кодирования YUV12
(или 4:1:1) – в нем общие значения цветовых компонентов име-
ют группы 2×2 пикселя. Для 4 пикселей сохраняется 4 байта яр-
кости, 1 байт цветности U и 1 байт цветности V, в среднем по-
лучается 12 бит на пиксель (отсюда название).
Поток данных (bitrate). Потоком данных называют количе-
ство информации в сжатом виде, приходящееся на единицу вре-
мени для какой-либо записи и измеряемое в битах в секунду или
байтах в секунду. При захвате видеосигнала происходит сжатие
информации. При этом используются два способа ее сжатия: с
постоянным потоком данных (CBR, constant bitrate) и с пере-
менным потоком данных (VBR, variable bitrate). В первом вари-
анте каждый блок данных сжатого файла (который имеет опре-
деленную длительность при воспроизведении) имеет постоян-
ный размер. Соответственно поток данных не меняется на про-
тяжении всего файла. В случае переменного потока данных ка-
ждый блок по выбору кодера может иметь больший или мень-
ший размер. Поскольку реальные сигналы имеют постоянно из-
меняющуюся сложность, метод кодирования с переменным по-
током данных оказался эффективнее.
Примечание. Кодер (coder) – программа для кодирования
сжимаемой информации. Декодер (decoder) – программа для
декодирования сжатой информации.
С точки зрения изменения сложности для сжатия видеоин-
формация существенно сложнее, чем звуковая. Статичные сце-
ны, где из кадра в кадр меняется лишь малая часть изображения,
сменяются динамичными, где во время взрывов и погонь слож-
но найти два одинаковых кадра. Первые реализации MPEG-
кодеров использовали сжатие видео с постоянным потоком дан-
ных (в частности стандарт Video CD, MPEG-1-сжатие). Однако
это давало настолько удовлетворительные результаты, что сжа-
тие видео с постоянным потоком данных не используется.
Поток данных в формате MPEG может содержать три типа
кадров: ключевые кадры (keyframe, intra-frame, I-frame), проме-
жуточные (predictable, forward predictable, P-frame) и двунаправ-
ленные (backward predictable, bi-directional, BiDir, B-frame).
Ключевой кадр содержит всю информацию об изображении
в кадре и не зависит от других кадров.
Промежуточный кадр может ссылаться на блоки изображе-
ния в предыдущем ключевом или предыдущих промежуточных
кадрах. Это позволяет делать промежуточные кадры по размеру
меньше ключевых, так как в них записано меньше информации
об изображении. Для того чтобы полностью отобразить промежу-
точный кадр, необходимо взять ближайший перед ним ключевой
кадр, а потом последовательно декодировать промежуточные
кадры. Очевидно, что такой способ хорош при воспроизведении
видео (когда все кадры отображаются последовательно: декодеру
нужно лишь сохранять в памяти нужные предыдущие кадры).
При монтаже такой способ хранения информации менее удобен:
во-первых, потому что возрастает среднее время декодирования
одного кадра (для декодирования промежуточного кадра нужно
декодировать не один, а несколько кадров), во-вторых, разрезать
и склеивать видеоряд возможно только так, чтобы первый кадр в
отрезанном куске видеоряда был ключевым.
Двунаправленный кадр также содержит не все изображение.
Но в отличие от промежуточного кадра он может ссылаться и на
следующие за ним кадры, вплоть до следующего промежуточ-
ного кадра (отсюда и происходит его название). Двунаправлен-
ные кадры занимают еще меньше места, чем промежуточные.
Способ декодирования двунаправленного кадра еще сложнее,
чем декодирование промежуточного кадра: сначала по описан-
ной выше схеме декодируется следующий за двунаправленным
промежуточный кадр, далее, используя информацию о соседних
кадрах, декодируется двунаправленный кадр.
Как видно из вышесказанного, чем чаще в видеозаписи рас-
положены ключевые кадры, тем быстрее осуществляется доступ
к произвольному кадру. Но поскольку ключевые кадры занима-
ют наибольший размер, хуже будет сжатие видеозаписи.
Группы кадров. Группой кадров (GOP, Group of Pictures)
называют последовательность между двумя ключевыми кадра-
ми. Подгруппой кадров (Sub GOP) называют последователь-
ность между двумя промежуточными кадрами. Очевидно, когда
в видеоряде сменилась сцена (новый кадр содержит абсолютно
не похожее на предыдущий кадр изображение), имеет смысл
начать новую сцену с ключевого кадра. Алгоритм, который
вставляет ключевой кадр в начале новой сцены, называется «оп-
ределением смены сцены» (scene change detection), он реализо-
ван во всех современных MPEG-4-кодерах.
Поскольку все MPEG-4-кодеры содержат алгоритм обнару-
жения смены сцены, этот параметр традиционно достаточно ве-
лик и равен по умолчанию примерно 10 с (240 – 300 кадров).
Ключевые кадры добавляются кодером в случае необходимости,
а ограничение длины группы кадров больше нужно для облег-
чения перемотки.