
- •Информационная избыточность
- •Методы кодирования
- •Сжатие в кодере mpeg 2
- •Принцип формирования информационного пакета
- •Стандарт кодирования видео- и звуковой информации mpeg-4
- •Объекты и сцены
- •Состав медийных объектов
- •Описание и синхронизация потоков данных для медийных объектов
- •Доставка потоков данных
- •Методы кодирования синтетических видеобъектов
- •Стандарты сжатия видео
- •Международный стандарт кодирования видео h.264/avc
- •Тенденции развития систем сжатия видеоинформации
- •Кодирование нескольких видов динамических изображений - Multiview Video Coding (mvc)
- •H.265/hevc - проект нового стандарта
- •Высокоэффективное кодирование видео hvc
- •Кодирование 3d-видео
- •Реконфигурируемое кодирование видео
Сжатие цифровых данных
(аудиовидеосообщений)
Несомненно, одним из основных требований к современной системе связи является необходимость передачи изображений (статических или динамических). Высокая информативность изображения (основное их достоинство) является источником технических проблем при их передаче по каналам связи. Изображение часто бывает избыточным, однако формальные методы устранения избыточности могут привести к потере ценной информации. Удачным решением проблемы было бы эффективное выделение существенной информации при больших потерях остальной. К сожалению, выделение существенной, ценной информации – неформальная процедура.
Информационная избыточность
При телевизионной передаче различают несколько видов избыточности изображений, на сокращении (сжатие) которых основываются методы и устройства кодирования изображений:
- пространственная — присутствует, если значения элементов изображения (пикселей) коррелированы в пределах некоторой части изображения (видеокадра), т.е. можно передать значение одного пикселя, а значения других предсказать;
- временная — корреляция между одноименными пикселями наблюдается в последовательности нескольких видеокадров, т.е. техника предсказания и передачи движения может быть распространена на несколько кадров;
Иногда оба эти вида избыточности называют статистической избыточностью. Использование корреляционных связей позволяет не передавать многократно одни и те же данные и сокращать за счет этого объем сообщения. При этом устранение статистической избыточности в ТВ сигнале может происходить без потери информации, и исходные данные будут полностью восстановлены.
- психовизуальная (физиологическая) — характеризуется тем, что глаз не способен различать очень мелкие детали и высокочастотные цветовые переходы. Использовать физиологическую избыточность - значит, не передавать ту информацию, которая не будет воспринята нашим зрением. Как следствие, устранение физиологической избыточности связано с частичной потерей информации, но той информации, которая не воспринимается зрением, и ее потеря не повлияет на визуальное качество изображения.
- избыточность телевизионного сигнала (структурная) в соответствии с названием определяется структурой видеосигнала: наличием в аналоговом телевизионном сигнале гасящих импульсов. В цифровом потоке соответствующие им временные интервалы можно исключить или использовать для передачи другой информации, например звукового сопровождения. Только этот вид компрессии позволяет снизить скорость передачи видеоданных на 23-25%.
Методы кодирования
На рисунке 1 представлен вариант классификации методов сжатия, основанный на принципе «с потерями видеоинформации/без потерь».
Рисунок 1 - Классификация методов сжатия (* вейвлет и JPEG в двух классах)
Сжатие данных без потерь (Lossless data compression) — метод сжатия данных, при использовании которого закодированные данные могут быть восстановлены с точностью до бита. При этом оригинальные данные полностью восстанавливаются из сжатого состояния. Для каждого из типов цифровой информации, как правило, существуют свои оптимальные алгоритмы сжатия без потерь.
Сжатие данных без потерь используется во многих приложениях. Например, оно используется во всех файловых архиваторах. Оно также используется как компонент в сжатии с потерями.
Недостатком методов сжатия без потерь является сравнительно небольшой коэффициент сжатия – до 5:1.
Другая группа методов сжатия – методы сжатия видеоданных с потерями информации (Lossy compression). Смысл этого термина состоит в том, что после декодирования данные отличаются от исходных, но степень отличия не является существенной с точки зрения их дальнейшего использования. Например, распределение яркости в восстановленном изображении отличается от того распределения, которое было до его кодирования, т.е. имеет место искажение изображения и соответственно потеря информации. Но зачастую речь идет о той информации, которую зрительная система не в состоянии воспринять в силу присущих ей ограничений.
Коэффициент сжатия данных, который обеспечивают эти методы, может достигать 50:1.
Дискретное косинусное преобразование
Внутрикадровое сокращение избыточной информации основано на дискретном косинусном преобразовании (ДКП), который базируется на преобразовании, предложенном французским математиком Ж. Фурье. Согласно нему, любую периодическую последовательность импульсов можно представить в виде алгебраической суммы простейших синусоидальных колебаний с кратным частотами и убывающими амплитудами. Точное приближение к исходной форме импульса дает практически всегда бесконечный ряд частот, кратных основной.
Совокупность целого ряда убывающих колебаний разных частот образует спектр исходного (в данном случае прямоугольного) импульса.
Передать все составляющие его колебания не просто, так как для этого требуется очень широкая частотная полоса канала связи. И чем короче импульс, т. е. чем мельче деталь изображения, тем более широкой необходима частотная полоса. При недостаточной ширине полосы фазы колебаний с высшими частотами (гармоники) будут изменяться, и колебания будут ослабляться по амплитуде, что приведет к потере качества изображения.
Пиксель как сигнал можно анализировать, если перевести его из амплитудно-временного представления в амплитудно-частотное, т. е. получить его частотный спектр. В спектре наглядно видны колебания, расположенные в низкочастотной области, несущие основную энергию и формирующие амплитуду импульса-пикселя, а также колебания менее значимые, находящиеся в высокочастотной области спектра, формирующие крутизну фронта и спада, определяющие ширину частотной полосы, занимаемую пикселем (рис. 2).
В большинстве случаев колебания в крайне правой высокочастотной области спектра значительной роли для пикселя, как составляющего элемента видеосигнала, не имеют. То есть передаются только те коэффициенты, которые превышают пороговую величину, а остальные считаются нулевыми. Введение порога, строго говоря, приводит к потерям информации и, соответственно, к снижению качества изображения, однако при оптимальном выборе величины порога такое ухудшение окажется практически незаметным.
На рис. 2 выделены колебания с менее значимыми частотами и амплитудами, которые можно удалить, что приведет к некоторому снижению четкости и контрастности видеоизображения, с одной стороны, но с другой, даст возможность: значительно сузить частотную полосу, занимаемую видеосигналом и уменьшить необходимый объем памяти для запоминания значений оставшихся амплитуд и частот.
На этом построено уменьшение видеоинформации при внутрикадровом сжатии цифровых данных на основе ДКП.
Основная цель внутрикадрового сжатия цифровой информации на основе ДКП заключается в сужении частотной полосы, занимаемой видеосигналом, путем заранее определяемых амплитудно-частотных потерь некоторых высокочастотных колебаний его составляющих, но без заметных для глаза снижений четкости и контрастности изображения.
Методы сжатия высокообъемных видеопотоков
Различные методы сжатия были разработаны для движущихся изображений, которые впоследствии были объединены аббревиатурой MPEG (экспертная группа по движущимся объектам в составе ISO). Есть несколько различных вариантов MPEG: MPEG 1, MPEG 2 и MPEG 4, принятых впоследствии как стандарты для мультимедийного оборудования, цифровых видеодисков (DVD) и ТВ с высокой разрешающей способностью (HDTV).
MPEG работает с движущимися объектами. Но важно подчеркнуть, что MPEG — не алгоритм сжатия, а скорее сжатый поток информации, т.е. MPEG определяет организацию цифровой информации для записи, воспроизведения и передачи. Фактически алгоритмы сжатия зависят от различной используемой аппаратуры и могут отличаться по своему качеству.
Работа стандарта MPEG схожа с работой по сжатию в соответствии со стандартами серии Н и JPEG. Основное отличие состоит в том, что MPEG использует на очередном шаге межкадровую зависимость.
|
Рисунок 3 – Последовательность соседних кадров
Идея, лежащая в основе межкадрового сжатия видеосигнала, предельно проста. Суть ее в следующем: в общей последовательности кадров соседние кадры мало отличаются друг от друга. Например, события развиваются на фоне неба, футбольного поля, леса и т. п., которые мало изменяются от кадра к кадру и различия между соседними кадрами очень незначительны.
В большинстве случаев, зная распределение яркостных и цвето- разностных данных одного кадра, можно с высокой вероятностью предсказать их распределение в ближайшем соседнем кадре.
Если изображения соседних кадров очень похожи, то передавать по каналу связи всю информацию, содержащуюся в каждом отдельном кадре, нет необходимости. Объем цифрового потока можно уменьшить и передавать данные только одного кадра, предварительно подвергнув его изображение ДКП, получив так называемый опорный кадр. После этого, сравнивая соседний кадр с опорным, передается только разностная информация, указывающая на то, чем соседний текущий кадр отличается от опорного. Опорный кадр эпизодически заменяется через определенное количество промежуточных кадров новым в соответствии со сменой деталей сюжета.