Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция 4_2012.docx
Скачиваний:
23
Добавлен:
23.11.2019
Размер:
1.43 Mб
Скачать

Сжатие цифровых данных

(аудиовидеосообщений)

Несомненно, одним из основных требований к современной системе связи является необходимость передачи изображений (статических или динамических). Высокая информативность изображения (основное их достоинство) является источником технических проблем при их передаче по каналам связи. Изображение часто бывает избыточным, однако формальные методы устранения избыточности могут привести к потере ценной информации. Удачным решением проблемы было бы эффективное выделение существенной информации при больших потерях остальной. К сожалению, выделение существенной, ценной информации – неформальная процедура.

Информационная избыточность

При телевизионной передаче различают несколько видов избыточности изображений, на сокращении (сжатие) которых основываются методы и устройства кодирования изображений:

- пространственная — присутствует, если значения элементов изображения (пикселей) коррелированы в пределах некоторой части изображения (видеокадра), т.е. можно передать значение одного пикселя, а значения других предсказать;

- временная — корреляция между одноименными пикселями наблюдается в последовательности нескольких видеокадров, т.е. техника предсказания и передачи движения может быть распространена на несколько кадров;

Иногда оба эти вида избыточности называют статистической избыточностью. Использование корреляционных связей позволяет не переда­вать многократно одни и те же данные и сокращать за счет этого объ­ем сообщения. При этом устранение статистической избыточности в ТВ сигнале может происходить без потери информации, и исходные данные будут полностью восстановлены.

- психовизуальная (физиологическая) — характеризуется тем, что глаз не способен различать очень мелкие детали и высокочастотные цветовые переходы. Использовать физиологическую избыточность - значит, не переда­вать ту информацию, которая не будет воспринята нашим зрением. Как следствие, устранение физиологической избыточности связано с частичной потерей информации, но той информации, которая не вос­принимается зрением, и ее потеря не повлияет на визуальное качест­во изображения.

- избыточность телевизионного сигнала (структурная) в соответствии с названием определя­ется структурой видеосигнала: наличием в аналоговом телевизион­ном сигнале гасящих импульсов. В цифровом потоке соответствую­щие им временные интервалы можно исключить или использовать для передачи другой информации, например звукового сопровожде­ния. Только этот вид компрессии позволяет снизить скорость переда­чи видеоданных на 23-25%.

Методы кодирования

На рисунке 1 представлен вариант классификации методов сжатия, основанный на принципе «с потерями видеоинформации/без потерь».

Рисунок 1 - Классификация методов сжатия (* вейвлет и JPEG в двух классах)

Сжатие данных без потерь (Lossless data compression) — метод сжатия данных, при использовании которого закодированные данные могут быть восстановлены с точностью до бита. При этом оригинальные данные полностью восстанавливаются из сжатого состояния. Для каждого из типов цифровой информации, как правило, существуют свои оптимальные алгоритмы сжатия без потерь.

Сжатие данных без потерь используется во многих приложениях. Например, оно используется во всех файловых архиваторах. Оно также используется как компонент в сжатии с потерями.

Недостатком методов сжатия без потерь является сравнительно небольшой коэффициент сжатия – до 5:1.

Другая группа методов сжатияметоды сжатия видеоданных с потерями информации (Lossy compression). Смысл этого термина состоит в том, что после декодирования данные отличаются от исходных, но степень отличия не является существенной с точки зрения их дальнейшего использования. Например, распределение яркости в восстановленном изображении отличается от того распределения, которое было до его кодирования, т.е. имеет место искажение изображения и соответственно потеря информации. Но зачастую речь идет о той информации, которую зрительная система не в состоянии воспринять в силу присущих ей ограничений.

Коэффициент сжатия данных, который обеспечивают эти методы, может достигать 50:1.

Дискретное косинусное преобразование

Внутрикадровое сокращение избыточной информации основано на дискретном косинусном преобразовании (ДКП), который базируется на преобразовании, предложенном французским математиком Ж. Фурье. Согласно нему, любую периодическую последовательность импуль­сов можно представить в виде алгебраической суммы простейших синусоидальных колебаний с кратным частотами и убывающими ам­плитудами. Точное приближение к исходной форме импульса дает практически всегда бесконечный ряд частот, кратных основной.

Совокупность целого ряда убывающих колебаний разных частот об­разует спектр исходного (в данном случае прямоугольного) импульса.

Передать все составляющие его колебания не просто, так как для этого требуется очень широкая частотная полоса канала связи. И чем короче импульс, т. е. чем мельче деталь изображения, тем более ши­рокой необходима частотная полоса. При недостаточной ширине полосы фазы колебаний с высшими частотами (гармоники) будут изменяться, и колебания будут ослабляться по амплитуде, что приведет к потере качества изображения.

Пиксель как сигнал можно анализировать, если перевести его из амплитудно-временного представления в амплитудно-частотное, т. е. получить его частотный спектр. В спектре наглядно видны колебания, расположенные в низкочастотной области, несущие основную энер­гию и формирующие амплитуду импульса-пикселя, а также колебания менее значимые, находящиеся в высокочастотной области спектра, формирующие крутизну фронта и спада, определяющие ширину час­тотной полосы, занимаемую пикселем (рис. 2).

Рисунок 2 - Частотный спектр пикселя - элемента яркости

В большинстве случаев колебания в крайне правой высокочастот­ной области спектра значительной роли для пикселя, как составляю­щего элемента видеосигнала, не имеют. То есть передаются только те коэффициенты, которые превышают пороговую величину, а ос­тальные считаются нулевыми. Введение порога, строго говоря, при­водит к потерям информации и, соответственно, к снижению качества изображения, однако при оптимальном выборе величины порога та­кое ухудшение окажется практически незаметным.

На рис. 2 выделены колебания с менее значимыми частотами и амплитудами, которые можно удалить, что приведет к некоторому снижению четкости и контрастности видеоизображения, с одной сто­роны, но с другой, даст возможность: значительно сузить частотную полосу, занимаемую видеосигналом и уменьшить необходимый объ­ем памяти для запоминания значений оставшихся амплитуд и частот.

На этом построено уменьшение видеоинформации при внутрикадровом сжатии цифровых данных на основе ДКП.

Основная цель внутрикадрового сжатия цифровой информации на основе ДКП заключается в сужении частотной полосы, занимаемой ви­деосигналом, путем заранее определяемых амплитудно-частотных по­терь некоторых высокочастотных колебаний его составляющих, но без заметных для глаза снижений четкости и контрастности изображения.

Методы сжатия высокообъемных видеопотоков

Различные методы сжатия были разработаны для движущихся изображений, которые впоследствии были объединены аббревиатурой MPEG (экспертная группа по движущимся объектам в составе ISO). Есть несколько различных вариантов MPEG: MPEG 1, MPEG 2 и MPEG 4, принятых впоследствии как стандарты для мультимедийного оборудования, цифровых видеодисков (DVD) и ТВ с высокой разрешающей способностью (HDTV).

MPEG работает с движущимися объектами. Но важно подчеркнуть, что MPEG — не алгоритм сжатия, а скорее сжатый поток информации, т.е. MPEG определяет организацию цифровой информации для записи, воспроизведения и передачи. Фактически алгоритмы сжатия зависят от различной используемой аппаратуры и могут отличаться по своему качеству.

Работа стандарта MPEG схожа с работой по сжатию в соответствии со стандартами серии Н и JPEG. Основное отличие состоит в том, что MPEG использует на очередном шаге межкадровую зависимость.

Рисунок 3 – Последовательность соседних кадров

Идея, лежащая в основе межкадрового сжатия видеосигнала, пре­дельно проста. Суть ее в следующем: в общей последовательности кадров соседние кадры мало отличаются друг от друга. Например, события развиваются на фоне неба, футбольного поля, леса и т. п., которые мало изменяются от кадра к кадру и различия между сосед­ними кадрами очень незначительны.

В большинстве случаев, зная распределение яркостных и цвето- разностных данных одного кадра, можно с высокой вероятностью предсказать их распределение в ближайшем соседнем кадре.

Если изображения соседних кадров очень похожи, то передавать по каналу связи всю информацию, содержащуюся в каждом отдель­ном кадре, нет необходимости. Объем цифрового потока можно уменьшить и передавать данные только одного кадра, предваритель­но подвергнув его изображение ДКП, получив так называемый опор­ный кадр. После этого, сравнивая соседний кадр с опорным, переда­ется только разностная информация, указывающая на то, чем сосед­ний текущий кадр отличается от опорного. Опорный кадр эпизодиче­ски заменяется через определенное количество промежуточных кад­ров новым в соответствии со сменой деталей сюжета.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]