Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции ССРЭТ 2 и 3 2015.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.92 Mб
Скачать

Сжатие цифровых данных

(аудиовидеосообщений)

Несомненно, одним из основных требований к современной системе связи является необходимость передачи изображений (статических или динамических). Высокая информативность изображения (основное их достоинство) является источником технических проблем при их передаче по каналам связи. Изображение часто бывает избыточным, однако формальные методы устранения избыточности могут привести к потере ценной информации. Удачным решением проблемы было бы эффективное выделение существенной информации при больших потерях остальной. К сожалению, выделение существенной, ценной информации – неформальная процедура.

Представим, что изображение состоит из белого фона и размещенной на нем черной окружности. Однако точно так же достаточно передать только диаметр окружности, ее цвет и декартовы координаты положения на экране. Проблема здесь одна — кодер должен уметь находить на экране эту окружность, как-то измерять ее координаты и диаметр. А приемник, который принимает эту картинку, соответственно должен уметь рисовать окружность по переданным параметрам.

Вот, что значит избыточность — для передачи изображений мы можем передавать значительно меньше информации, но для этого мы должны иметь два устройства — кодер и декодер. Кодер должен уметь находить в изображении все "самое ценное", что можно передать, не нарушив при этом качества изображения, а декодер на основании переданной информации должен уметь заново "нарисовать" (говорят — "декодировать" или "восстановить") переданную телевизионную картинку. Способы поиска "самого ценного", что необходимо передать, и составляют способ видеокомпрессии (например, MPEG2 или H.264).

Похожая ситуация со звуком. Поскольку звук — это комбинация колебаний с разной частотой, амплитудой и фазой, то для передачи звука можно передавать параметры этих колебаний, а не сам звук.

Конечно, описанная картина очень примитивна. Реальное изображение гораздо сложнее окружности, более того, оно не состоит из правильных фигур и оно движется. Именно поэтому выработка оптимальных алгоритмов компрессии потребовала от человечества много времени. Все эти алгоритмы имеют под собой сложную математическую основу и требуют высокой производительности компьютеров.

Степень сжатия

Степень сжатия изображения равна результату деления скорости входного цифрового потока на скорость выходного. Чем больше коэффициент сжатия, тем больше теряется информации при компрессии, и тем меньше скорость компрессированного потока. Таким образом, степень сжатия показывает, во сколько раз уменьшилась скорость потока в результате компрессии. Современные кодеры сжимают изображение более чем в 100 раз.

Для цифрового телевидения стандартной четкости (SD — Standard Definition) при современных методах компрессии достаточно скоростей от 2 до 5 Мбит/сек. Для высокой четкости (HD — High Definition) от 4 до 15 Мбит/сек и более.

Чем меньше скорость компрессированного видео, тем хуже качество изображения. Но следует иметь в виду, что эта зависимость не так однозначна. Чем больше динамика изображения и чем больше на изображении мелких деталей, тем сложнее оно поддается компрессии.

Например, для спортивного телеканала необходима большая скорость компрессированного видео, чем для канала телесериалов при одном и том же качестве телевизионной картинки. Однозначных рецептов по настройке кодирующих устройств не существует и оптимальную скорость компрессии выгоднее искать опытным путем.

Скорость потока не обязательно должна быть постоянной. Кодирующие устройства могут выбирать скорость в зависимости от содержания изображения. Если скорость постоянна, то такой режим работы кодера называют работой с постоянным битрейтом (constant bitrateCBR), если скорость переменна, то работой с переменным битрейтом (variable bitrateVBR).

Потери при компрессии

Визуальные проявления потери информации при компрессии называются артефактами компрессии. Артефакты компрессии выглядят как:

  • шум на малоконтрастных областях:

  • шум при использовании монтажного приема "микс", когда одно изображение плавно переходит в другое;

  • шум по всему изображению на монтажных стыках;

  • легкое двоение на границах участков с разным контрастом ("контуры");

  • появление мелких деталей произвольной формы на границах участков с разным контрастом (иногда только этот дефект называют "артефактами компрессии");

  • различие в яркости и контрасте в форме небольших квадратов, имеющих четкую границу ("блокинг");

  • размытость деталей, снижение контраста и глубины цвета на некоторых областях или на всем изображении ("пластмассовое изображение").

Как правило, если используется хороший кодер, артефакты компрессии практически незаметны. Кроме того, заметность артефакта компрессии зависит от угла, под которым зритель видит телевизионный экран.

Информационная избыточность

При телевизионной передаче различают несколько видов избыточности изображений, на сокращении (сжатие) которых основываются методы и устройства кодирования изображений:

- пространственная — присутствует, если значения элементов изображения (пикселей) коррелированы в пределах некоторой части изображения (видеокадра), т.е. можно передать значение одного пикселя, а значения других предсказать;

- временная — корреляция между одноименными пикселями наблюдается в последовательности нескольких видеокадров, т.е. техника предсказания и передачи движения может быть распространена на несколько кадров;

Иногда оба эти вида избыточности называют статистической избыточностью. Использование корреляционных связей позволяет не передавать многократно одни и те же данные и сокращать за счет этого объем сообщения. При этом устранение статистической избыточности в ТВ сигнале может происходить без потери информации, и исходные данные будут полностью восстановлены.

- психовизуальная (физиологическая) — характеризуется тем, что глаз не способен различать очень мелкие детали и высокочастотные цветовые переходы. Использовать физиологическую избыточность - значит, не передавать ту информацию, которая не будет воспринята нашим зрением. Как следствие, устранение физиологической избыточности связано с частичной потерей информации, но той информации, которая не воспринимается зрением, и ее потеря не повлияет на визуальное качество изображения.

Далее рассмотрим наиболее важные особенности восприятия изображений.

Маскирование по яркости (luminance masking) — имеет отношение к различимости деталей изображения. Для того чтобы различить на сером фоне серый же узор, должны соблюдаться некоторые условия — этот узор должен быть или чуть темнее или чуть ярче фона примерно на 2% от яркости самого фона.

Если разница меньше — человеческий глаз не сможет отличить узор от фона. Таким образом, можно не передавать информацию об объектах, яркость которых отличается от яркости фона на величину, меньшую 2% от яркости фона. Эту особенность восприятия необходимо учитывать при квантизации коэффициентов DCT.

Сходный эффект с маскировкой по яркости называется фальшивыми контурами.

Исходное изображение Фальшивые контуры

(показаны стрелками)

На фотографии фальшивые контуры показаны стрелками. Этот эффект возникает, когда при квантизации выбрано недостаточное количество уровней и информация о непрерывных градиентах яркости передается с искажениями. При компрессии необходимо сводить фальшивые контуры к нулю правильным выбором уровней квантизации.

Маскирование по времени (temporal masking) при быстрой смене изображения, например, на границе сцен, часть информации новой сцены не воспринимается человеком. Зритель как бы кратковременно "привыкает" к новому изображению. Например, если в одном плане демонстрировалась динамичная сцена, а потом произошло переключение на спокойную сцену, то небольшая часть начала спокойной сцены будет проигнорирована головным мозгом. В течение этого короткого периода "адаптации" изображение может быть компрессировано чуть сильнее (с соответствующей потерей качества). Конечно, это не даст сэкономить много, но все же...

Маскирование по детализации (frequency masking) — в области изображения, где содержится большое количество мелких деталей, внимание зрителя ослабляется. Таким образом, зритель не видит каждую мелкую деталь по отдельности, а видит их "совокупно". Пример — рябь на воде. В области же, где деталей мало, каждый мелкий элемент имеет свое значение. Таким образом, области, где деталей больше, можно компрессировать чуть сильнее, чем области, в которых деталей меньше.