
ЛЕКЦИЯ 11 УМЕНЬШЕНИЕ ИЗБЫТОЧЧНОСТИ ВИДЕОСИГНАЛА.
ЦЕЛЬ ЛЕКЦИИ: Показать, что учет психофизических факторов при обработке видеосигнала в сочетании с методами статистического кодирования позволяет существенно уменьшить поток данных в канале связи. Дать краткую характеристику стандарта JPEG - основы стандартов MPEG.
Около 100 лет киноиндустрия эксплуатирует важное свойство глаза – инерционность зрения. Свойство это заключается в том, что, когда изображение воздействует на глаз, мгновенное прекращение действия раздражителя не приводит к такому же мгновенному прекращению сигналов в зрительном нерве и зрительных центрах обработки. Вместо этого имеет место экспоненциальная задержка с относительно длительным периодом времени, необходимым для полного затухания сигнала. Данное свойство человеческого зрения использовано при проектировании аналогового телевидения. Еще более существенную роль играет этот фактор при проектировании систем цифрового телевидения, когда величину цифрового потока данных приходится согласовывать с возможностями существующих линий связи.
Сэр Исаак Ньютон, опубликовав в 1704 году фундаментальный труд “Оптика”, изложил в нем результаты опытов по разложению света на спектральные составляющие, выдвинул корпускулярную теорию света, интуитивно полагая, что природа света может быть несколько иной. Дальнейшие исследования выявили волновую природу света и диапазон волн (380 – 780 нм), которые воспринимаются человеческим глазом. Исследования физиологов показали, что глаз человека (точнее элемент сетчатки глаза – колбочки) способен воспринимать длины волн различных цветов в силу того, что колбочки содержат три фоточувствительных химических соединения, каждое из которых обладает чувствительностью в трех широких областях светового спектра. Проще всего представить это в виде трех отдельных, но перекрывающихся фотохимических процессов: низкочастотного (с большой длиной волны) КРАСНОГО процесса, среднечастотного ЗЕЛЕНОГО процесса и высокочастотного СИНЕГО процесса. Когда свет определенной частоты попадает на сетчатку, его действие избирательно отражается на работе этого частотно – селективного механизма. Когда мы воспринимаем объект красного цвета, то испытываем высокий уровень активности в длинноволновом (низкочастотном) процессе и низкий уровень в двух других. Объекты синего цвета стимулируют коротковолновый (высокочастотный) процесс и т. д. Когда мы воспринимаем объекты промежуточного цвета, вступает в действие смесь двух химических процессов. Таким образом, полная цветовая гамма воспринимается как комбинация трех основных цветов: красного, зеленого, синего. Использование трех цветов в технике телевидения (метамерия) заключается в том, что мы видим желтый цвет, как если бы действительно существовал его источник, хотя на самом деле это одновременно активируются красный и зеленый элементы на экране трубки.
В технике цифровой обработки изображений широко используется преобразование основных цветов в пространство яркостных и цветоразностных сигналов, что позволяет существенно сократить избыточность, присущую исходному изображению.
Используется для целей сжатия и такое свойство человеческого зрения как эффект маскирования. Наблюдатель может заметить незначительные ошибки на фрагменте изображения, если фрагмент является простым (близок к равномерному участку). Проявляется эффект в том, что, если фрагмент имеет сложное содержание, которое не может быть “предсказано” зрительной системой наблюдателя, то ошибки и даже отдельные объекты на нем останутся незамеченными. Данное правило не действует, если содержание фрагмента может быть предсказано зрительной системой, например, на текстурах (отсутствие одного кирпича в кладке легко заметить).
Эффект Маха. Его сущность заключается в подчеркивании (обострении крутизны) резких переходов в изображениях вплоть до появления выбросов. На черно-белом перепаде участок со стороны черного вблизи границы кажется еще более черным, а со стороны белого – еще более белым. Детали перехода (его точную форму) зрительная система зарегистрировать в значительной степени не в состоянии. Это дает возможность реализовать более грубое квантование трансформант на таких участках.
Обсуждая варианты классификации алгоритмов сжатия(см. материалы лекции 7), мы определили группы алгоритмов, осуществляющих сжатие данных с потерями и без потерь. Использование алгоритмов сжатия с потерями (частично) данных основано на особенностях психофизических свойств человека, в частности, свойствах зрения. Рассмотрим один из таких алгоритмов.
Сжатие с потерями по формату jpeg.
Объединенная группа экспертов по компьютерной обработке фотографических изображений - Joint Photographic Expert Group (JPEG) - была совместно образована Международным Союзом Электросвязи (International Telecommunications Union - ITU) и ISO в 1986 году. Ее задачей являлась разработка стандарта представления неподвижных цифровых изображений и первую спецификацию такого стандарта группа опубликовала в 1991 году. Тремя годами позже - в 1994 году - эта спецификация была признана индустриальным стандартом кодирования неподвижных изображений и зарегистрирована как ISO/IEC 10918-1. JPEG — графический стандарт, созданный на основе одноименного алгоритма сжатия изображений с потерей качества, кодирующего не идентичные элементы, как алгоритм LZW, а межпиксельные интервалы. В упрощенном виде механизм сжатия изображения в файл формата JPEG выглядит следующим образом. Первой ступенью компрессии является преобразование изображения в цветовой образ LAB, раскладывающий картинку на три независимых канала, один из которых (Lightness – яркость, интенсивность) выделен для сохранения значений интенсивности цветов, а два других (А и В) — для запоминания непосредственно цветовой информации. Причем данные о цветах сохраняются в виде шкалы, организованной по принципу непрерывного спектра. Вторя ступень — собственно компрессия: из получившейся цветовой модели удаляются приблизительно три четверти информации о цвете, затем образ дробится на участки размером 8x8 точек и преобразуется в числовой массив данных. Заголовок каждого блока описывает доминирующий цвет участка, остальная информация — менее заметные оттенки. На третьей ступени сжатия из массива данных удаляется определенная часть информации, описывающей второстепенные оттенки, причем количество изымаемых данных зависит от выбранного пользователем качества результирующего изображения. И наконец, готовый файл сжимается согласно алгоритму Хаффмана, который предусматривает замену наиболее часто встречающихся в массиве данных знаков более компактной двух битной кодировкой. Декомпрессия файла JPEG происходит в обратном порядке.
Сжатие по формату JPEG позволяет обеспечить достаточно высокие коэффициенты сжатия при сохранении высокого качества изображений. Полноцветное изображение размером 727 х 525, например, занимает 145 Кбайт. GIF – версия этого изображения имела 240 Кбайт (коэффициент сжатия 4,8 с использованием алгоритма LZW). Версия JPEG стандартного качества заняла всего 58 Кбайт (сжатие19,7), причем по результатам визуальной оценки эта версия была выше GIF – версии (поскольку GIF, хотя и обеспечивает кодирование без потерь, способен к представлению данных в пределах палитры 156 цветов). Считается, что JPEG может кодировать цветное изображение, по качеству практически неотличимое от подлинника, используя около одного бита на элемент.
В методе JPEG используют пространственную корреляцию сигналов отдельных пикселей, а также некоторые свойства зрительного анализатора, рассмотренные выше. Можно выделить следующие этапы реализации сжатия:
- преобразование изображения RGB в цветовое пространство Y, CR,CB (в пространство яркостного и цветностных сигналов);
- субдискретизация (кодирование сигналов цветности не требуется производить в полном разрешении, и часть из них может быть либо пропущена, либо произведено усреднение);
- дискретное косинусное преобразование DCT;
- квантование результатов DCT (эта операция вносит потери);
- кодирование - сжатие модифицированным методом Хаффмана, либо арифметическим кодированием (статистическое сокращение избыточности).
Блок-схема алгоритма обработки данных по формату JPEG выглядит следующим образом