Учебники / Цифровое телевизионное вещание под редакцией Г. В. Мамчев, 2014
.pdf100 |
3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии |
больше данных об ошибке предсказания должно быть передано, а это сни жает эффективность компрессии. Компенсация движения при формирова нии предсказания уменьшает ошибку предсказания, которая на практике не может быть сведена к нулю. Этому мешают и изменения размеров дви ЖУIЦегося объекта, его поворота, неточности в определении вектора дви жения и т.п. Однако предсказание с компенсацией движения позволяет значительно повысить эффективность ДИКМ при видеокомпрессии.
В декодере выполняется инверсное квантование, инверсное ДКП, в
результате чего формируется ошибка предсказания. Ошибка предсказания складывается с декодированным изображением преДЫДУIЦего кадра, обра зуя декодированное изображение TeKYIЦeгo кадра.
Предсказатели с компенсацией движения в современных системах ви
деокомпрессии стандарта МPEG-2 могут использовать целый ряд методов. Например, макроблок может предсказываться на основе преДЫДУIЦего изо бражения, на основе послеДУЮIЦего изображения, а также на основе и пре
ДЫДYIЦeгo, и послеДУЮIЦего. В чересстрочных системах поля одного кадра
могут предсказываться раздельно с использованием разных векторов дви
жения или вместе с использованием оБIЦего вектора. CYIЦecTByeT также возможность нулевого предсказания (если не найден ПОДХОДЯIЦИЙ опор
ный макроблок). При этом сам текуIЦИЙ макроблок будет кодироваться
вместо ошибки предсказания, что означает отказ от межкадрового кодиро вания и переход к внутрикадровому. Для каждого TeKYIЦeгo макроблока кодер выбирает метод предсказания, обеспечиваюIЦИЙ наивысшее качество декодированного изображения с учетом ограничений на скорость передачи данных. Сведения о методе предсказания включаются в оБIЦИЙ поток и пе редаются декодеру для верного восстановления изображения.
Оценка вектора движения и определение наилучшей стратегии пред сказания требуют применения сложных вычислительных процедур, кото рые должны ОСУIЦествляться в реальном времени. Поэтому кодер гораздо сложнее декодера, то есть в стандарте МPEG-2 система компрессии на базе ДИКМ с компенсацией движения является асимметричной.
3.2.5. Использование ДКП в стандарте кодирования MPEG-2
Цель внутрикадрового кодирования, обеспечиваЮIЦего преобразование
видеоинформации из временн6й области в спектральную, - сокращение nространственной избыточности в пределах кадра (или поля) телевизион
ного изображения. Эта избыточность вызвана сильными корреляционными связями между элементами изображения. Если найти соотвеТСТВУЮIЦее ор
тогональное преобразование, то можно преобразовать массив отсчетов изо бражения в матрицу коэффициентов (трансформантов), которые уже не бу дут коррелированны друг с другом. К этим некоррелированным коэффици ентам можно применить энтропийное кодирование и добиться сокраIЦения
3.2. Международный стандарт кодирования с информационным сжатием МPEG-2 |
101 |
цифрового потока. Наиболее часто используются методы линейных ортого нальных преобразованиЙ. Линейность ортогонального преобразования оз
начает, что операции сложения, вычитания и умножения на скаляр действи
тельны и после преобразования, а ортогональность - что преобразуемый фрагмент представляется ограниченным набором ортогональных функций.
Линейные ортогональные преобразования характеризуются тем, что между элементами изображения устраняются статистические зависимости и распределение энергии в преобразованном спектральном фрагменте являет ся неравномерным. Эти особенности используются непосредственно в про цессах кодирования. На практике можно подобрать такое ортогональное преобразование, что для типичных изображений б6льшая часть коэффици ентов матрицы будет иметь практически нулевые значения. Исключая эти нулевые коэффициенты, можно также сокращать цифровой поток. Среди возможных ортогональных преобразований наиболее широко используется ДКll, основанное на применении ортогональной системы дискретных ко синусных функций возрастающей частоты. Преобразования данного типа
хорошо согласуются с параметрами телевизионного сигнала, что является
необходимым условием эффективного кодирования видеоинформации.
Стандарт МPEG-2 подразумевает применение ДКП составляющих ви
деосигнала. Например, ДКП действительной последовательности отсчетов
х(n) при n = О, 1, ... , N - 1 определяется соотношением
N-1
ХС(k ) =(1/.JN) L с(k )х(n )cos [( 2n +1)kтc/2N] ,
n=О
( ) 1 при
где коэффициенты с k =12 при
k =0
k=l" 2 ... , N-1 .
Обратное ДКП, восстанавливающее исходную последовательность отсче
тов по последовательности коэффициентов преобразования Хс (k ), зада
ется выражением
1N-1
x(n)=(.JN)- L c(k)Xc(k)cos[(2n+1)kтc/2N],
k=O
гдеk=О, 1, ... ,N-1.
ДКП сокращает избыточность и высокочастотную информацию в
пределах кадра. Это позволяет получить высокое качество кодированных изображений с сжатием.
ДКП выполняется поблочно, для чего телевизионное изображение раз
бивается на блоки. При этом в телевизионном кадре создается: 576/8 = 72 зоны по вертикали и 704/8 = 88 зон по горизонтали, что в общей сложности дает 72 х 88 = 6336 блоков, подлежащих ДКП в реальном масштабе време ни. В результате ДКП исходная сигнальная матрица 8 х 8 = 64 телевизион ных отсчетов преобразуется в матрицу частотных коэффициентов ДКП та кого же размера 8 х 8 = 64 (рис. 3.6).
102 |
|
|
3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕНИИ |
||||||||||||||||
а) |
|
|
|
|
|
|
|
|
|
б) |
|
|
|
|
|
|
|
|
|
И11 |
И12 |
И13 |
|
И14 |
И15 |
И16 |
И17 |
И18 |
У11 |
У12 |
У13 |
У14 |
У15 |
У16 |
У17 |
У18 |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И21 |
И22 |
И2З |
|
И24 |
И25 |
И26 |
И27 |
И28 |
|
У21 |
У22 |
У2З |
У24 |
У25 |
У26 |
У27 |
У28 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ИЗl |
ИЗ2 |
Изз |
|
ИЗ4 |
ИЗ5 |
ИЗ6 |
ИЗ7 |
ИЗ8 |
|
УЗl |
УЗ2 |
Узз |
УЗ4 |
УЗ5 |
УЗ6 |
УЗ7 |
УЗ8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И41 |
И42 |
И4З |
|
И44 |
И45 |
И46 |
И47 |
И48 |
|
У41 |
У42 |
У4З |
У44 |
У45 |
У46 |
У47 |
У48 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И51 |
И52 |
И5З |
|
И54 |
И55 |
И56 |
И57 |
И58 |
|
У51 |
У52 |
У5З |
У54 |
У55 |
У56 |
У57 |
У58 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Иб1 |
Иб2 |
И6З |
|
И64 |
И65 |
И66 |
ИЫ |
И68 |
|
Уб1 |
Уб2 |
У6З |
У64 |
У65 |
У66 |
УЫ |
У68 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И71 |
ИП |
И73 |
|
И74 |
И75 |
И76 |
ИП |
И78 |
|
У71 |
УП |
У73 |
У74 |
У75 |
У76 |
УП |
У78 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И81 |
И82 |
И83 |
|
И84 |
И85 |
И86 |
И87 |
И88 |
|
У81 |
У82 |
У8З |
У84 |
У85 |
У86 |
У87 |
У88 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
И11 ••• И88 - |
совокупность отсчетов телевизионного сигнала |
|
|
|
|
|
||||||||||||
|
У11 ••• У88 - |
совокупность частотных коэффициентов |
|
|
|
|
|
|
|||||||||||
Рис. 3.6. ДКП отсчетов телевизионного изображения:
а) сигнальная матрица отсчетов телевизионного изображения; б) матрица частотных коэффициентов ДКП
Каждый коэффициент характеризует амплитуду определенной частот ной составляющей кадра, причем коэффициенты в матрице располагаются
по возрастанию частот в вертикальном и горизонтальном направлениях.
Поскольку положение телевизионных отсчетов сигнальной матрицы
определяется двумя координатами, то частотные коэффициенты матрицы ДКП являются функциями этих двух переменных. Следует отметить, что матрица частотных коэффициентов ДКП уже не имеет прямой геометриче
ской связи с положением отсчетов телевизионного сигнала на телевизион
ном растре, а представляет собой только удобную форму математической записи, при которой частотные коэффициенты ДКЛ можно трактовать
как двумерный спектр телевизионного изображения в горизонтальном и вертикальном направлениях телевизионного кадра. Каждый частотный ко
эффициент ДКП содержит информацию не об одном отсчете телевизион
ного изображения из сигнальной матрицы, а обо всех 64 элементах.
При этом справедливо и обратное положение - знание матрицы коэф фициентов, то есть значений амплитуд базисных косинусоидальных функ ций разных частот, позволяет сформировать блок элементов изображения (сигнальную матрицу). Таким образом, ДКП является обратимым.
Спектр ДКП имеет очень важную, если ее оценивать с позиций ком прессии видеоданных, особенность: для большинства блоков типичных изображений основная энергия частотных составляющих этого спектра концентрируется в небольшой области около нулевых частот. Например,
постоянная составляющая и несколько низкочастотных базисных функций, имеющих значимые величины, отображаются совокупностью коэффици ентов ДКП в левом верхнем углу матрицы. Амплитуда высокочастотных
составляющих или мала, или просто равна нулю, поэтому их потеря почти
не сказывается на качестве изображения. Передаче подлежат только те час-
3.2. Международный стандарт кодирования с информационным сжатием МPEG-2 |
103 |
тотные коэффициенты матрицы ДКП, величины которых превышают при нятые пороговые значения, коэффициенты ниже порогового значения счи
TaюTcя нулевыми, что и приводит К желаемой компрессии.
Введение пороговой (нелинейной) обработки, строго говоря, ведет к потерям информации и, соответственно, к снижению качества восстанов ленного в декодере телевизионного изображения. Однако при разумном выборе величины порога это ухудшение окажется практически незамет
ным или же допустимым.
Следует отметить, что при внутрикадровом кодировании динамиче ский интервал коэффициентов ДКЛ возрастает в восемь раз. Так, при уровневом кодировании видеосигнала восемью битами его динамический интервал равен 0 ... 250 дискретных уровней. При этом динамический ин тервал коэффициентов спектра ДКП составит от О до 2040 и от -1020 до +1020 дискретных уровней для коэффициентов постоянной и переменных
составляющих ДКП, соответственно.
Вычисление коэффициентов ДКП с большей точностью, чем имеют
значения отсчетов яркости изображения, объясняется необходимостью пренебречь ошибками их определения для исключения возможных неточ ностей при ДКП.
Кодирование коэффициентов ДКП в таком широком динамическом
интервале потребует в последующих узлах кодера перехода от 8-битового к 11-битовому коду. Чтобы избежать этого, после ДКП производится мас
штабирование (сжатие) динамического интервала сигналов коэффициентов
ДКП за счет увеличения шага квантования в восемь раз. Эта операция сво
дится к делению полученных в матрице значений коэффициентов ДКП на
8. Результат деления затем округляется до ближайших целых значений уровней новой шкалы квантования. Так, например, если исходное значение
коэффициента дкп было 22, то после деления на 8 и округления до ближай шего целого значения (22/8 = 2,75) новое значение будет 3. При этом новый
динамический интервал составит от -255 до +255 дискретных уровней.
В обычной ИКМ уменьшение разрядности приводит к возрастанию шу
мов квантования на всех частотах. Коэффициенты ДКЛ определяют энергию
сигнала на различных частотах, поэтому появляется возможность изменять
параметры квантования дифференцировано на разных частотах, учитывая
различную чувствительность зрения к разным пространственным частотам.
Коэффициент, соответствующий постоянной составляющей телевизи
онного сигнала, кодируется с использованием 1О бит, потому что при бо лее грубом квантовании соседние блоки начинают отличаться по яркости. На экране они проявляются в виде шахматной структуры.
На предельно большое число уровней квантуются и амплитуды не
скольких самых низкочастотных косинусоидальных волн, располагающих
ся в левом верхнем углу блока ДКП. ПО мере увеличения частоты косину соидальных компонент (при удалении от левого верхнего угла блока ДКП) количество уровней квантования уменьшается, достигая для самых боль-
104 |
3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии |
ших частот значений в нескольких единиц. Например, самая высокочас
тотная компонента, располагающаяся в правом нижнем углу, может кван
товаться всего на два уровня. Это означает, что для ее передачи можно ис
пользовать одноразрядные двоичные числа.
Для реальных телевизионных изображений наибольшую величину
имеют низкочастотные спектральные составляющие, которые, естествен
но, должны передаваться с достаточно высокой точностью. Высокочастот
ные составляющие, имеющие относительно большой уровень, воспроизво
дят резкие границы и контуры, а также высококонтрастные мелкие детали.
Эта информация также должна передаваться, хотя, может быть, и с мень шей точностью, чем низкочастотные составляющие. Остальные высоко
частотные составляющие, величины которых малы и в результате кванто
вания оказываются равными нулю, создают слабо различимую мелкую структуру, текстуру отдельных участков изображения инезначительные изменения контуров объектов.
Потеря этой информации изменит изображение, но во многих случаях эти изменения несущественны для получателя информации - зрителя.
Для сравнения следует отметить, что переход к более грубому кванто
ванию коэффициентов исходного изображения приводит к возникновению
заметных искажений в виде ложных контуров. В тоже время ошибки кван
тования, возникающие при грубом квантовании коэффициентов ДКП,
«размазываются» по всем элементам блока, и возникающие при этом ис
кажения оказываются менее заметными.
Таким образом, использование ДКП в сочетании с последующим
квантованием коэффициентов ДКП обеспечивает уменьшение количества передаваемых двоичных символов за счет отбрасывания части информа
ции. Поэтому изображение, получаемое с помощью обратного ДКП в при
емной части системы цифрового телевидения, не будет идентично исход
ному передаваемому изображению. Следовательно, данный способ коди
рования относится к методам кодирования с частичной потерей инфор мации. Но непередаваемая информация оказывается несущественной для
зрительного восприятия, а возникающие изменения и искажения изобра жения не снижают, или почти не снижают его субъективно воспринимае мого качества. Поэтому рассмотренный метод кодирования одновременно
является методом сокращения психофизиологической избыточности те
левизионных изображений.
Практически квантование выполняется путем поэлементного деления
матрицы коэффициентов ДКЛ на матрицу квантования (взвешивания),
значения элементов которой возрастают по мере удаления от левого верх
него угла и приближения к правому нижнему углу. При этом важно отме
тить, что для квантования сигнала яркости и цветоразностных сигналов
используются разные матрицы. Построчные матрицы квантования могут
задаваться кодером, но по умолчанию стандарт МPEG-2 предполагает ис пользование следующих эффективных матриц (табл. 3.2,3.3).
3.2. Международный стандарт кодирования с информационным сжатием МPEG-2 |
105 |
Таблица 3.2
Матрица квантования яркостного сигнала для блоков изображений I-кадров
8 |
16 |
19 |
22 |
26 |
27 |
29 |
34 |
16 |
16 |
22 |
24 |
27 |
29 |
34 |
37 |
19 |
22 |
26 |
27 |
29 |
34 |
34 |
38 |
22 |
22 |
26 |
27 |
29 |
34 |
37 |
40 |
22 |
26 |
27 |
29 |
32 |
35 |
40 |
48 |
26 |
27 |
29 |
32 |
35 |
40 |
48 |
58 |
26 |
27 |
29 |
34 |
38 |
46 |
56 |
69 |
27 |
29 |
35 |
38 |
46 |
56 |
69 |
83 |
Таблица 3.3
Матрица квантования цветоразностных сигналов для блоков изображений I-кадров
17 |
18 |
24 |
47 |
99 |
99 |
99 |
99 |
|
|
|
|
|
|
|
|
18 |
21 |
26 |
66 |
99 |
99 |
99 |
99 |
|
|
|
|
|
|
|
|
24 |
26 |
56 |
99 |
99 |
99 |
99 |
99 |
|
|
|
|
|
|
|
|
47 |
66 |
99 |
99 |
99 |
99 |
99 |
99 |
|
|
|
|
|
|
|
|
99 |
99 |
99 |
99 |
99 |
99 |
99 |
99 |
|
|
|
|
|
|
|
|
99 |
99 |
99 |
99 |
99 |
99 |
99 |
99 |
|
|
|
|
|
|
|
|
99 |
99 |
99 |
99 |
99 |
99 |
99 |
99 |
|
|
|
|
|
|
|
|
99 |
99 |
99 |
99 |
99 |
99 |
99 |
99 |
|
|
|
|
|
|
|
|
При декодировании на приемной стороне коэффициенты матрицы
ДКП, значения которых были переданы по каналам связи, умножаются на
элементы матрицы квантования, что восстанавливает верные значения ко
эффициентов, но с ошибкой округления, значение которой мало для низ
кочастотных компонентов блока отсчетов изображения, но велико для вы
сокочастотных.
Для увеличения степени сжатия необходимо повышать значения ко
эффициентов в таблицах квантования. С целью передачи приемным теле визионным устройствам таблицы (матрицы) квантования записываются в файлы вместе со сжатыми видеоданными.
Массив коэффициентов, извлекаемых из матрицы ДКП, содержит не
которое количество нулевых значений. Для того, чтобы способствовать объединению нулевых элементов в группы и преобразованию в одномер ную последовательность, используется зигзагообразное сканирование мат
рицы, начиная с левого верхнего угла. В этом случае коэффициенты вы
страиваются в порядке возрастания частот, причем если пространственные
частоты одинаковы, то впереди следуют коэффициенты для меньших вер тикальных частот. Зигзаг-сканирование (z-упорядочивание) позволяет
106 |
|
|
|
|
|
|
|
3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕНИИ |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
12 |
17 |
|
15 |
8 |
|
3 |
11 |
1 |
10 |
|
11 |
12 |
8 |
1 |
1 |
0,3 |
0,2 |
0,1 |
|
|
||
|
15 |
8 |
|
12 |
11 |
|
|
|
б |
4 |
10 |
1 |
|
12 |
4,5 |
1,1 |
1,4 |
0,2 |
0,2 |
0,3 |
0,4 |
|
|
|
б |
1 |
|
10 |
5 |
|
8 |
12 |
4 |
8 |
|
4 |
1,2 |
1,1 |
0,5 |
0,1 |
0,4 |
0,1 |
0,2 |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1112 |
|
15 |
5 |
|
4 |
10 |
б |
7 |
....... |
1 |
0,3 |
0,4 |
1,1 |
0,4 |
0,2 |
ОА |
0,1 |
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1114 |
|
11 |
2 |
|
8 |
9 |
3 |
б |
0,1 |
0,1 |
1 |
0,3 |
0,2 |
0,4 |
0,2 |
0,2 |
|
|
||||
|
|
|
|
|
|
||||||||||||||||||
|
14 |
7 |
|
11 |
13 |
|
2 |
б |
9 |
б |
|
0,2 |
0,1 |
0,2 |
0,3 |
0,2 |
0,3 |
0,1 |
0,1 |
|
|
||
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
13 |
18 15 |
11 |
|
|
|
б |
1 |
б |
б |
|
0,4 |
0,1 |
0,5 |
0,4 |
0,3 |
0,3 |
0,2 |
0,1 |
|
|
||
|
11 |
б |
8 |
10 |
4 |
10 |
5 |
9 |
|
0,2 |
0,3 |
0,1 |
0,3 |
0,2 |
0,4 |
0,2 |
0,2 |
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
11,12,12,4,4,8,1,1,1,1,0,0,1,1,1,0,0,0,0,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
Рис. З. 7. Графическое представление процесса ДКП, квантования и зигзагообразного сканирования в аппаратуре кодирования по стандарту MPEG-2
сгруппировать самый большой массив нулевых коэффициентов, обычно
располагающийся в правой нижней части блока ДКП.
Примером преобразования стандартной сигнальной матрицы 8 х 8 пикселей может служить процесс ДКП, квантования и зигзагообразного
сканирования, графически представленный на рис. 3.7.
Последний алгоритм сокращения избыточности связан с кодами, обра
зующими комбинации переменной длительности (VLC - Variable Length Code). При этом те коэффициенты ДКП, которые повторяются наиболее час
то, кодируются короткими кодовыми комбинациями, а редкие значения ко
эффициентов - более длинными (по этому же принципу построена азбука Морзе).
Для экономного представления двоичных сообщений в стандарте
МPEG-2 используется код Хаффмана, позволяющий практически в 1,22
раза сократить поток данных по сравнению с равномерным кодировани
ем. Покажем принцип построения кода Хаффмана на простом примере. Пусть алфавит источника насчитывает четыре символа а, Ь, с, d с вероят
ностями появления соответственно 0,5, 0,25, 0,125, 0,125. Если каждому из символов присвоить двухбитовые значения 00, 01, 10, 11 средняя длина кодового слова составит, очевидно, 2 бита на символ. Присвоим теперь
символу а значение О, символу Ь - значение 1О, символам с и d - значения
соответственно 11 О и 111. Нетрудно рассчитать, что в среднем для переда чи одного символа расходуется 1хО,5 + 2хО,25 +2х3хО,125 = 1,75 бит. Хотя максимальная длина символа возросла, число бит, требуемых для передачи
сообщения, сократилось. По своей эффективности рассматриваемый код
приближается к теоретическому пределу расхода бит и поэтому называ
ется энтроnиЙным. Адаптивная версия кода Хаффмана применяется в том
случае, когда вероятность появления кодовых слов изменяется в процессе
передачи. При кодировании символов сообщения комбинациями перемен ной длины обычно возникает проблема отделения одной комбинации от
3.2. Международный стандарт кодирования с информационным сжатием МPEG-2 |
107 |
другой. Код Хаффмана обладает свойством префиксности, то есть ни одна его кодовая комбинация не является началом другой комбинации, что по зволяет обойтись в тексте кодированного сообщения без разделителей меж ду комбинациями.
К группе энтРОnИЙНblХ относится и арифметический код. Процедура кодирования состоит в том, что всей совокупности символов сообщения ставится в соответствие интервал [О, 1], который разбивается на участки, соответствующие исходным вероятностям символов, и это разбиение со общается декодеру. После поступления очередного символа интервал пе
ресчитывается на новые пределы, соответствующие вероятности появле
ния этого символа, и вновь разбивается пропорционально исходным веро ятностям. С наступлением каждого нового символа размер интервала уме
ньшается, причем в строгом соответствии с вероятностями символов. Бо
лее часто встречающиеся символы меньше сужают интервал, чем редкие, и
добавляют меньше бит в код интервала. По окончании цикла кодирования формируется некоторый, весьма узкий интервал, однозначно характери
зующий передаваемую последовательность символов, и она легко может
быть восстановлена в декодере по любому числу из этого интервала.
Энтропийный кодер в устройстве кодирования с информационным сжатием МPEG-2 должен иметь многокадровый буферный накопитель, в
котором происходит накопление данных для их оптимального использова
ния. Например, в случае, если содержание изображения изменяется с очень большой интенсивностью, возможно изменение скорости передачи данных для сохранения соответствующего качества изображения. Однако на прак тике при передаче и распределении телевизионных программ колебания скорости передачи данных могут быть недопустимы. В этом случае ис пользуется режим работы энтропийного кодера, при котором обеспечива
ется фиксированная скорость выходного потока данных. Для чего данные заносятся в буферный накопитель с переменной скоростью, а считываются с постоянной. Для предотвращения переполнения буферного накопителя или полного стирания информации в нем, что может привести к сбоям в
работе системы видеокомпрессии, используется адаптивное квантование.
Сведения о степени заполнения буферной памяти служат сигналом управ
ления, регулирующим шкалу квантования. Если, например, кодируемое изображение характеризуется высокой детальностью, то число ненулевых
элементов матриц коэффициентов ДКП увеличивается. Возрастает и объем передаваемых данных, поэтому буферный накопитель заполняется с по вышенной скоростью. Благодаря обратной связи (через регулятор скорости потока данных, см. рис. 3.1) квантование становится более грубым и ско рость поступления данных в буферную память уменьшается, но за счет увеличения шумов квантования и ухудшения качества изображения. Если кодируется простое по структуре изображение с малой детальностью, то число нулевых элементов сигнальных матриц коэффициентов ДКП увели чивается и скорость поступления данных в буферную память снижается по
108 |
3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕНИИ |
Кодированные данные
Декодирование комбинаций переменной длительности
Обратное упорядочивание
Обратное квантование
Обратное ДКП
Компенсация движения Хранение кадров изображения
Рис. 3.8. Графическое представление структуры декодирования в декодерах MPEG-2
сравнению со средней величиной. Тогда квантование становится менее
грубым (большое число коэффициентов ДКП квантуется на максимальное число уровней). Таким образом скорость заполнения буферного накопите
ля в среднем поддерживается на постоянном уровне.
Обработка сообщений перед подачей в канал связи часто называется кодированием источника.
На приемном конце упрощенная структура декодирования графически
может быть представлена рис. 3.8.
3.2.6. Сжатие звукоданных Эффект маскирования и психоакустическая модель слуха
Из-за повышенной чувствительности уха к искажениям сжатие звуко вых сигналов оказывается более сложной задачей, чем видеокомпрессия. В
то же время некоторые психофизиологические особенности слухового восприятия позволяют даже при значительной компрессии (6: 1 и более)
обеспечить «прозрачный» канал, то есть канал, звучание выходного сигна ла которого субъективно неотличимо от звучания сигнала источника.
Для понимания этих особенностей ознакомимся с некоторыми меха низмами слухового восприятия. Как и во всякой системе с преобразовани ем из временн6й в частотную область, в слуховой системе имеется неко торая неоnределенность в разделении отдельных частотных составляю ЩИХ. Несовершенное разделение по частоте приводит к тому, что ухо не в
состоянии различить звуки с близкими частотами, этот эффект называется частотным маскированием. Граница восприятия вблизи маскирующего
тона называется порогом маскирования.
3.2. Международный стандарт кодирования с информационным сжатием МPEG-2 |
109 |
|
Относительный уровень |
|
|
чувствительности,дБ |
|
|
250 Гц |
I |
|
I |
||
80 |
||
I |
||
|
I |
|
60 |
I |
|
I |
||
|
I |
40
20
О
5 |
10 |
15 |
20 |
25 Барк |
Рис. 3.9. Критические полосы человеческого слуха
в результате длительных исследований удалось измерить ширину и
расположение частотных полос, в пределах которых действует маскирова
ние. Эти полосы получили название критических и в полосе слухового вос приятия их насчитывается 25. В области низких слышимых частот ширина критической полосы менее 100 Гц, в районе 2 кГц она равна 300 Гц и воз
растает до 4 кГц в области высших воспринимаемых частот (рис. 3.9). Из меряется ширина критической полосы в Барках (в относительных значениях полосы звуковых частот) и рассчитываются по формуле [14]:
B_{f/100, дляf~500 Гц - 9+410g2(f/1000), дляf>500 Гц.
Кроме частотного (статического), имеет место и временное (динами ческое) маскирование. «Временн6е маскирование», то есть эффект, при ко
тором звук достаточной амплитуды маскирует другие звуки, непосредст
венно предшествующие ему или следующие за ним по времени (рис. 3.10).
Когда звук маскируется следующим за ним по времени сигналом, такое маскирование называется маскированием назад. Типичный промежуток времени, в пределах которого действует маскирование назад, составляет 5 ... 50 мс. Если звук маскируется предшествующим ему сигналом, то такое маскирование называется маскированием вперед, характерные интервалы времени для которого составляют от 50 до 200 мс В зависимости от уровней маскирующего и маскируемого сигналов. Несовершенство временн6го раз
деления связано с резонансным характером восприятия.
Использование эффекта маскирования позволяет существенно сокра
тить объем звукоданных, сохраняя приемлемое качество звучания. Прин цип здесь достаточно простой: «Если какая-то составляющая не слышна,
то и передавать ее не следует». На практике это означает, что в области маскирования можно снизить число бит на отсчет до такой степени, чтобы шум квантования все еще оставался ниже порога маскирования. Таким об-
