Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебники / Цифровое телевизионное вещание под редакцией Г. В. Мамчев, 2014

.pdf
Скачиваний:
3
Добавлен:
29.05.2026
Размер:
20.33 Mб
Скачать

80

3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии

Термин «гибридный» отражает тот факт, что используются как преоб­ разование, так и компенсация движения, благодаря которой устраняется временная избыточность. Система с компенсацией движения отличается применением перекрывающихся блоков, позволяющих отказаться от фильтров подавления блочного шума. При этом достигается высокая эф­ фективность компрессии, в 2,5 раза превышающая коэффициент компрес­ сии кодека стандарта Н.264 [21].

в научно-исследовательском институте телевидения (НИИТ, г. Санкт­ Петербург) разработана национальная система видеокомпрессии RVC (Rиs­ sian Video Coding - российская система видеокодирования), способная за­ менить МPEG-4. Кодек RVC-1.2, построенный на основе единого меха­ низма декорреляции (трехмерного дискретно-косинусного nреобразова­ ния - 3D-DC1), отличается адаптивностью и высокой эффективностью, по­

этому может использоваться в самых различных системах: вещательных и

прикладных телевизионных стандартной и высокой четкости, видеоконфе­ ренцсвязи, медицинских и дистанционного обучения. Сравнительный ана­

лиз качества изображения в системах с кодеком RУС-1.2 и Н.264 показал,

что первый обеспечивает в полтора-два раза меньшую скорость цифрового

потока видеоданных высокой четкости при одинаковом уровне качества.

Видеокодек RУС-1.2, предложенный НИИТ, прост в реализации и требует гораздо меньшее количество вычислительных операций. Международная презентация российской системы видеокодировании состоялась в сентябре

2010 г.

Базовые принципы видеокомпрессии достаточно глубоко изложены в описании стандарта МPEG-2. Поэтому с методической точки зрения при

углубленном изучении техники цифрового телевидения очень важным яв­

ляется детальное изучение стандарта видеокомпрессии МPEG-2, которое

одновременно дает хорошее начальное понимание ключевых моментов

функционирования стандартов видеокомпрессии более высокого уровня.

3.2. Международный стандарт кодирования

синформационным сжатием MPEG-2

3.2.1.Профили и уровни стандарта кодирования MPEG-2

Даже в рамках одного стандарта, как показывает практика, передача

сигналов телевидения - и цифрового здесь не исключение, ведется на раз­

ных уровнях качества. То же самое можно сказать и о телевизионных при­ емниках. Жесткие, а главное узкие допусковые интервалы нежизненны, поскольку лишают систему гибкости, приспособляемости к разным усло­

виям функционирования с ориентацией на различные слои потребителей. При этом любая перспективная система должна иметь резервы для перехо­ да на более высокие уровни качества. Эти и многие другие соображения и требования легли в основу очень важного документа: ISOIIEC 13818-2.

3.2. Международный стандарт кодирования с информационным сжатием МPEG-2

81

в этом документе определено, что стандарт МPEG-2 - это целое се­ мейство взаимносогласованных совместимых цифровых стандартов ин­ формационного сжатия телевизионных сигналов с различной степенью сложности используемых алгоритмов. Поэтому в рамках стандарта МPEG- 2 была разработана система профилей и уровней. Профиль - это подмно­ жество стандарта для специализированного nрименения, задающее алго­ ритмы и средства компрессии. Уровни внутри каждого профиля связаны с параметрами компрессируемого изображения.

Градации качества телевизионного изображения для вещательных систем в стандарте ISO/IEC 13818-2 устанавливаются введением четырех уровней для формата разложения строк телевизионного изображения и пя­ ти профилей для форматов кодирования сигналов яркости и цветности. Общая идеология построения стандарта МPEG-2 поясняется табл. 3.1 [22].

 

 

 

 

Таблица 3.1

Профили, уровни, согласованные точки стандарта MPEG-2

 

 

 

 

 

 

Высокий

 

 

 

 

 

уровень

 

 

 

 

 

1920 отсчетов

 

20

 

 

25

1152 строки

 

 

 

 

 

(активных)

 

 

 

 

 

 

 

 

 

 

 

Высокий

 

 

 

 

 

уровень

 

 

 

 

 

1440 отсчетов

 

15

 

15

20

1152 строки

 

 

 

 

 

(активных)

 

 

 

 

 

 

 

 

 

 

 

Основной

 

 

 

 

 

уровень

 

 

 

 

 

720 отсчетов

4

4

4

 

5

576 строк

 

 

 

 

 

(активных)

 

 

 

 

 

 

 

 

 

 

 

Низкий

 

 

 

 

 

уровень

 

 

 

 

 

352 отсчета

 

1

1

 

 

288 строк

 

 

 

 

 

(активных)

 

 

 

 

 

 

 

 

 

 

 

 

Простой

Основной

Профиль с

Специаль-

Высший

 

профиль

профиль

масштабируе-

ныймасшта-

 

профиль

 

без

без

мым отноше-

бируемый

В кадры

 

В кадров

В кадров

ниемС/Ш

профиль

 

формат 4:2:0

 

формат

формат

В кадры

В кадры

 

или 4:2:2

 

4:2:2

4:2:0

формат 4:2:0

формат 4:2:0

 

 

 

 

 

 

 

 

Все цифровые параметры даны в Мбит/с

82

3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии

Расположенный в нижней части таблицы уровень называется «низким

уровнем» и ему соответствует новый класс качества телевизионного изо­

бражения, которое вводится в стандарте МPEG-2 - телевидение ограни­ ченной четкости. В этом случае в кадре телевизионного изображения со­ держится 288 активных строк (в 2 раза меньше, чем в вещательном телеви­ дении) и каждая строка дискретизируется на 352 отсчета.

Кодирование сигналов телевидения вещательного стандарта выполня­

ется в соответствии с основным уровнем, то есть с форматом разложения на 576 активных строк в кадре, которые кодируются с использованием 720

отсчетов на строку.

Высокий уровень - 1440 поддерживает телевизионные изображения высокой четкости с разрешением 1440 х 1152 элементов.

Высокий уровень - 1920 поддерживает телевизионные изображения вы­ сокой четкости широкого формата с разрешением 1920хl152 (НDTV-plus). В обоих «высоких» уровнях кадр телевизионного изображения содержит 1152 активные строки (вдвое больше, чем в вещательном телевидении). Эти

строки дискретизируются соответственно на 1440 или 1920 отсчетов.

В стандарте используются 5 профилей, которым соответствуют 5 набо­ ров функциональных операций по обработке (компрессии) видеоданных.

Профиль, в котором используется наименьшее число функциональ­

ных операций по компрессии видеоданных, назван простым. В нем при компрессии видеоданных используется компенсация движения изображе­ ния и гибридное ДКП.

Следующий профиль назван основным. Он содержит все функцио­ нальные операции простого профиля и одну новую: предсказание по двум

направлениям. Эта новая операция, естественно, повышает качество теле­ визионного изображения.

Следующий за основным назван nрофuлем с масштабируемым отно­ шением сигнал/шум. Термин <<.масштабирование», в данном случае, означает

возможность обмена одних показателей системы, способность воспроизведе­ ния телевизионных изображений из части полного потока видеоданных. Этот

профиль к функциональным операциям основного профиля добавляет но­ вую - масштабирование. Основная идея - повышение устойчивости цифро­

вого телевидения и сохранение работоспособности при неблагоприятных ус­ ловиях приема. Операция масштабирования позволит в рассматриваемом случае повысить устойчивость системы за счет некоторого снижения требо­

ваний к допустимому уровню отношения сигнал/шум в воспроизводимом те­

левизионном изображении.

При масштабировании потоки видеоданных разделяют на две части.

Одна из них несет наиболее значимую часть информации - ее называют основным сигналом. Вторую часть, несущую менее значимую информа­ цию, называют дополнительным сигналом. Декодирование только одного основного сигнала позволяет получить телевизионное изображение с по­ ниженным отношением сигнал/шум до исходного значения.

3.2. Международный стандарт кодирования с информационным сжатием МPEG-2

83

ивсе же, что можно извлечь из идеи деления потока данных на более

именее значимые части? А все дело в защите системы от ошибок. Поме­ хоустойчивое кодирование требует введения дополнительных бит, что по­ вышает общий поток информации. Задача упрощается, когда более мощ­ ная защита применяется только к части информации и тем самым соблю­ дается разумный баланс между уровнем потока видеоданных и степенью их защиты. При неблагоприятных условиях приема (например, при низкой напряженности радиополя, при приеме на комнатную антенну и т.п.) со­ храняется возможность устойчивого декодирования более защищенного

основного сигнала, а неустойчиво воспринимаемый дополнительный сиг­

нал просто отключается. Это ведет к росту уровня шума, зато система ос­ тается работоспособной.

Бывают ситуации, когда сигналы приходится передавать по каналам с

ограниченной пропускной способностью. Деление потока видеоданных на

два, позволяет использовать и «плохие» каналы, ограничивая передачу ос­

новным сигналом.

Следующий, четвертый профиль назван специально масштабируемым профилем. Здесь, естественно, сохранены все операции предшествующего профиля и добавлена новая - разделение потока видеоданных по критерию четкости телевизионного изображения. Этот профиль обеспечивает пере­

ходы между ныне действующими вещательными системами и ТВЧ. С этой целью видеоданные сигнала ТВЧ разделяются на три потока. Первый -

это основной (значимый) поток видеоданных, например, по стандарту раз­ ложения на 625 строк. Второй поток несет дополнительную информацию

об изображении с числом строк до 1250. Одновременное декодирование

первого и второго потоков видеоданных позволяет получить телевизион­

ное изображение высокой четкости, но с пониженным отношением сиг­

нал/шум. В третьем потоке сосредоточена менее значимая информация, его декодирование позволяет повысить отношение сигнал/шум в видеока­

нале до уровня, принятого В ТВЧ. Обычно первый поток видеоданных,

представляющих сигнал 625-строчного телевидения, - это 6 Мбит/с, до­ полняющий его дО ТВЧ - 6 Мбит/с, а повышающий отношение сиг­ нал/шум до уровня, когда шумы визуально незаметны - 12 Мбит/с.

Стандартом МPEG-2 потенциально предусмотрена масштабируе­

мость по времени, позволяющая получать от одного источника видеоин­

формации телевизионные изображения с двумя уровнями разрешающей спо­

собности по времени. Например, основной поток видеоданных обеспечивает воспроизведение телевизионного изображения с частотой кадров 25 Гц и че­ ресстрочной разверткой. Добавление дополнительного потока видеоданных к

основному позволяет получить телевизионное изображение с частотой кад­ ров 50 Гц и прогрессивной разверткой.

Таким образом, стандарт МPEG-2 предусматривает возможность ор­ ганизации потоков видеоданных как с масштабируемостью, так и без нее.

84

3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии

Однако, масштабируемость, заложенная в стандарте МPEG-2, пока редко встречается в практических реализациях цифровых телевизионных систем,

но она является важной предпосылкой их дальнейшего развития.

В рассмотренных четырех профилях при кодировании сигналов яр­ кости и цветности используется формат представления видеоданных 4:2:0, в котором число отсчетов сигналов цветности по сравнению с сиг­

налом яркости уменьшается в два раза не только по горизонтальному, но

и по вертикальному направлениям. Следующий, пятый профиль называ­ ется высшим, и он включает в себя все функциональные операции специ­ ального профиля 4:2:2, при котором число отсчетов сигналов цветности в

вертикальном направлении остается тем же, что и у сигнала яркости. В

этом случае коэффициент компрессии минимален, а качество изображе­

ния наивысшее.

Приведенные в табл. 3.1 пять профилей и четыре уровня образуют 20 возможных комбинаций видеосигнала, из которых, вероятнее всего, только 11 будут необходимыми. Для этих комбинаций (согласованные точки) в

таблице указаны возможные значения скорости передачи видеоданных в

Мбит/с.

Для всех стандартизованных точек указаны максимальные потоки ви­ деоданных, которые позволяют получить телевизионное изображение, сво­

бодное от каких-либо дефектов. В иных случаях они могут проявиться В процессе кодирования/декодирования видеосигнала. Используемые в кон­

кретных кодерах потоки видеоданных могут быть несколько меньше ука­ занных значений. Выбор уровня компрессии и, в конечном итоге, уровня потока зависит от допустимой степени искажений телевизионного изобра­

жения.

Таким образом, стандарт МPEG-2 позволяет гибко менять скорость передачи видеоданных в очень широких пределах. Надо заметить, что сис­ темы кодирования стандарта МPEG-2 могут работать как с чересстрочной, так и с прогрессивной развертками, при частоте полей 50 или 60 Гц. Для каждой стандартизованной точки в таблице оговорено число отсчетов сиг­ нала яркости на активной части строки. Рассмотренные комбинации пара­

метров информационного кодирования пригодны для работы с различны­ ми цифровыми трактами.

Большинство выпускаемых в настоящее время декодеров в интеграль­

ном исполнении относится к основному профилю и основному уровню (МP@МL), рассчитанных на телевизионное изображение с чересстрочным

разложением на 625 строк. Эта система принята для первого поколения

цифровых телевизоров дЛЯ НТВ со спутников, работающих в диапазоне 11/12 ГГц, и кабельной сети распределения.

Однако ряд особенностей основного профиля и основного уровня стандарта МPEG-2, например, низкое вертикальное разрешение в цвето­

разностных каналах, ограничивают его применение в условиях телевизи-

3.2. Международный стандарт кодирования с информационным сжатием МPEG-2

85

онных студий, В видеопроизводстве. Для достижения высоких качествен­

ных показателей в случае многократного кодирования-декодирования

важно кодировать видеосигналы стандарта 4:2:2. Использование видеосиг­ налов, кодированных в стандарте 4:2:0, совместно с основным профилем и основным уровнем MP@МL означает, что вертикальное разрешение в цве­ торазностных каналах уменьшается вдвое. Взаимное преобразование ви­ деосигналов стандартов 4:2:2 и 4:2:0, необходимое для обеспечения со­

вместимости в телевизионном тракте в соответствии с Рекомендацией

МСЭ-Р ВТ.601-5, требует в каждой точке преобразования вертикальные фильтры низких частот. Хорошо известно, что каскадное включение таких фильтров быстро приведет к «смягчению», то есть к размытюю цветовых

границ. Для сохранения цветового вертикального разрешения лучше

осуществлять компрессию видеоданных, кодированных по стандарту

4:2:2. Поэтому в рамках группы MPEG-2 был разработан дополнительный

стандарт 422 Profile @ Main Level (422 P@МL).

Стандарт 422 P@МL является подмножеством основного профиля и основного уровня МP@МL в том смысле, что все значения параметров пер­

вого либо равны, либо превышают соответствующие значения второго. Принцип обратной совместимости, заложенный в МPEG-2, гарантирует, что

декодеры 422 P@МL способны декодировать цифровые потоки МP@МL. Основные возможности стандарта 422 P@МL, превосходящие соот­

ветствующие свойства основного профиля и основного уровня МP@МL,

заключаются в следующем:

допускается кодирование сигнала по стандарту 4:2:2, в то время как МP@МL ограничен кодированием сигналов способом 4:2:0;

цифровой поток кодированных видеоданных может принимать любое

значение до 50 Мбит/с, а в МP@МL - только 15 Мбит/с;

вертикальное разрешение ограничено значением 512 телевизионных ли­

ний в случае 525-строчных систем и 608 телевизионных линий в слу­

чае 625-строчных систем, а в MP@ML - значениями 480 и 576 телеви­

зионных линий соответственно;

в 625-строчных системах кроме 576 активных строк стандарт 422 P@МL обеспечивает возможность кодирования еще 32 строк в кадре

как составной части видеосигнала. Это позволяет пропускать напрямую

через систему цифрового сжатия важные строки полевого интервала гашения. Поэтому стандарт 422 P@МL гарантирует пропускание такой информации как полевой временн6й код и сигналы испытательных

строк, не требуя отдельной обработки этих строк.

После того как была сформулирована профессиональная версия МPEG-2 422 P@МL, используемая для студийного производства, он полу­

чил статус полноценного международного стандарта, который иногда на­

зывают 422 Studio Profile/МL. В результате появилась реальная возмож­ ность применения стандарта сжатия МPEG-2 на всех участках технологи-

86

3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии

ческой цепочки создания телевизионных программ: от съемки до телезри­ теля, включая доставку новостийных сюжетов на телецентр, студийную

компоновку программ, их распространение и передачу в эфир. Стандарт предоставляет возможности эффективной работы во всех этих звеньях. Профили МPEG-2 определяют набор способов и технических приемов по сжатию видеоданных, а уровни - такие параметры, как размер изображе­ ния или скорость цифрового потока при выбранном способе кодирования. Профиль 422 характеризуется высокой скоростью цифрового потока и от­ носительно короткими группами изображений, что позволяет монтировать

видеопрограмму с достаточно высоким качеством.

В настоящее время активно разрабатывается стандарт МPEG-2 4:2:2 P@HL (профиль 4:2:2 на высоком уровне), нацеленный на использование в

системах ТВЧ.

ДЛЯ кодирования звуковых сигналов с целью их компрессии в МPEG- 2 используется стандарт информационного сжатия звуковых данных мu­

SICAМ (Masked Pattem for Adapted Universal Coding and Multiplexing), обо­

значаемый также как МPEG Layer П. Стандарт МUSICAМ позволяет пере­

давать моно, стерео, многоязыковый и surround (пространственный) звук.

МUSICAМ позволяет снизить скорость потока данных, необходимую

для воспроизведения звуковых сигналов, адекватного качеству, получае­

мому при воспроизведении компакт-дисков, до 128 кбит/с на каждый мо­

ноканал звукового сопровождения. Таким образом, для самого низкого

уровня - двухканального стереофонического звукового сопровождения - потребуется скорость передачи цифровых данных, равная 128 кбит/сх2 = = 256 кбит/с. В основе стандарта лежат два психоакустических эффекта.

Дело в том, что человеческое ухо не способно различать звуки с громко­

стью ниже определенного минимума, так называемого «порога тишиньz».

Кроме того, более тихие звуки «маскируются» более громкими. Соответст­ венно, алгоритм МUSICAМ обеспечивает передачу только тех звуков, ко­

торые реально различаются человеком.

В случае воспроизведения пространственного (surround) звука для пе­

редачи шести сигналов звукового сопровождения в отсутствие компрессии

потребуется пропускная способность канала, достигаемая 5,18 Мбит/с (48000 х 18 х 6 = 5,18 Мбит/с, где 48 кГц - частота дискретизации звуко­ вых сигналов, 18 бит - разрядность квантования). По протоколу для пере­

дачи звукового сопровождения предусмотрен канал с пропускной способ­

ностью 384 кбит/с. В данном случае требуемый коэффициент сжатия, рав­ ный 13, сможет обеспечить цифровая система комnрессирования Dolby

АС-З, основанная на спектральном анализе звуковых сигналов и удалении

частотных компонент, не слышимых человеком.

3.2. Международный стандарт кодирования с информационным сжатием МPEG-2

87

3.2.2. Компрессия видеоданных

Телевизионный сигнал, как известно, избыточен, что обусловлено значительной избыточностью изображений, типичных для телевизионно­ го вещания. В общем случае б6льшая часть изображения любого телеви­ зионного кадра обычно приходится на участки, имеющие постоянную или

мало меняющуюся в пространстве яркость, а резкие световые переходы и

детали малых размеров занимают небольшую долю площади изображе­ ния. Коэффициент корреляции соседних элементов изображения, описы­

вающий статистическую связь между яркостями этих элементов, близок к 1. Зная яркость одного элемента, можно с высокой степенью вероятно­

сти предсказать яркость соседнего, например, полагая их просто равны­

ми. Такого рода избыточность можно назвать nространственной избы­ точностью изображения.

Изображения соседних кадров в телевидении обычно очень похожи друг на друга, даже при показе движущихся объектов. Переходы от сюже­

та к сюжету встречаются редко. Межкадровая разность на значительной части площади изображения обычно близка к нулю. Зная распределение

яркости в одном кадре, можно с высокой степенью уверенности предска­

зать распределение яркости следующего кадра. Эта предсказуемость ука­ зывает на временную избыточность изображения.

Пространственная и временная формы избыточности связаны со ста­

тистическими свойствами телевизионных изображений.

Таким образом, в телевидении различают статистическую избыточ­ ность, избыточность по восприятию, структурную и спектральную из­ быточность. По теории вероятностей избыточность является следствием определенных корреляционных связей. Корреляция означает, что некото­ рый элемент изображения более или менее существенно зависит от сосе­ дей в пространстве и во времени. Под статистической избыточностью по­

нимают корреляционные связи между соседними (по вертикали и горизон­ тали) отсчетами телевизионного сигнала. Необходимо подчеркнуть, что

снижение избыточности в этом случае до определенных пределов обрати­

мо, то есть без потерь информации. Примером такого «беспроигрышного»

кодирования служит предсказание на основе ДКП. Можно назвать и дру­

гие разностные методы.

Избыточность по восприятию связана с особенностями зрения челове­ ка. Например, цветовое разрешение нашего зрения ниже яркостного. Эта особенность учтена во всех стандартных аналоговых системах цветового кодирования. В совместимых системах вещательного телевидения NTSC,

рAL и SECAМ цветовое разрешение существенно понижено по отношению к яркостному. Тоже самое зафиксировано в цифровом стандарте 4:2:2, где,

по определению, две цветоразностные компоненты представлены таким же

по объему информационным массивом, что и один яркостный сигнал.

88

3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии

 

 

Учитывая эту особенность нашего зрения по восприятию мелких де­ талей цветного изображения, можно в несколько раз сократить полосу час­

тот при передаче и кодировании сигналов цветности.

Структурная избыточность - итог особенностей стандарта разложе­ ния или, по иному, преобразования изображения в телевизионный сигнал. В нем, например, периодически передаются неизменные по форме элемен­ ты сигнала: гасящие импульсы строк и полей. В цифровом телевизионном сигнале нет необходимости передавать эти импульсы по каналу связи, так как они могут быть восстановлены в декодере по опорным сигналам син­ хронизации. В цифровом телевидении достаточно передавать только ак­ тивную часть изображения. В цифровом стандарте 4:2:2 при 10 битах на отсчет устранение из состава цифрового телевизионного сигнала гасящих

импульсов строк и полей сокращает скорость передачи данных с

270 Мбит/с до 207 Мбит/с, то есть примерно на 23%. Естественно, эта осо­ бенность сигнала учтена в стандарте МPEG-2 [23,24].

Спектральная избыточность проявляется как результат излишка высо­

кой частоты дискретизации. В частности, принятая ортогональная структура дискретизации телевизионного изображения в общем случае не является оптимальной в частотном пространстве. Можно сократить передаваемый

цифровой поток, если преобразовать используемую структуру дискретиза­

ции в другую, которая характеризуется меньшим числом отсчетов в кадре,

например, от формата 4:2:2 перейти к формату 4:2:0 или 4:2: 1. Используя

интерполяцию и передискретизацию определенным образом выбранных

групп отсчетов телевизионного сигнала, можно, в принципе, видоизменить

спектральный состав и снизить частоту дискретизации. Такая обработка обычно необратима и, как правило, ведет к некоторому снижению качества восстановленного телевизионного изображения за счет уменьшения его раз­ решения. В стандарте МPEG-2 этот вид избыточности не устраняется.

Итак, в МPEG-2 применены известные, давно апробированные мето­ ды сокращения избыточности. Вместе с ними использованы и новые под­ ходы. В особенности это относится к совокупности согласованных алго­

ритмов сокращения статистической избыточности. Здесь особо эффектив­

ными оказались два метода: кодирование телевизионных отсчетов с nред­ сказанием и ДКЛ.

Кодирование с предсказанием реализуется с помощью дифференциаль­ ной импульсно-кодовой модуляции (ДИКМ). При кодировании с предсказа­

нием вычисляется разность между истинным и предсказанным значением от­

счета. Затем разность квантуется по уровню. От точности предсказания зави­

сит среднее число бит, необходимых для передачи разностной информации. Предсказание может быть экстраполяционным. В этом случае (его часто на­ зывают предсказанием вперед) по предшествующим значениям отсчетов те­

левизионного сигнала оцениваются последующие отсчеты. Интерnоляцион­

ное (двунаправленное) предсказание означает, что оценка среднего по поло-

3.2. Международный стандарт кодирования с информационным сжатием МPEG-2

89

жению отсчета телевизионного сигнала выполняется по известным значени­

ям предшествующих и последующих отсчетов. Такое предсказание наиболее точно оценивает текущие отсчеты. Однако за точность приходится расплачи­ ваться возросшим объемом вычислений и соответственно памяти, необходи­ мой при реализации. При этом эффект не окупает затраты.

Как уже отмечалось, предсказание выполняется по соседним с пред­

сказываемым отсчетам, причем под соседними надо понимать отсчеты,

расположенные «до и за» рассматриваемым. К ним надо добавить соседей в предшествующей и последующей строках, полях и кадрах. Таким обра­ зом, возможно построчное, межстрочное, внутрunолевое, внутрикадро­ вое, межполевое, межкадровое nредсказанuе. Это полный набор возмож­

ных направлений корреляций. Но уже подчеркивалось, что предсказание

вдоль отдельной строки по предшествующему и последующему элементу

не эффективно. По этому же критерию можно отсеять и некоторые другие

возможные направления.

При простейшем внутриполевом предсказании вперед предшествую­

щий отсчет телевизионной строки принимается как ожидаемый уровень

последующего отсчета. Фактически это означает вычеркивание постоян­

ной составляющей или, что тоже самое, выделение разностной информа­ ции. Такой метод предсказания особенно эффективен, когда передаются крупные, не содержащие мелких деталей, фрагменты изображения, где яр­

кость постоянна или изменяется медленно.

Другой способ - межкадровое nредсказанuе вперед. В этом случае те­

кущий отсчет оценивается по отсчету с теми же координатами, но преды­

дyщeгo кадра. Это очень эффективный метод предсказания для неподвиж­

ных изображений. Ситуация усложняется, когда изображение содержит движущиеся объекты или изменяющиеся в целом. В этом случае отсчеты, принадлежащие однозначным элементам изображения, от кадра к кадру

будут смещаться. Возникает разностная информация, даже если в осталь­

ном никаких изменений не происходит. Это можно ослабить, если ввести компенсацию движения. Для этого необходимо определить векторы пере­ мещения движущихся частей изображения при последовательном переходе от кадра к кадру. Векторы движения позволяют определить положение ко­

дируемого отсчета в новом кадре (скомпенсировать его перемещение) и, та­

ким образом, сохранить высокую точность предсказания.

Таким образом, стандарт МPEG-2 фактически не регламентирует ме­

тоды сжатия видеосигнала, а только определяет структуру битового потока кодируемого видеосигнала. Поэтому конкретно используемые алгоритмы

зависят от собственных разработок фирм-производителей оборудования.

При этом ярко выражены общие принципы построения стандарта MPEG-2,

в соответствии с которыми процесс сжатия цифрового видеосигнала может быть разбит на ряд последовательных операций: преобразование аналого­ вого сигнала в цифровую форму, предварительная обработка, ДКП, кван­ тование, кодирование (рис. 3.1).