Учебники / Цифровое телевизионное вещание под редакцией Г. В. Мамчев, 2014
.pdf80 |
3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии |
Термин «гибридный» отражает тот факт, что используются как преоб разование, так и компенсация движения, благодаря которой устраняется временная избыточность. Система с компенсацией движения отличается применением перекрывающихся блоков, позволяющих отказаться от фильтров подавления блочного шума. При этом достигается высокая эф фективность компрессии, в 2,5 раза превышающая коэффициент компрес сии кодека стандарта Н.264 [21].
в научно-исследовательском институте телевидения (НИИТ, г. Санкт Петербург) разработана национальная система видеокомпрессии RVC (Rиs sian Video Coding - российская система видеокодирования), способная за менить МPEG-4. Кодек RVC-1.2, построенный на основе единого меха низма декорреляции (трехмерного дискретно-косинусного nреобразова ния - 3D-DC1), отличается адаптивностью и высокой эффективностью, по
этому может использоваться в самых различных системах: вещательных и
прикладных телевизионных стандартной и высокой четкости, видеоконфе ренцсвязи, медицинских и дистанционного обучения. Сравнительный ана
лиз качества изображения в системах с кодеком RУС-1.2 и Н.264 показал,
что первый обеспечивает в полтора-два раза меньшую скорость цифрового
потока видеоданных высокой четкости при одинаковом уровне качества.
Видеокодек RУС-1.2, предложенный НИИТ, прост в реализации и требует гораздо меньшее количество вычислительных операций. Международная презентация российской системы видеокодировании состоялась в сентябре
2010 г.
Базовые принципы видеокомпрессии достаточно глубоко изложены в описании стандарта МPEG-2. Поэтому с методической точки зрения при
углубленном изучении техники цифрового телевидения очень важным яв
ляется детальное изучение стандарта видеокомпрессии МPEG-2, которое
одновременно дает хорошее начальное понимание ключевых моментов
функционирования стандартов видеокомпрессии более высокого уровня.
3.2. Международный стандарт кодирования
синформационным сжатием MPEG-2
3.2.1.Профили и уровни стандарта кодирования MPEG-2
Даже в рамках одного стандарта, как показывает практика, передача
сигналов телевидения - и цифрового здесь не исключение, ведется на раз
ных уровнях качества. То же самое можно сказать и о телевизионных при емниках. Жесткие, а главное узкие допусковые интервалы нежизненны, поскольку лишают систему гибкости, приспособляемости к разным усло
виям функционирования с ориентацией на различные слои потребителей. При этом любая перспективная система должна иметь резервы для перехо да на более высокие уровни качества. Эти и многие другие соображения и требования легли в основу очень важного документа: ISOIIEC 13818-2.
3.2. Международный стандарт кодирования с информационным сжатием МPEG-2 |
81 |
в этом документе определено, что стандарт МPEG-2 - это целое се мейство взаимносогласованных совместимых цифровых стандартов ин формационного сжатия телевизионных сигналов с различной степенью сложности используемых алгоритмов. Поэтому в рамках стандарта МPEG- 2 была разработана система профилей и уровней. Профиль - это подмно жество стандарта для специализированного nрименения, задающее алго ритмы и средства компрессии. Уровни внутри каждого профиля связаны с параметрами компрессируемого изображения.
Градации качества телевизионного изображения для вещательных систем в стандарте ISO/IEC 13818-2 устанавливаются введением четырех уровней для формата разложения строк телевизионного изображения и пя ти профилей для форматов кодирования сигналов яркости и цветности. Общая идеология построения стандарта МPEG-2 поясняется табл. 3.1 [22].
|
|
|
|
Таблица 3.1 |
|
Профили, уровни, согласованные точки стандарта MPEG-2 |
|||||
|
|
|
|
|
|
Высокий |
|
|
|
|
|
уровень |
|
|
|
|
|
1920 отсчетов |
|
20 |
|
|
25 |
1152 строки |
|
|
|
|
|
(активных) |
|
|
|
|
|
|
|
|
|
|
|
Высокий |
|
|
|
|
|
уровень |
|
|
|
|
|
1440 отсчетов |
|
15 |
|
15 |
20 |
1152 строки |
|
|
|
|
|
(активных) |
|
|
|
|
|
|
|
|
|
|
|
Основной |
|
|
|
|
|
уровень |
|
|
|
|
|
720 отсчетов |
4 |
4 |
4 |
|
5 |
576 строк |
|
|
|
|
|
(активных) |
|
|
|
|
|
|
|
|
|
|
|
Низкий |
|
|
|
|
|
уровень |
|
|
|
|
|
352 отсчета |
|
1 |
1 |
|
|
288 строк |
|
|
|
|
|
(активных) |
|
|
|
|
|
|
|
|
|
|
|
|
Простой |
Основной |
Профиль с |
Специаль- |
Высший |
|
профиль |
профиль |
масштабируе- |
ныймасшта- |
|
|
профиль |
||||
|
без |
без |
мым отноше- |
бируемый |
В кадры |
|
В кадров |
В кадров |
ниемС/Ш |
профиль |
|
|
формат 4:2:0 |
||||
|
формат |
формат |
В кадры |
В кадры |
|
|
или 4:2:2 |
||||
|
4:2:2 |
4:2:0 |
формат 4:2:0 |
формат 4:2:0 |
|
|
|
||||
|
|
|
|
|
|
Все цифровые параметры даны в Мбит/с
82 |
3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии |
Расположенный в нижней части таблицы уровень называется «низким
уровнем» и ему соответствует новый класс качества телевизионного изо
бражения, которое вводится в стандарте МPEG-2 - телевидение ограни ченной четкости. В этом случае в кадре телевизионного изображения со держится 288 активных строк (в 2 раза меньше, чем в вещательном телеви дении) и каждая строка дискретизируется на 352 отсчета.
Кодирование сигналов телевидения вещательного стандарта выполня
ется в соответствии с основным уровнем, то есть с форматом разложения на 576 активных строк в кадре, которые кодируются с использованием 720
отсчетов на строку.
Высокий уровень - 1440 поддерживает телевизионные изображения высокой четкости с разрешением 1440 х 1152 элементов.
Высокий уровень - 1920 поддерживает телевизионные изображения вы сокой четкости широкого формата с разрешением 1920хl152 (НDTV-plus). В обоих «высоких» уровнях кадр телевизионного изображения содержит 1152 активные строки (вдвое больше, чем в вещательном телевидении). Эти
строки дискретизируются соответственно на 1440 или 1920 отсчетов.
В стандарте используются 5 профилей, которым соответствуют 5 набо ров функциональных операций по обработке (компрессии) видеоданных.
Профиль, в котором используется наименьшее число функциональ
ных операций по компрессии видеоданных, назван простым. В нем при компрессии видеоданных используется компенсация движения изображе ния и гибридное ДКП.
Следующий профиль назван основным. Он содержит все функцио нальные операции простого профиля и одну новую: предсказание по двум
направлениям. Эта новая операция, естественно, повышает качество теле визионного изображения.
Следующий за основным назван nрофuлем с масштабируемым отно шением сигнал/шум. Термин <<.масштабирование», в данном случае, означает
возможность обмена одних показателей системы, способность воспроизведе ния телевизионных изображений из части полного потока видеоданных. Этот
профиль к функциональным операциям основного профиля добавляет но вую - масштабирование. Основная идея - повышение устойчивости цифро
вого телевидения и сохранение работоспособности при неблагоприятных ус ловиях приема. Операция масштабирования позволит в рассматриваемом случае повысить устойчивость системы за счет некоторого снижения требо
ваний к допустимому уровню отношения сигнал/шум в воспроизводимом те
левизионном изображении.
При масштабировании потоки видеоданных разделяют на две части.
Одна из них несет наиболее значимую часть информации - ее называют основным сигналом. Вторую часть, несущую менее значимую информа цию, называют дополнительным сигналом. Декодирование только одного основного сигнала позволяет получить телевизионное изображение с по ниженным отношением сигнал/шум до исходного значения.
3.2. Международный стандарт кодирования с информационным сжатием МPEG-2 |
83 |
ивсе же, что можно извлечь из идеи деления потока данных на более
именее значимые части? А все дело в защите системы от ошибок. Поме хоустойчивое кодирование требует введения дополнительных бит, что по вышает общий поток информации. Задача упрощается, когда более мощ ная защита применяется только к части информации и тем самым соблю дается разумный баланс между уровнем потока видеоданных и степенью их защиты. При неблагоприятных условиях приема (например, при низкой напряженности радиополя, при приеме на комнатную антенну и т.п.) со храняется возможность устойчивого декодирования более защищенного
основного сигнала, а неустойчиво воспринимаемый дополнительный сиг
нал просто отключается. Это ведет к росту уровня шума, зато система ос тается работоспособной.
Бывают ситуации, когда сигналы приходится передавать по каналам с
ограниченной пропускной способностью. Деление потока видеоданных на
два, позволяет использовать и «плохие» каналы, ограничивая передачу ос
новным сигналом.
Следующий, четвертый профиль назван специально масштабируемым профилем. Здесь, естественно, сохранены все операции предшествующего профиля и добавлена новая - разделение потока видеоданных по критерию четкости телевизионного изображения. Этот профиль обеспечивает пере
ходы между ныне действующими вещательными системами и ТВЧ. С этой целью видеоданные сигнала ТВЧ разделяются на три потока. Первый -
это основной (значимый) поток видеоданных, например, по стандарту раз ложения на 625 строк. Второй поток несет дополнительную информацию
об изображении с числом строк до 1250. Одновременное декодирование
первого и второго потоков видеоданных позволяет получить телевизион
ное изображение высокой четкости, но с пониженным отношением сиг
нал/шум. В третьем потоке сосредоточена менее значимая информация, его декодирование позволяет повысить отношение сигнал/шум в видеока
нале до уровня, принятого В ТВЧ. Обычно первый поток видеоданных,
представляющих сигнал 625-строчного телевидения, - это 6 Мбит/с, до полняющий его дО ТВЧ - 6 Мбит/с, а повышающий отношение сиг нал/шум до уровня, когда шумы визуально незаметны - 12 Мбит/с.
Стандартом МPEG-2 потенциально предусмотрена масштабируе
мость по времени, позволяющая получать от одного источника видеоин
формации телевизионные изображения с двумя уровнями разрешающей спо
собности по времени. Например, основной поток видеоданных обеспечивает воспроизведение телевизионного изображения с частотой кадров 25 Гц и че ресстрочной разверткой. Добавление дополнительного потока видеоданных к
основному позволяет получить телевизионное изображение с частотой кад ров 50 Гц и прогрессивной разверткой.
Таким образом, стандарт МPEG-2 предусматривает возможность ор ганизации потоков видеоданных как с масштабируемостью, так и без нее.
84 |
3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии |
Однако, масштабируемость, заложенная в стандарте МPEG-2, пока редко встречается в практических реализациях цифровых телевизионных систем,
но она является важной предпосылкой их дальнейшего развития.
В рассмотренных четырех профилях при кодировании сигналов яр кости и цветности используется формат представления видеоданных 4:2:0, в котором число отсчетов сигналов цветности по сравнению с сиг
налом яркости уменьшается в два раза не только по горизонтальному, но
и по вертикальному направлениям. Следующий, пятый профиль называ ется высшим, и он включает в себя все функциональные операции специ ального профиля 4:2:2, при котором число отсчетов сигналов цветности в
вертикальном направлении остается тем же, что и у сигнала яркости. В
этом случае коэффициент компрессии минимален, а качество изображе
ния наивысшее.
Приведенные в табл. 3.1 пять профилей и четыре уровня образуют 20 возможных комбинаций видеосигнала, из которых, вероятнее всего, только 11 будут необходимыми. Для этих комбинаций (согласованные точки) в
таблице указаны возможные значения скорости передачи видеоданных в
Мбит/с.
Для всех стандартизованных точек указаны максимальные потоки ви деоданных, которые позволяют получить телевизионное изображение, сво
бодное от каких-либо дефектов. В иных случаях они могут проявиться В процессе кодирования/декодирования видеосигнала. Используемые в кон
кретных кодерах потоки видеоданных могут быть несколько меньше ука занных значений. Выбор уровня компрессии и, в конечном итоге, уровня потока зависит от допустимой степени искажений телевизионного изобра
жения.
Таким образом, стандарт МPEG-2 позволяет гибко менять скорость передачи видеоданных в очень широких пределах. Надо заметить, что сис темы кодирования стандарта МPEG-2 могут работать как с чересстрочной, так и с прогрессивной развертками, при частоте полей 50 или 60 Гц. Для каждой стандартизованной точки в таблице оговорено число отсчетов сиг нала яркости на активной части строки. Рассмотренные комбинации пара
метров информационного кодирования пригодны для работы с различны ми цифровыми трактами.
Большинство выпускаемых в настоящее время декодеров в интеграль
ном исполнении относится к основному профилю и основному уровню (МP@МL), рассчитанных на телевизионное изображение с чересстрочным
разложением на 625 строк. Эта система принята для первого поколения
цифровых телевизоров дЛЯ НТВ со спутников, работающих в диапазоне 11/12 ГГц, и кабельной сети распределения.
Однако ряд особенностей основного профиля и основного уровня стандарта МPEG-2, например, низкое вертикальное разрешение в цвето
разностных каналах, ограничивают его применение в условиях телевизи-
3.2. Международный стандарт кодирования с информационным сжатием МPEG-2 |
85 |
онных студий, В видеопроизводстве. Для достижения высоких качествен
ных показателей в случае многократного кодирования-декодирования
важно кодировать видеосигналы стандарта 4:2:2. Использование видеосиг налов, кодированных в стандарте 4:2:0, совместно с основным профилем и основным уровнем MP@МL означает, что вертикальное разрешение в цве торазностных каналах уменьшается вдвое. Взаимное преобразование ви деосигналов стандартов 4:2:2 и 4:2:0, необходимое для обеспечения со
вместимости в телевизионном тракте в соответствии с Рекомендацией
МСЭ-Р ВТ.601-5, требует в каждой точке преобразования вертикальные фильтры низких частот. Хорошо известно, что каскадное включение таких фильтров быстро приведет к «смягчению», то есть к размытюю цветовых
границ. Для сохранения цветового вертикального разрешения лучше
осуществлять компрессию видеоданных, кодированных по стандарту
4:2:2. Поэтому в рамках группы MPEG-2 был разработан дополнительный
стандарт 422 Profile @ Main Level (422 P@МL).
Стандарт 422 P@МL является подмножеством основного профиля и основного уровня МP@МL в том смысле, что все значения параметров пер
вого либо равны, либо превышают соответствующие значения второго. Принцип обратной совместимости, заложенный в МPEG-2, гарантирует, что
декодеры 422 P@МL способны декодировать цифровые потоки МP@МL. Основные возможности стандарта 422 P@МL, превосходящие соот
ветствующие свойства основного профиля и основного уровня МP@МL,
заключаются в следующем:
•допускается кодирование сигнала по стандарту 4:2:2, в то время как МP@МL ограничен кодированием сигналов способом 4:2:0;
•цифровой поток кодированных видеоданных может принимать любое
значение до 50 Мбит/с, а в МP@МL - только 15 Мбит/с;
•вертикальное разрешение ограничено значением 512 телевизионных ли
ний в случае 525-строчных систем и 608 телевизионных линий в слу
чае 625-строчных систем, а в MP@ML - значениями 480 и 576 телеви
зионных линий соответственно;
•в 625-строчных системах кроме 576 активных строк стандарт 422 P@МL обеспечивает возможность кодирования еще 32 строк в кадре
как составной части видеосигнала. Это позволяет пропускать напрямую
через систему цифрового сжатия важные строки полевого интервала гашения. Поэтому стандарт 422 P@МL гарантирует пропускание такой информации как полевой временн6й код и сигналы испытательных
строк, не требуя отдельной обработки этих строк.
После того как была сформулирована профессиональная версия МPEG-2 422 P@МL, используемая для студийного производства, он полу
чил статус полноценного международного стандарта, который иногда на
зывают 422 Studio Profile/МL. В результате появилась реальная возмож ность применения стандарта сжатия МPEG-2 на всех участках технологи-
86 |
3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии |
ческой цепочки создания телевизионных программ: от съемки до телезри теля, включая доставку новостийных сюжетов на телецентр, студийную
компоновку программ, их распространение и передачу в эфир. Стандарт предоставляет возможности эффективной работы во всех этих звеньях. Профили МPEG-2 определяют набор способов и технических приемов по сжатию видеоданных, а уровни - такие параметры, как размер изображе ния или скорость цифрового потока при выбранном способе кодирования. Профиль 422 характеризуется высокой скоростью цифрового потока и от носительно короткими группами изображений, что позволяет монтировать
видеопрограмму с достаточно высоким качеством.
В настоящее время активно разрабатывается стандарт МPEG-2 4:2:2 P@HL (профиль 4:2:2 на высоком уровне), нацеленный на использование в
системах ТВЧ.
ДЛЯ кодирования звуковых сигналов с целью их компрессии в МPEG- 2 используется стандарт информационного сжатия звуковых данных мu
SICAМ (Masked Pattem for Adapted Universal Coding and Multiplexing), обо
значаемый также как МPEG Layer П. Стандарт МUSICAМ позволяет пере
давать моно, стерео, многоязыковый и surround (пространственный) звук.
МUSICAМ позволяет снизить скорость потока данных, необходимую
для воспроизведения звуковых сигналов, адекватного качеству, получае
мому при воспроизведении компакт-дисков, до 128 кбит/с на каждый мо
ноканал звукового сопровождения. Таким образом, для самого низкого
уровня - двухканального стереофонического звукового сопровождения - потребуется скорость передачи цифровых данных, равная 128 кбит/сх2 = = 256 кбит/с. В основе стандарта лежат два психоакустических эффекта.
Дело в том, что человеческое ухо не способно различать звуки с громко
стью ниже определенного минимума, так называемого «порога тишиньz».
Кроме того, более тихие звуки «маскируются» более громкими. Соответст венно, алгоритм МUSICAМ обеспечивает передачу только тех звуков, ко
торые реально различаются человеком.
В случае воспроизведения пространственного (surround) звука для пе
редачи шести сигналов звукового сопровождения в отсутствие компрессии
потребуется пропускная способность канала, достигаемая 5,18 Мбит/с (48000 х 18 х 6 = 5,18 Мбит/с, где 48 кГц - частота дискретизации звуко вых сигналов, 18 бит - разрядность квантования). По протоколу для пере
дачи звукового сопровождения предусмотрен канал с пропускной способ
ностью 384 кбит/с. В данном случае требуемый коэффициент сжатия, рав ный 13, сможет обеспечить цифровая система комnрессирования Dolby
АС-З, основанная на спектральном анализе звуковых сигналов и удалении
частотных компонент, не слышимых человеком.
3.2. Международный стандарт кодирования с информационным сжатием МPEG-2 |
87 |
3.2.2. Компрессия видеоданных
Телевизионный сигнал, как известно, избыточен, что обусловлено значительной избыточностью изображений, типичных для телевизионно го вещания. В общем случае б6льшая часть изображения любого телеви зионного кадра обычно приходится на участки, имеющие постоянную или
мало меняющуюся в пространстве яркость, а резкие световые переходы и
детали малых размеров занимают небольшую долю площади изображе ния. Коэффициент корреляции соседних элементов изображения, описы
вающий статистическую связь между яркостями этих элементов, близок к 1. Зная яркость одного элемента, можно с высокой степенью вероятно
сти предсказать яркость соседнего, например, полагая их просто равны
ми. Такого рода избыточность можно назвать nространственной избы точностью изображения.
Изображения соседних кадров в телевидении обычно очень похожи друг на друга, даже при показе движущихся объектов. Переходы от сюже
та к сюжету встречаются редко. Межкадровая разность на значительной части площади изображения обычно близка к нулю. Зная распределение
яркости в одном кадре, можно с высокой степенью уверенности предска
зать распределение яркости следующего кадра. Эта предсказуемость ука зывает на временную избыточность изображения.
Пространственная и временная формы избыточности связаны со ста
тистическими свойствами телевизионных изображений.
Таким образом, в телевидении различают статистическую избыточ ность, избыточность по восприятию, структурную и спектральную из быточность. По теории вероятностей избыточность является следствием определенных корреляционных связей. Корреляция означает, что некото рый элемент изображения более или менее существенно зависит от сосе дей в пространстве и во времени. Под статистической избыточностью по
нимают корреляционные связи между соседними (по вертикали и горизон тали) отсчетами телевизионного сигнала. Необходимо подчеркнуть, что
снижение избыточности в этом случае до определенных пределов обрати
мо, то есть без потерь информации. Примером такого «беспроигрышного»
кодирования служит предсказание на основе ДКП. Можно назвать и дру
гие разностные методы.
Избыточность по восприятию связана с особенностями зрения челове ка. Например, цветовое разрешение нашего зрения ниже яркостного. Эта особенность учтена во всех стандартных аналоговых системах цветового кодирования. В совместимых системах вещательного телевидения NTSC,
рAL и SECAМ цветовое разрешение существенно понижено по отношению к яркостному. Тоже самое зафиксировано в цифровом стандарте 4:2:2, где,
по определению, две цветоразностные компоненты представлены таким же
по объему информационным массивом, что и один яркостный сигнал.
88 |
3. ПРАКТИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ВИДЕОКОМПРЕССИИ В ТЕЛЕВИДЕнии |
|
|
Учитывая эту особенность нашего зрения по восприятию мелких де талей цветного изображения, можно в несколько раз сократить полосу час
тот при передаче и кодировании сигналов цветности.
Структурная избыточность - итог особенностей стандарта разложе ния или, по иному, преобразования изображения в телевизионный сигнал. В нем, например, периодически передаются неизменные по форме элемен ты сигнала: гасящие импульсы строк и полей. В цифровом телевизионном сигнале нет необходимости передавать эти импульсы по каналу связи, так как они могут быть восстановлены в декодере по опорным сигналам син хронизации. В цифровом телевидении достаточно передавать только ак тивную часть изображения. В цифровом стандарте 4:2:2 при 10 битах на отсчет устранение из состава цифрового телевизионного сигнала гасящих
импульсов строк и полей сокращает скорость передачи данных с
270 Мбит/с до 207 Мбит/с, то есть примерно на 23%. Естественно, эта осо бенность сигнала учтена в стандарте МPEG-2 [23,24].
Спектральная избыточность проявляется как результат излишка высо
кой частоты дискретизации. В частности, принятая ортогональная структура дискретизации телевизионного изображения в общем случае не является оптимальной в частотном пространстве. Можно сократить передаваемый
цифровой поток, если преобразовать используемую структуру дискретиза
ции в другую, которая характеризуется меньшим числом отсчетов в кадре,
например, от формата 4:2:2 перейти к формату 4:2:0 или 4:2: 1. Используя
интерполяцию и передискретизацию определенным образом выбранных
групп отсчетов телевизионного сигнала, можно, в принципе, видоизменить
спектральный состав и снизить частоту дискретизации. Такая обработка обычно необратима и, как правило, ведет к некоторому снижению качества восстановленного телевизионного изображения за счет уменьшения его раз решения. В стандарте МPEG-2 этот вид избыточности не устраняется.
Итак, в МPEG-2 применены известные, давно апробированные мето ды сокращения избыточности. Вместе с ними использованы и новые под ходы. В особенности это относится к совокупности согласованных алго
ритмов сокращения статистической избыточности. Здесь особо эффектив
ными оказались два метода: кодирование телевизионных отсчетов с nред сказанием и ДКЛ.
Кодирование с предсказанием реализуется с помощью дифференциаль ной импульсно-кодовой модуляции (ДИКМ). При кодировании с предсказа
нием вычисляется разность между истинным и предсказанным значением от
счета. Затем разность квантуется по уровню. От точности предсказания зави
сит среднее число бит, необходимых для передачи разностной информации. Предсказание может быть экстраполяционным. В этом случае (его часто на зывают предсказанием вперед) по предшествующим значениям отсчетов те
левизионного сигнала оцениваются последующие отсчеты. Интерnоляцион
ное (двунаправленное) предсказание означает, что оценка среднего по поло-
3.2. Международный стандарт кодирования с информационным сжатием МPEG-2 |
89 |
жению отсчета телевизионного сигнала выполняется по известным значени
ям предшествующих и последующих отсчетов. Такое предсказание наиболее точно оценивает текущие отсчеты. Однако за точность приходится расплачи ваться возросшим объемом вычислений и соответственно памяти, необходи мой при реализации. При этом эффект не окупает затраты.
Как уже отмечалось, предсказание выполняется по соседним с пред
сказываемым отсчетам, причем под соседними надо понимать отсчеты,
расположенные «до и за» рассматриваемым. К ним надо добавить соседей в предшествующей и последующей строках, полях и кадрах. Таким обра зом, возможно построчное, межстрочное, внутрunолевое, внутрикадро вое, межполевое, межкадровое nредсказанuе. Это полный набор возмож
ных направлений корреляций. Но уже подчеркивалось, что предсказание
вдоль отдельной строки по предшествующему и последующему элементу
не эффективно. По этому же критерию можно отсеять и некоторые другие
возможные направления.
При простейшем внутриполевом предсказании вперед предшествую
щий отсчет телевизионной строки принимается как ожидаемый уровень
последующего отсчета. Фактически это означает вычеркивание постоян
ной составляющей или, что тоже самое, выделение разностной информа ции. Такой метод предсказания особенно эффективен, когда передаются крупные, не содержащие мелких деталей, фрагменты изображения, где яр
кость постоянна или изменяется медленно.
Другой способ - межкадровое nредсказанuе вперед. В этом случае те
кущий отсчет оценивается по отсчету с теми же координатами, но преды
дyщeгo кадра. Это очень эффективный метод предсказания для неподвиж
ных изображений. Ситуация усложняется, когда изображение содержит движущиеся объекты или изменяющиеся в целом. В этом случае отсчеты, принадлежащие однозначным элементам изображения, от кадра к кадру
будут смещаться. Возникает разностная информация, даже если в осталь
ном никаких изменений не происходит. Это можно ослабить, если ввести компенсацию движения. Для этого необходимо определить векторы пере мещения движущихся частей изображения при последовательном переходе от кадра к кадру. Векторы движения позволяют определить положение ко
дируемого отсчета в новом кадре (скомпенсировать его перемещение) и, та
ким образом, сохранить высокую точность предсказания.
Таким образом, стандарт МPEG-2 фактически не регламентирует ме
тоды сжатия видеосигнала, а только определяет структуру битового потока кодируемого видеосигнала. Поэтому конкретно используемые алгоритмы
зависят от собственных разработок фирм-производителей оборудования.
При этом ярко выражены общие принципы построения стандарта MPEG-2,
в соответствии с которыми процесс сжатия цифрового видеосигнала может быть разбит на ряд последовательных операций: преобразование аналого вого сигнала в цифровую форму, предварительная обработка, ДКП, кван тование, кодирование (рис. 3.1).
