
- •5. Основы цифрового телевидения
- •5.1. Общие положения.
- •5.2. Импульсно-кодовая модуляция
- •5.2.1. Обобщенная структурная схема тракта цифрового телевидения
- •5.3. Дискретизация телевизионного сигнала
- •Если (5.4) подвергнуть преобразованию Фурье, то получим
- •5.4. Квантование телевизионного сигнала
- •5.5. Цифровое кодирование телевизионного сигнала
- •5.6. Формирователи цифровых телевизионных сигналов
- •5.8. Кодирование программ
- •5.9. Кодирование видеоинформации
- •5.9.1. Подготовка видеоданных
- •5.9.2. Удаление временной избыточности
- •5.9.3. Компенсация движения
- •5.9.4. Удаление пространственной избыточности на основе дкп
- •5.9.5. Зигзагообразное сканирование матрицы дкп
- •5.9.6. Квантование с переменной длиной
- •5.9.7. Сравнение векторов
- •5.10. Устройство кодирования звука
- •5.11. Пакет служебных данных
- •5.12. Структура элементарного программного потока
- •5.13. Мультиплексирование программ
- •5.14. Структура пакетов транспортного потока
- •5.15. Прямая коррекция ошибок
- •5.16. Свойства телевизионного сигнала. Дискретное преобразование Фурье
- •5.17. Структурная схема сжатия неподвижных изображений по стандарту jpeg
- •5.17.1. Разбиение изображения на блоки в jpeg и mpeg
- •5.17.2. Дкп. Квантование коэффициентов дкп
- •5.18. Стандарт цифрового сжатия mpeg-1 [10]
- •5.18.1. Алгоритм обработки видеоданных
- •5.18.2. Структура видеопоследовательности
- •5.19. Стандарт сжатия движущихся изображений mpeg-2
- •5.19.1. Структурная схема видеокодера mpeg-2
- •А. Квантование коэффициентов дкп
- •Б. Сканирование коэффициентов дкп
- •В. Компенсация движения в динамических изображениях
- •Г. Стабилизация скорости цифрового потока в канале связи
- •5.19.2. Уровни и профили стандарта mpeg-2 [10]
- •5.19.3. Отличия mpeg-1 и mpeg-2 [8]
- •5.20. Искажения изображения при сжатии по стандартам mpeg. Достижимые степени сжатия [8]
- •Вейвлет – преобразование
- •5.22. Векторное квантование. Фрактальное кодирование
- •Контрольные вопросы
5.19.2. Уровни и профили стандарта mpeg-2 [10]
Стандарт MPEG-2 определяет кодирование, охватывающее требования широкого круга сферы производства и распределения телевизионных программ. Для наиболее эффективного применения и обеспечения высокой степени эксплуатационной совместимости устройств, работающих в стандарте MPEG-2, в нем выделено несколько подмножеств, называемых профилями. В каждом профиле выделено несколько уровней, определяемых совокупностью ограничений, наложенных на параметры цифрового потока. Профиль – подмножество стандарта для специализированного применения, задающее алгоритмы и средства компрессии.
MPEG-2 охватывает весьма широкий диапазон сложности кодирования и качества изображения – от простых I-кадров до сложных ГВК, от низкого разрешения до ТВЧ. В процессе разработки стало ясно, что построить декодер, удовлетворяющий одновременно всем требованиям стандарта, возможно, но неэкономично, так как он окажется весьма сложным и дорогим, и в то же время будет обладать большой избыточностью по отношению к более простым приложениям. Разработчики стандарта разделили все средства и инструменты обработки видеосигналов на несколько Профилей (Profile), поддерживающих обратную совместимость и различающихся использованием тех или иных элементов синтаксиса. Как правило, каждый Профиль добавляет один или несколько инструментов к имеющимся у нижележащего профиля.
На сегодняшний день в стандарте приняты пять основных и один дополнительный, профессиональный Профиль “4:2:2”, введенный позднее [табл. 5.5]. Внутри каждого Профиля выделены Уровни (Level), определяющие допустимые пределы изменения основных параметров цифрового потока. Таких Уровней четыре, и в таблице 5.6 приведены установленные для них пределы скорости потока и разрешающей способности.
Таблица 5.5. Основные параметры кодирования для интерфейса формата 4:2:2
Параметры |
Система 525 строк 60 полей |
Система 625 строк 50 полей |
Кодируемые сигналы Y,CR,CB |
Данные сигналы получаются из основных сигналов RGB, подвергнутых предварительной коррекции |
|
Числа отсчетов на полную длину строки для сигналов: -яркости (Y) -каждого из цветоразностных (CR,CB) |
858 429 |
864 432 |
Структура дискретизации |
Ортогональная сетка из яркостных и цветоразностных отсчетов; цветоразностные отсчеты CR и CB в каждой строке совпадают с нечетными отсчетами (1,3 и т.д.) сигнала яркости Y |
|
Частоты дискретизации*, МГц, для сигналов: -яркости (Y) -каждого из цветоразностных (CR,CB) |
13,5 6,75 |
13,5 6,75 |
Форма кодирования |
Импульсно-кодовая модуляция с однородным квантованием (8 бит на отсчет), для сигналов яркости и каждого из цветоразностных сигналов |
|
Числа отсчетов на активную цифровую строку для сигналов: -яркости (Y) -каждого из цветоразностных (CR,CB) |
720 360 |
720 360 |
Соотношение временной синхронизации по горизонтали между цифровыми и аналоговым сигналом: от конца активной цифровой строки до 0н |
16 яркостных тактовых интервалов (NTSC) |
12 яркостных тактовых интервалов (PAL, SECAM) |
Соотношение между уровнями видеосигнала и квантования для сигналов: -яркости (Y) -каждого из цветоразностных (CR,CB) |
0…225 |
|
220 уровней квантования; уровню черного соответствует 16-й уровень; пиковому уровню белого – 235-й уровень. Допускаются отдельные выбросы за уровень 235 |
||
225 уровней квантования в центральной части шкалы квантования; нуль сигнала соответствует 128 уровню |
||
Использование кодовых слов, соответствующих уровням квантования |
0 и 225 используются исключительно для синхронизации. С 1 по 254 доступны для видеосигналов |
*Допуски на частоту дискретизации должны соответствовать допускам на частоту строк соответствующего стандарта системы цветного телевидения.
Табл.5.6. Пределы изменения параметров цифрового потока для различных уровней Основного профиля MPEG-2
Уровень |
Параметр |
Ограничение |
Высокий MP@HL |
Число отсчетов на строку |
1920 |
Число строк на кадр |
1152 |
|
Частота кадров, Гц |
60 |
|
Частота отсчетов сигнала яркости, отсч/с |
62668800 |
|
Скорость потока, Мбит/с |
80 |
|
Размер буфера, бит |
9781248 |
|
Высокий MP@H1440 |
Число отсчетов на строку |
1440 |
Число строк на кадр |
1152 |
|
Частота кадров, Гц |
60 |
|
Частота отсчетов сигнала яркости, отсч/с |
47001600 |
|
Скорость потока, Мбит/с |
60 |
|
Размер буфера, бит |
7340032 |
|
Основой MP@ML |
Число отсчетов на строку |
720 |
Число строк на кадр |
576 |
|
Частота кадров, Гц |
30 |
|
Частота отсчетов сигнала яркости, отсч/с |
10368000 |
|
Скорость потока, Мбит/с |
15 |
|
Размер буфера, бит |
1835008 |
|
Низкий MP@LL |
Число отсчетов на строку |
352 |
Число строк на кадр |
288 |
|
Частота кадров, Гц |
30 |
|
Частота отсчетов сигнала яркости, отсч/с |
3041280 |
|
Скорость потока, Мбит/с |
4 |
|
Размер буфера, бит |
475136 |
Уровень “Высокий-1440” был введен для планировавшейся европейской системы с разложением 1440×1152 пикс. и форматом кадра 4:3. Отметим, что в принятой Рекомендации ВТ.709 по ТВЧ форматам такой формат не предусмотрен. Не все Профили определены при всех Уровнях, допустимые сочетания указаны в таблице 5.7.
Табл.5.7. Уровни и профили стандарта MPEG-2
Уровни
|
Профили |
Простой (Simple) |
Основной (Main) |
Масштабируемый по отношению сигнал-шум (SNR) |
Пространственно-масштабируемый (Spatial)
|
Высокий (High)
|
Профессиональный 4:2:2 (Professional 4:2:2) |
Типы кадров |
I, P |
I, P, B |
I, P, B |
I, P, B |
I, P, B |
I, P, B |
|
Дискретизация сигнала цветности |
4:2:0 |
4:2:0 |
4:2:0 |
4:2:0 |
4:2:0 или 4:2:2 |
4:2:0 или 4:2:2 |
|
Высокий (High) |
Число отсчетов на строку |
|
1920 |
|
|
1920 |
1920 |
Число строк на кадр |
|
1152 |
|
|
1152 |
1152 |
|
Частота кадров, Гц |
|
60 |
|
|
60 |
60 |
|
Скорость потока, Мбит/с |
|
80 |
|
|
100 |
300 |
|
Высокий- 1440 (High-1440) |
Число отсчетов на строку |
|
1440 |
|
1440 |
1440 |
|
Число строк на кадр |
|
1152 |
|
1152 |
1152 |
|
|
Частота кадров, Гц |
|
60 |
|
60 |
60 |
|
|
Скорость потока, Мбит/с |
|
60 |
|
60 |
80 |
|
|
Основной (Main) |
Число отсчетов на строку |
720 |
720 |
720 |
|
720 |
720 |
Число строк на кадр |
576 |
576 |
576 |
|
576 |
576 |
|
Частота кадров, Гц |
30 |
30 |
30 |
|
30 |
30 |
|
Скорость потока, Мбит/с |
15 |
15 |
15 |
|
20 |
50 |
|
Низкий (low) |
Число отсчетов на строку |
|
352 |
352 |
|
|
|
Число строк на кадр |
|
288 |
288 |
|
|
|
|
Частота кадров, Гц |
|
30 |
30 |
|
|
|
|
Скорость потока, Мбит/с |
|
4 |
4 |
|
|
|
Примечание: режим 4:2:2 P@ предлагаемым стандартом HL введен SMPTE-308M.
Затенением в таблице выделен режим “4:2:2P@HL”, отсутствующий в стандарте MPEG-2 и предложенный позднее проектом стандарта SMPTE-308M по инициативе вещательных компаний. Этот режим удобно использовать при производстве программ. Он допускает максимальную скорость потока 300 Мбит/с со следующими ограничениями: на скорости от 230 до 300 Мбит/с допускаются только I-кадры, на скорости от 175 до 230 Мбит/с – I-, IP-, IB-кадры, на меньших скоростях – ГВК любой конфигурации, не противоречащей стандарту MPEG-2. Декодеры, поддерживающие определенный Уровень определенного Профиля, должны работать также и при всех более низких Уровнях и Профилях. В англоязычной литературе принято обозначать сочетания Профиля и Уровня первыми буквами, разделенные знаком @. Например, сочетание “Основной профиль – Основной уровень” записывается как MP@ML (Main Profile@Main Level). Режим MP@ML стал наиболее распространенным и широко употребительным, он обеспечивает полную разрешающую способность 720×576 пикс., предусмотренную Рекомендаций ВТ.601, и это сочетание признано наиболее подходящим для цифрового вещания. Максимальная скорость потока видеоданных 15 Мбит/с заведомо достаточна для достижения качества изображения, превышающего возможности аналоговых стандартов PAL, SECAM и NTSC. Масштабирование в Основном профиле не применяется.
Простой профиль (SP – Simple Profile), не поддерживающий двунаправленное предсказание и B-кадры, предназначался первоначально для массовых применений при обработке компьютерных изображений и в других приложениях, не требующих высокого качества изображения, однако стоимость микросхем, разработанных для Основного профиля, оказалась так низка, что разработка специальных изделий для Простого профиля была признана целесообразной. Он применяется лишь в простейших программных MPEG-кодерах.
Масштабируемые профили пока широко не используются, хотя в некоторых приложениях для них просматриваются возможные области применения (например, в наземном цифровом вещании). Масштабируемостью называют способность кодека (кодера и декодера) формировать и обрабатывать упорядоченный набор из нескольких цифровых потоков. Минимально необходимый набор потоков называется базовым слоем, каждый из остальных – улучшающим слоем. Базовый слой передает сигнал пониженного качества с более высоким отношением сигнал-шум, или сигнал с пониженным пространственным разрешением, который может приниматься декодером низкого профиля, а в улучшающих слоях передается дополнительная информация, используя которую, кодеры более высокого профиля восстанавливают улучшенное изображение. Синтаксис MPEG-2 поддерживает до двух слоев масштабирования. Принцип работы масштабирующего кодека показан на рис.5.52. Из рисунка видно, что при передаче сигнала изображения используют два потока данных, образующих так называемый базовый и расширенный слои. Базовый слой несет информацию об “ухудшенной” версии изображения, расширенный – об информации, дополняющей “базовое” изображение до полного качества.
Рис.5.52. Принцип работы масштабирующего кодера: а) кодер; б) декодер
В ходе разработки было признано нецелесообразным объединять все виды масштабирования в один Профиль, и разработали две схемы – с масштабированием отношения сигнал-шум и с пространственным масштабированием.
В схеме, масштабирующей отношение сигнал-шум (SNR (Signal-to-Noise Ratio) Profile), в базовом слое передаются грубо квантованные коэффициенты ДКП. Они передаются с низкой скоростью, что несколько повышает шумы квантования, но улучшает помехоустойчивость. Улучшающий слой кодирует и передает разницу между неквантованными и грубо квантованными значениями коэффициентов, которую декодер SNR профиля использует для уточнения значений коэффициентов. Можно использовать этот подход и для изменения пространственного разложения, если в базовом слое передавать самые нижние M×N (M<8, N<8) коэффициентов ДКП, а в улучшающем слое – остальные (64 - M×N).
Профиль с пространственным масштабирование (Spatial Scalable Profile), был введен в стандарт для обеспечения доступа декодерам стандартной четкости к программам ТВЧ. Привязкой к ТВЧ объясняется довольно большая скорость цифрового потока, предусмотренная в этом Профиле. В базовом слое такой системы передается после прореживания информация, соответствующая стандартному разрешению, а в улучшающем слое – дополнительные отсчеты, отфильтрованные в базовом слое.
Профиль “Высокий”, предусматривающий все инструменты нижних профилей, в настоящее время пока не используется по нескольким причинам, в том числе, по-видимому, из-за отсутствия интегральных микросхем с достаточными ресурсами производительности.
Несколько особняком, вне иерархии, стоит профиль “Профессиональный 4:2:2”, предназначенный ля обеспечения совместимости с цифровым студийным оборудованием видеопроизводства. В этом формате работают, например, перевозимые комплекты цифровых систем сбора новостей, передающие сигнал через спутники для последующей записи и монтажа. Профиль “4:2:2” должен обеспечивать качество изображения, сравнимое с цифровой видеозаписью формата D1, и возможность многократного MPEG кодирования-декодирования сигнала. Его основными свойствами являются структура дискретизации “4:2:2” (в отличие от обычной в MPEG-2 “4:2:0”), увеличенное число строк – 608 в отличие от 576, и возможность работы с повышенными скоростями до 50 Мбит/с вместо 15 Мбит/с, обеспечиваемых Основным профилем. Последнее требование связано с более короткими группами видеокадров, используемыми при видеомонтаже. Предложенный недавно Высокий уровень этого профиля позволит расширить область использования MPEG-2 при подготовке ТВЧ программ.
Для профессиональных применений очень важна способность оборудования разных производителей работать совместно (по-английски это свойство называется interoperability, в русском языке наиболее близка “совместная работоспособность”). Хотя MPEG-2 должен обеспечивать полную совместимость во всех режимах работы, организация Pro-MPEG Forum, занимающаяся внедрением стандартов MPEG, предложила использовать в профессиональных системах для стыков аппаратуры ограниченное число режимов, в которых заведомо должны выполняться все требования к цифровому потоку. В качестве таких режимов выбраны:
4:2:2P@ML, ТСЧ, скорость до 50 Мбит/с, любая разрешенная структура ГВК.
4:2:2P@ML, ТСЧ, скорость до 50 Мбит/с, только I-кадры.
3а. 4:2:2P@HL, ТВЧ, скорость до 80 Мбит/с, любая разрешенная структура ГВК.
3б. 4:2:2P@HL, ТВЧ, скорость до 175 Мбит/с, любая разрешенная структура ГВК.
4. 4:2:2P@HL, ТВЧ, скорость до 300 Мбит/с, только I-кадры.