Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
320
Добавлен:
19.03.2016
Размер:
267.78 Кб
Скачать

Лекция 14

Тема: Стандарты сжатия изображения и звука

ЦЕЛЬ ЛЕКЦИИ: Подробнее описать функции, присущие стандартам MPEG – 1 и MPEG - 2, охарактеризовать отличия стандарта MPEG – 2 от стандарта MPEG – 1, показать новые возможности, предоставляемые стандартом.

Официальное обозначение стандарта – MPRG – 2 (ISO/IEC 13818).

Cреди 10 составных частей стандарта можно выделить 3 основных: 13818-1-systems, 13818-2-video, 13818-3-audio. Спецификация 13818-2 регламентирует кодовое представление и процесс декодирования, обеспечивающий воспроизведение компрессированных телевизионных изображений. 13818-2 предполагает сжатие потока видеоданных за счет устранения пространственной и временной избыточности, присущей телевизионному изображению. Процедура кодирования не регламентируется стандартом, что оставляет возможности для совершенствования кодеров и улучшения качества воспроизводимого изображения. Спецификация 13818-3, которая была рассмотрена в предыдущей лекции, определяет кодовое представление сигнала звукового сопровождения. Системная спецификация 13818-1 устанавливает правила объединения данных видео и звука в единый поток. Важнейшая особенность стандарта MPEG-2 – представление сигналов телевизионного изображения и звука в форме, задаваемой спецификациями 13818-1 – 13818-3, позволяет общаться с видео звуковыми потоками как с потоками компьютерных данных, которые могут записываться на самые разнообразные носители информации, передаваться и приниматься с использованием каналов связи и сетей телекоммуникаций, которые существуют сегодня и появятся в будущем.

Элементы потока

Для представления видеопотока в цифровом виде пришлось решить немало проблем. Большие сложности составила проблема совместимости с существующими аналоговыми форматами (PAL, SECAM, NTSC). Стандарт CCIRR-601 определил базовые характеристики для видеопотоков 720х576х25 кадров/сек (совместимость с PAL), 720х480х30 (совместимость с NTSC).

Поток видеоданных, определяемый спецификацией 13818-2, представляет собой иерархическую структуру, элементы которой строятся и объединяются друг с другом в соответствии с определенными синтаксическими и семантическими правилами (рис. 1).

Существует 6 типов элементов этой иерархической структуры:

  • Видеопоследовательность (видеоряд)

  • Группа изображений (кадров)

  • Изображение (кадр)

  • Срез (слайс)

  • Макроблок (фрейм)

  • Блок.

Рис. 1 Структура видеопотока.

Видеопоследовательность – элемент потока видеоданных высшего уровня. Она представляет собой серию последовательных кадров телевизионного изображения. MPEG-2 допускает как построчные, так и чересстрочные последовательности. Чересстрочная последовательность – это серия телевизионных полей. В процессе компрессии поля могут кодироваться раздельно. Это дает изображения типа «поле».

Два поля, кодируемые как телевизионный кадр, образуют изображение типа «кадр». В одной чересстрочной последовательности могут использоваться и изображения-поля, и изображения-кадры. В последовательностях с построчным разложением каждое изображение представляет собой кадр.

В соответствии с используемыми методами дифференциального кодирования различают три типа изображений: I, P и B. Изображение типа I кодируется с использованием только той информации, которая содержится в нем самом (I - Intra-coded picture). В нем устраняется только пространственная избыточность. При кодировании P и B изображений используется межкадровое кодирование. При кодировании изображения типа P формируется разность между исходным изображением и предсказанием, полученным на основе предшествующего или последующего изображения типа I (P – Predictive-coded picture). Изображение типа B – это изображение, при кодировании которого используется предсказание, сформированное на основе предшествующего и последующего изображений типа I или P (B – Bidirectionally-predicted-coded picture). В изображениях типа P и B устраняется и пространственная, и временная избыточность. Серия изображений, содержащих одно I-изображение, называется группой изображений. Пример видеопоследовательности с различными типами изображений показан на рис.1 (стрелками показаны направления предсказания в пределах одной группы изображений). Чем больше группа изображений, тем большая степень

компрессии может быть достигнута.

В материалах лекции 12 описаны и проиллюстрированы понятия блока, макроблока, среза, особенностей построения макроблоков при кадровом и полевом кодировании, методы оценки движения и варианты кодирования макроблоков. Поэтому далее кратко рассмотрим режимы работы кодера и более основательно алгоритмы формирования структуры видео потока.

Соседние файлы в папке Лекции ОТВ