Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MMT_Lec.pdf
Скачиваний:
61
Добавлен:
10.06.2015
Размер:
1.18 Mб
Скачать

www.studforum.ru

UksusoFF

Стандарты серии H

H.261

H.261 – стандарт сжатия видео. Был принят в 1990 году международной организацией ITU. Первоначально он был разработан для передачи по каналам ISDN, на которых ширина потоков данных кратна 64 килобитам/с.

Алгоритм стандарта был предназначен для работы с потоками от 40 килобит/с до 2 Мегабит/с. Частота кадров от 30 fps и ниже. Используется уменьшение разрешения в 2 раза для компонент цветности.

В выходной поток записываются два типа кадров: INTRA – сжатые независимо (соответствуют I-кадрам) и INTER – сжатые со ссылкой на предыдущий кадр (соответствуют Р-кадрам).

Для сглаживания артефактов ДКП предусмотрена возможность применения размытия внутри каждого блока 8x8 пикселей.

Характеристики H.261:

Поток, разрешение: p*64 Кбит, p=1..30, CIF или QCIF

Плюсы: Прост в аппаратной реализации.

Минусы: Невысокая степень сжатия. Ограничения на формат.

H.263

H.263 – стандарт сжатия видео, предназначенный для передачи видео по каналам с довольно низкой пропускной способностью (обычно ниже 128 кбит/с). Применяется в программном обеспечении для видеоконференций. Представляет собой развитие стандарта H.261 и алгоритмов MPEG-1 и MPEG-2. Первая версия была завершена в 1995 году.

Он содержит "базовый" стандарт кодирования, практически не отличающийся по алгоритмам сжатия от H.261, плюс множество опциональных его расширений. Кратко перечислим наиболее важные отличия:

Использование арифметического кодирования вместо кодов Хаффмана. Дает возможность на

5-10% повысить степень сжатия.

Возможность задания векторов смещения, указывающих за границы изображения. При этом граничные пиксели используются для предсказания пикселей вне изображения. Данный прием усложняет алгоритм декодирования, но позволяет значительно улучшить изображение при резкой смене плана сцены.

Возможность задания вектора смещения для каждого блока 8x8 в макроблоке, что в ряде случаев существенно увеличивает сжатие и снижает блочность изображения.

Появление B-кадров, которое позволяет увеличить степень сжатия, за счет усложнения и увеличения времени работы декодера.

Поддержка большого числа форматов входных видеоданных: sub-QCIF, QCIF, CIF, 4CIF, 16CIF

и отдельно настраиваемые. Основное отличие от более универсальных форматов заключается в адаптации для нескольких фиксированных разрешений, что позволяет делать менее универсальные, но более быстрые процедуры обработки кадров. Построенный таким образом декодер работает несколько быстрее.

Компенсация движения с субпиксельной точностью. Возможность сдвинуть блок на полпиксела также увеличивает степень сжатия, но увеличивает время работы декодера.

Особый режим сжатия INTRA макроблоков со ссылкой на соседние макроблоки в обрабатываемом кадре, особый режим квантования и специальная таблица Хаффмана для улучшения сжатия I-кадров в ряде случаев.

Сглаживание границ блоков декодированного изображения для уменьшения эффекта

- 22 -

www.studforum.ru

UksusoFF

"блочности". Зачастую при резком движении в кадре при сжатии алгоритм оказывается вынужден повысить степень квантования блоков после ДКП чтобы уложиться в отведенный на передачу битовый поток. При этом в кадре возникают хорошо вам знакомые по JPEG блоки размером 8х8. Как показала практика, "сращивание" границ, когда крайние пикселы блоков сдвигают по яркости так, чтобы уменьшить разницу, позволяет зачастую заметно повысить визуальное качество фильма.

Изменение разрешения и деформирование базового кадра, использующегося в качестве базового при сжатии.

Различные режимы квантования и кодирования по Хаффману.

Характеристики H.263:

Поток, разрешение: 0.04-20 Мбит/c, sub-QCIF, QCIF, CIF, 4CIF, 16CIF и отдельно настраиваемые разрешения.

Плюсы: Алгоритм H.263 также как H.261 допускает быструю аппаратную реализацию, однако при этом позволяет добиться большей степени сжатия при том же качестве. Поддерживает сжатие звука. Минусы: По количеству заложенных идей находится между MPEG-2 и MPEG-4.

MPEG-7 и MPEG-21

MPEG-7, начало разработки 1996 год, формально называется «Мультимедиа-интерфейс для описания содержимого» (Multimedia Content Description Interface), он имеет целью стандартизовать описание мультимедийного материала, поддерживающего некоторый уровень интерпретации смысла информации, которая может быть передана для обработки.

MPEG-21. Начало разработки 2000 год. MPEG-21 = MPEG-4 + MPEG-7.

ASF

Advanced Systems Format (ранее также англ. Advanced Streaming Format, Active Streaming Format) –

разработанный фирмой Microsoft формат файлов, содержащих потоковое аудио и видео. ASF является частью Windows Media.

AVI

Audio Video Interleave (сокращѐнно AVI; букв. «чередование аудио и видео») – RIFF-медиаконтейнер, впервые использованный Microsoft в 1992 году в пакете Video for Windows.

RIFF (англ. Resource Interchange File Format) – один из форматов файлов-контейнеров для хранения потоковых мультимедиа-данных (видео, аудио, возможно текст). Наиболее известными форматами, использующими RIFF в качестве контейнера, являются: AVI (видео), WAV (аудио), RMI (MIDI-треки).

3GP

3GP (файловый формат 3GPP) – мультимедийный контейнер, определяемый Партнѐрским Проектом Третьего поколения (англ. Third Generation Partnership Project (3GPP) для мультимедийных служб 3G UMTS. Многие современные мобильные телефоны (не обязательно 3G) имеют функции записи и просмотра аудио и видео в формате 3GP. Упрощенная версия ISO 14496-1 Media Format, который похож на MOV. Сохраняет видео как MPEG-4 или H.263. Аудио сохраняется в формате (как правило) AAC-LC.

- 23 -

www.studforum.ru

UksusoFF

Matroska

Matroska (Матрѐшка) – проект, нацеленный на создание открытого, гибкого, кроссплатформенного (включая аппаратные платформы) формата мультимедийного контейнера и набора инструментов и библиотек для работы с данными в этом формате. Этот проект является развитием проекта MCF, но значительно отличается тем, что основан на EBML (Extensible Binary Meta Language – расширяемый двоичный метаязык) – двоичном аналоге языка XML. Использование EBML позволяет расширять формат без потери совместимости со старыми программами.

Не включает в себя форматов сжатия видео и кодеков. Имеет меньший размер блока служебной информации. Возможности формата, закладываемые в Matroska:

трансляция по Интернету (протоколы HTTP и RTP); быстрая перемотка в файле; устойчивость к ошибкам;

экранные меню (как на DVD-дисках); разбиение файла на главы (Chapters); переключаемые «на лету» субтитры; переключаемые звуковые дорожки; модульная расширяемость.

- 24 -

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]