- •Основы сжатия изображений и видео
- •Структура пзс-матрицы
- •Формирование цветного изображения
- •Аналого-цифровое преобразование
- •Сжатие цифрового телевизионного сигнала
- •Краткий обзор стандартов сжатия видео
- •Требования к алгоритму
- •Описание алгоритма сжатия mpeg
- •Устранение цветовой избыточности и подготовка макроблоков
- •8Х8 пикселей с сохранением шага дискретизации, а цветоразностные компоненты u
- •Сжатие независимых кадров (I – кадров)
- •Алгоритм jpeg
- •1991 Году в качестве одного из стандартов сжатия изображений, является одной
- •8Х8 (то есть, как средняя яркость блока).
- •Сжатие кадров с предсказанием (p-кадров и b-кадров)
- •Использование векторов смещений блоков
- •Структурная схема алгоритма mpeg
- •Повышение степени сжатия и качества видеоизображений
- •Алгоритм сжатия кадра на основе jpeg-2000
- •1992 Году. В 1997 стало ясно, что необходим новый, более гибкий и мощный стандарт, который и был доработан к 2000 году.
- •Идея алгоритма
- •Предобработка
- •Дискретное вэйвлет-преобразование. Идея алгоритма
- •Дискретное вэйвлет-преобразование в jpeg-2000
- •Квантование
- •Стандарт сжатия видео mpeg-4
- •Кодированное представление медийных объектов
- •Состав медийных объектов
- •Описание и синхронизация потоков данных для медийных объектов
- •Описание сцен
Требования к алгоритму
1. Произвольный доступ - подразумевает возможность быстро найти и показать любой кадр. Обеспечивается наличием в потоке данных, так называемых точек
входа - кадров, сжатых независимо друг от друга (т.е. как обычное статическое изображение). Время поиска произвольного кадра должно быть не более 1/2
секунды.
2. Быстрый поиск вперед/назад - подразумевает быстрый показ кадров, не следующих друг за другом в исходном потоке. Требует наличия дополнительной
информации в потоке.
Показ кадров фильма в обратном направлении. Требуется редко, но выполнение этого требования может резко уменьшить степень сжатия.
Аудио-визуальная синхронизация - очень серьезное требование. Данные,
необходимые для того, чтобы добиться синхронности аудио и видео дорожек,
существенно увеличивают размер фильма. Для видеосистемы это означает, что,
если мы не успеваем достать и показать в нужный момент времени какой либо кадр,
то мы должны уметь корректно показать, например, кадр, следующий за ним. Если мы показываем фильм без звука, то можно позволить себе чуть более медленный или более быстрый показ. Однако смотреть фильм в котором видеосистема не успевает за звуком – это мучение.
Устойчивость к ошибкам - требование, обусловленное тем, что в
большинстве каналов связи присутствуют ошибки. Испорченное помехой изображение должно быстро восстанавливаться. Требование достаточно легко удовлетворяется большим числом независимых кадров в потоке. Однако, при этом также уменьшается степень сжатия, так как на экране 2-3 секунды (50-75 кадров)
может быть одно и то же изображение, но мы будем вынуждены нагружать поток независимыми кадрами.
Время кодирования/декодирования. Определяет сложность и требуемое быстродействие аппаратной части системы кодирования/декодирования
Редактируемость. Под редактируемостью понимается возможность изменять все кадры так же легко, как если бы они были записаны независимо.
Масштабируемость - простота реализации видео в окне нестандартного
размера.
Небольшая стоимость аппаратной реализации. При разработке способа
сжатия должна оцениваться и учитываться его конечная стоимость. Если эта стоимость велика, то даже при международной стандартизации алгоритма,
производители будут предлагать свои, более конкурентоспособные, алгоритмы и
решения.
Описание алгоритма сжатия mpeg
Для того чтобы удовлетворить перечисленным выше во многом противоречивым требованиям и увеличить гибкость алгоритма, в алгоритме предусмотрено четыре типа кадров:
I - кадры - кадры сжатые независимо от других кадров (I - Intra pictures),
P - кадры - сжатые с использованием ссылки на одно предыдущее или последующее изображение (P - Predicted),
B - кадры - сжатые с использованием ссылки на два изображения (B - Bidirection),
DC - кадры - независимо сжатые с большой потерей качества (используются только при быстром поиске и не показываются в видеопотоке).
I – кадры, как некоторые опорные точки, обеспечивают возможность произволь-ного
доступа к любому кадру. Имеют относительно невысокую степень сжатия, поэтому
большое число I-кадров в потоке снижает степень сжатия видео.
P - кадры учитывают подобие соседних кадров в их последовательности и используют при кодировании ссылку на один I - кадр или такой же P – кадр. Имеют гораздо более высокую, чем I – кадры, степень сжатия.
B - кадры, в процессе кодирования используют ссылки на два кадра, находящихся впереди и позади, обеспечивают наивысшую степень сжатия. Сами в качестве
ссылки использоваться не могут.
Последовательность кадров различных типов в видеопотоке может быть, например,
такой:
Рис. 8. Последовательность кадров в видеопотоке
Частота следования I - кадров выбирается в зависимости от требований на время произвольного доступа и быстроты восстановления при передаче видеопотока через канал с ошибками.
Соотношение P - и B - кадров подбирается, исходя из требований к степени сжатия
(чем больше относительное содержание В – кадров, тем выше степень сжатия) и
сложности декодера (чем больше B – кадров, тем сложнее декодирование). Дело в том, что для того, чтобы декодировать B - кадр, мы должны уже декодировать те
кадры, на которые он ссылается.
Варьирование частоты кадров разных типов обеспечивает алгоритму необходимую
гибкость и возможность расширения.
Процедура сжатия видео, как уже говорилось, включает его внутрикадровую обработку и межкадровую обработку. И начинается с подготовки сжимаемых данных внутри кадра.
