- •Министерство образования и науки Российской Федерации
- •Содержание
- •1. Методы сокращения информационной избыточности цифровых изображений
- •1.1. Представление цифровых изображений
- •1.2. Классификация методов сжатия. Основные характеристики
- •3. Время преобразования
- •1.3. Алгоритмы сжатия изображений без потерь
- •1.3.1. Сжатие способом кодирования серий (rle)
- •1.3.2. Сжатие по методу Хаффмана
- •1.3.3. Алгоритм Лемпеля-Зива (lz-compression)
- •1.3.4. Алгоритм Лемпеля-Зива-Велча (Lempel-Ziv-Welch -lzw)
- •1.3.5. Алгоритм jbig
- •1.3.6. Алгоритм Lossless jpeg
- •1.4. Алгоритмы сжатия с потерями
- •1.4.1. Метод усеченного блочного кодирования (убк)
- •1.4.2. Сжатие по стандарту jpeg
- •1.4.3. Сжатие по методу wic (Wavelet Image Compression)
- •1.4.4. Фрактальное сжатие изображений
- •2. Алгоритмы сжатия аудиосигналов
- •2.1. Параметры звукового сигнала
- •2.1.1. Критические полосы слуха
- •2.1.2. Пороги слышимости при маскировке
- •2.1.3. Цифровой звук
- •2.2. Основные виды алгоритмов сжатия аудиосигналов
- •2.3. Степень ухудшения качества сигнала при квантовании
- •2.4. Алгоритмы сжатия аудиосигналов
- •2.4.1. Дифференциальная импульсно-кодовая модуляция
- •2.4.2. Кодирование в частотных поддиапазонах
- •2.4.3. Аудио mpeg-1
- •2.5. Общая схема аудиокодера и аудиодекодера мреg
- •2.6. Анализ возможностей алгоритмов сжатия аудиосигналов
- •3. Стандарты сжатия видеоданных
- •3.1. Особенности сжатия видеоданных
- •3.2. Основные процедуры сжатия видеоданных
- •3.2.1. Цветовые пространства и их преобразование
- •3.2.2. Форматы семплирования
- •3.2.3. Устранение пространственной статистической избыточности
- •3.3. Модель dpcm/dct видеокодека
- •3.4. Анализ возможностей современных методов сжатия видеоданных
- •Последовательность №1. Flight
- •Последовательность №2. Monkeys
- •Последовательность №3. Discussion
- •Последовательность №4. Space ship
- •Литература
- •Кафедра вычислительной техники
3.2.3. Устранение пространственной статистической избыточности
Общая схема устранения пространственной статистической зависимости для стандартов MPEG и H.263/264 определяет процесс сжатия отдельного кадра видеопотока и совпадает с процедурой сжатия статического полноцветного изображения по стандарту JPEG (рис.1.4.) [6].
В начале изображение переводится из цветового пространства RGB в цветовое пространство YCrCb согласно описанной в предыдущем разделе модели преобразования цветовых пространств.
Затем изображение разбивается на блоки размером 8х8. Такие блоки создаются для каждой из цветовой составляющей. Для компонент Cr и Cb формирование блока происходит через строчку и через столбец, т.е. из исходного блока 16х16 получается один рабочий блок 8х8. В дальнейшем к каждому из блоков применяется дискретно косинусное преобразование, которое описывается выражением (1.13).
Для уменьшения хранимой информации производится квантование полученной матрицы частотных коэффициентов. Квантование представляет собой деление матрицы частотных коэффициентов на матрицу квантования. Для каждой из цветовых составляющих обычно используется своя матрица квантования q[u,v]:
(3.3)
Иногда для формирования матрицы квантования может использоваться специальная весовая функция, позволяющая сформировать коэффициенты квантования, обращающие в 0 наибольшее число высоко и средне частотных коэффициентов.
Этап квантования – это этап, на котором происходят самые большие потери в качестве изображения и этап, на котором осуществляется управление степенью сжатия изображения. При сильном квантовании низкочастотные коэффициенты могут настолько измениться, что изображение распадётся на визуально различимые квадраты. Потери в высокочастотных коэффициентах приводят к появлению «нимба» вокруг контуров с резким переходом цвета.
Квантователь отображает числовой сигнал с областью значений Х в квантованный сигнал области Y с уменьшенным числом значений. Это дает возможность представить квантованные величины с меньшим числом бит по сравнению с исходными неквантованными величинами.
Скалярный квантователь отображает один исходный сэмпл в одно квантованное значение на выходе. Простейшим примером такого квантователя может метод округления дробного числа до ближайшего целого. Это процесс с частичной потерей информации, так как не возможно установить точное значение исходного дробного числа по округленному целому. Квантование можно использовать для понижения точности изображения после применения кодирующего преобразования. Тем самым будет удалена часть незначимых величин и коэффициентов, оставляя малое число существенных ненулевых коэффициентов.
Векторный квантователь отображает группу исходных сэмплов в группу квантованных величин – кодовое слово, а декодер каждому каждому кодовому слову сопоставляет некоторое приближение к исходному множество данных. Множество векторов хранится кодером и декодером в специальной кодовой книге.
Проквантованная матрица затем преобразуется в вектор с помощью ZigZag сканирования (Рис.2.5).
После ZigZag сканирования низкочастотные элементы оказываются в «голове» вектора, а высокочастотные коэффициенты в «хвосте» вектора.
Далее выполняется так называемое вторичное сжатие с использованием энтропийного кодера.
Энтропийный кодер преобразует элементы последовательности символов, представляющих элементы видеопоследовательности, в сжатый поток битов, который можно сохранить в файле или передать по сетям связи. Входными символами могут являться квантованные коэффициенты преобразования, векторы движения, маркеры, хедеры и дополнительную информацию – данные, несущественные для корректного декодирования. Векторы движения обычно представляются в виде координат вектор перемещения всех блоков с компенсацией движения с целым или дробным пиксельным разрешением. Маркеры – это коды, обозначающие точки синхронизации в видеопоследовательности. Хедеры – заголовки макроблоков, изображений, последовательностей и других объектов.
Полученный вектор затем кодируется методом RLE. А полученные пары кодируются по Хаффману с фиксированной таблицей.
Процесс восстановления изображения полностью симметричен процессу сжатия изображения.