- •Сжатие информации
- •Основные понятия
- •Основные понятия
- •Основные понятия
- •Основные понятия
- •Основные понятия
- •Основные понятия
- •Основные понятия
- •Основные понятия
- •Основные понятия
- •Основные понятие
- •Сжатие по Хаффмену
- •Сжатие по Хаффмену
- •Сжатие по Хаффмену
- •Адаптивное сжатие по Хаффмену с равномерной моделью
- •Адаптивное сжатие по Хаффмену с символом ESC
- •Восстановление данных, сжатых адаптивным методом Хаффмена
- •Пример сжатия по Хаффмену
- •Пример сжатия по Хаффмену
- •Пример сжатия по Хаффмену
- •Пример сжатия по Хаффмену
- •Пример сжатия по Хаффмену
- •Арифметическое кодирование
- •Арифметическое кодирование
- •Арифметическое кодирование
- •Пример арифметического кодирования
- •Пример арифметического кодирования
- •Пример арифметического кодирования
- •Словарные методы
- •Словарный метод LZ77
- •Словарный метод LZ77
- •Пример сжатия методом LZ77
- •Пример сжатия методом LZ77
- •Словарный метод LZ78
- •Пример сжатия методом LZ78
- •Пример сжатия методом LZ78
- •Словарные методы
- •Кодирование длин серий
- •Кодирование длин серий
- •Контекстное моделирование
- •Контекстное моделирование
- •Метод PPM
- •Сжатие на основе преобразования
- •Преобразование Барроуза-Уилера
- •Преобразование Барроуза-Уилера
- •Преобразование Барроуза-Уилера
- •Преобразование стопки книг
- •Преобразование стопки книг
- •Интервальное кодирование
- •Сжатие с потерями
- •Сжатие с потерями
- •Сжатие с потерями
- •Преобразование Карунена - Лоэва
- •Преобразование Карунена - Лоэва
- •Преобразование Карунена - Лоэва
- •Преобразование Карунена - Лоэва
- •Преобразование Карунена - Лоэва
- •Сжатие непрерывной информации
- •Сжатие непрерывной информации
- •Сжатие непрерывной информации
- •Сжатие звуковой информации
- •Сжатие звуковой информации
- •Сжатие звуковой информации
- •Сжатие речи
- •Сжатие речи
Сжатие с потерями
Наиболее широкое распространение получил метод, называемый дифференциальной импульсно-кодовой модуляцией (ДИКМ). При ДИКМ из исходного набора (последовательности) данных {xj} формируют разностную последовательность { j} = {xj – xj-1}, элементы которой оказываются менее коррелированными по сравнению с элементами исходной последовательности. При ДИКМ отсчет xj-1 играет роль прогнозируемого значения для элемента xj, а { j} представляет собой последовательность из ошибок предсказания.
Вболее сложных методах для повышения точности прогноза
предсказание выполняют по нескольким соседним значениям выборки {xj}. Такие методы основаны на
численной аппроксимации сплайнами и полиномами. Однако при этом возрастает сложность вычислений.
Сжатие с потерями
Уменьшить межэлементную корреляцию данных можно также с помощью дискретного унитарного преобразования, которое осуществляет их перевод в частотную область.
Получить полностью декоррелированные элементы можно с помощью дискретного унитарного преобразования Карунена-Лоэва. Однако его практическое применение затруднено по причине отсутствия быстрых алгоритмов вычисления и зависимости параметров преобразования от статистики исходной матрицы, состоящей из элементов изображения.
Преобразование Карунена - Лоэва
y = A(x – mx),
где x, y – векторы исходных данных и результатов преобразования; A – матрица преобразования; mx – вектор математического ожидания случайного процесса, реализующего исходные данные.
Преобразование Карунена - Лоэва
Ковариационная матрица:
|
1 |
N |
|
Cx |
|
xixTi |
mxmTx |
|
|||
|
N i 1 |
|
где N – число векторов, являющихся реализацией случайного процесса; xi – i-й случайный вектор, i = 1, …, N.
Вектор математического ожидания:
mx N1 N xi
i 1
Преобразование Карунена - Лоэва
Матрица преобразования Карунена-Лоэва A образуется из собственных векторов ковариационной матрицы Cx в порядке убывания ее собственных значений 1, …, n, где n –длина вектора данных. Для вещественных данных ковариационная матрица является вещественной и симметричной размера n×n, а в этом случае всегда существует ортонормированный базис, состоящий из n собственных векторов.
Преобразование Карунена - Лоэва
Обратное преобразование Карунена-Лоэва : x = ATy + mx
Ковариационная матрица y:
|
λ1 |
0 |
|
0 |
|
|
|
|
0 |
λ2 |
|
0 |
|
Cy |
|
|
||||
|
|
|
||||
|
|
|
|
|
|
|
|
|
0 |
0 |
|
|
|
|
|
λn |
Преобразование Карунена - Лоэва
Если построить матрицу преобразования, в которой являются нулевыми столбцы, соответствующие собственным векторам с номерами m + 1, …, n, и выполнить обратное преобразование, то среднеквадратическая ошибка между полученным и исходным векторами задается выражением:
n m n
ε λi λi λi
i 1 i 1 i m 1
Сжатие непрерывной информации
Очевидным способом сжатия непрерывной информации является ее преобразование в цифровую форму, так как при этом часть информации удаляется. В этом случае получают последовательность чисел – отсчетов (выборок) исходного сигнала, которую затем можно дополнительно сжать любым из рассмотренных выше методом (в этом случае будет удалена избыточность в получившихся дискретных данных).
Сжатие непрерывной информации
Воснове преобразования непрерывных сигналов в цифровую форму лежат две операции – дискретизация и квантование. Дискретизация заключается в периодическом измерении непрерывного сигнала (с некоторым интервалом дискретизации) и использование моментальных значений (отсчетов) вместо исходной «волны». Квантование представляет собой приведение значения очередного отсчета к допустимой величине из конечного множества значений, соответствующим уровням квантования, отличающимся на некоторый интервал квантования.
Сжатие непрерывной информации
Для представления результатов дискретизации используют амплитудно-импульсную модуляцию (АИМ): сигнал преобразуется в набор импульсов определенной длительности (меньшей интервала дискретизации) с амплитудами, равными значениям, зафиксированным в момент опроса. Результат квантования можно воспринимать как представление каждого отсчета в виде последовательности импульсов, соответствующей двоичному коду ближайшего к его значению уровня квантования (импульсно-кодовая модуляция, ИКМ). Данные представления результатов дискретизации и квантования играют роль при передаче информации по каналу связи. С точки зрения обработки и хранения информации последовательность отсчетов храниться в памяти вычислительной системы в виде чисел.