- •Лекция 12. Методы сжатия информации
- •12.1 Основные математические методы, применяемые при сжатии информации
- •Алгоритм Хаффмана
- •Алгоритм Лемпеля-Зива
- •12.2 Фрактальные методы архивации изображений
- •История фрактального сжатия Идея
- •Оценка потерь и способы их регулирования
- •Сжатие способом кодирования серий
- •Сжатие без применения метода rle
- •Процесс кодирования и его методы
- •Арифметическое кодирование
- •Модели входного потока
- •Кодирование сортировкой
- •Двухступенчатое кодирование. Алгоритм Лемпеля-Зива
- •Алгоритм Лемпеля-Зива-Велча (Lempel-Ziv-Welch - lzw)
Лекция 12. Методы сжатия информации
ПЛАН
12.1 Основные математические методы, применяемые при сжатии информации
12.2 Фрактальные методы архивации изображений
12.1 Основные математические методы, применяемые при сжатии информации
Общая формула Шеннона, позволяющая найти количество информации в случайном сообщении фиксированного алфавита, выглядит так:
H = P1*log2(1/P1) + P2*log2(1/P2) + ... + Pn*log2(1/Pn)
где H - количество бит информации в одном символе сообщения,
P1, ..., Pn - вероятности появления символов X1, ..., Xn в тексте сообщения.
Алгоритм Хаффмана
Рис.1.
При приеме "010011010011" им сначала отделяется первый символ "Б" : "0-10011010011", затем снова начиная с вершины дерева – "А" "0-100-11010011", затем аналогично декодируется вся запись "0-100-11-0-100-11" "БАОБАБ".
Алгоритм Лемпеля-Зива
Фраза "КОЛОКОЛ_ОКОЛО_КОЛОКОЛЬНИ" закодируется как "КОЛО(-4,3)_О(-9,4)_(-14,7)ЬНИ".
Распространенный метод сжатия RLE (англ. Run Length Encoding), который заключается в записи вместо последовательности одинаковых символов одного символа и их количества, является подклассом данного алгоритма. Рассмотрим, например, последовательность "ААААААА". С помощью алгоритма RLE она будет закодирована как "(А,7)", в то же время ее можно достаточно хорошо сжать и с помощью алгоритма LZ77 : "А(-1,6)". Действительно, степень сжатия именно такой последовательности им хуже (примерно на 30-40%), но сам по себе алгоритм LZ77 более универсален, и может намного лучше обрабатывать последовательности вообще несжимаемые методом RLE.
12.2 Фрактальные методы архивации изображений
В декабре 1992 года, перед самым Рождеством, компания Microsoft выпустила свой новый компакт-диск Microsoft Encarta. С тех пор эта мультимедиа-энциклопедия, содержащая информацию о животных, цветах, деревьях и живописных местах, не покидает списки наиболее популярных энциклопедий на компакт-дисках. В недавнем опросе Microsoft Encarta опять заняла первое место, опередив ближайшего конкурента - Комптоновскую мультимедиа-энциклопедию. Причина подобной популярности кроется в удобстве использования, высоком качестве статей и, главное, в большом количестве материалов. На диск записано 7 часов звука, 100 анимационных роликов, примерно 800 масштабируемых карт, а также 7000 качественных фотографий. И все это - на одном диске! Напомним, что обычный компакт-диск в 650 Мбайт без использования компрессии может содержать либо 56 минут качественного звука, либо 1 час видео разрешения с разрешением 320х200 в формате MPEG-1, либо 700 полноцветных изображений размером 640х480.
История фрактального сжатия Идея
Фрактальная архивация основана на том, что с помощью коэффициентов системы итерируемых функций (IFS, Iterated Function System) изображение представляется в более компактной форме. Прежде чем рассматривать процесс архивации, разберем, как IFS строит изображение.
Строго говоря, IFS - это набор трехмерных аффинных преобразований, переводящих одно изображение в другое. Преобразованию подвергаются точки в трехмерном пространстве (x координата, у координата, яркость).
Наиболее наглядно этот процесс продемонстрировал сам Барнсли в своей книге "Фрактальное сжатие
Фактически, фрактальная компрессия - это поиск самоподобных областей в изображении и определение для них параметров аффинных (параллельный перенос, сдвиг, поворот, подобие) преобразований.