Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1 / Иллюстрации к лекции 12 по БД и СУБД.doc
Скачиваний:
19
Добавлен:
25.05.2014
Размер:
116.74 Кб
Скачать

15

Лекция 12. Методы сжатия информации

ПЛАН

12.1 Основные математические методы, применяемые при сжатии информации

12.2 Фрактальные методы архивации изображений

12.1 Основные ма­тематические методы, применяемые при сжатии информации

Общая формула Шеннона, позволяющая найти количество информации в случайном сообщении фиксированного алфавита, выглядит так:

H = P1*log2(1/P1) + P2*log2(1/P2) + ... + Pn*log2(1/Pn)

где H - количество бит информации в одном символе сообщения,

P1, ..., Pn - вероятности появления символов X1, ..., Xn в тексте сообщения.

Алгоритм Хаффмана

Рис.1.

При приеме "010011010011" им сначала отделяется первый символ "Б" : "0-10011010011", затем снова начиная с вершины дерева – "А" "0-100-11010011", затем аналогично декодируется вся запись "0-100-11-0-100-11" "БАОБАБ".

Алгоритм Лемпеля-Зива

Фраза "КОЛОКОЛ_ОКОЛО_КОЛОКОЛЬНИ" закодируется как "КОЛО(-4,3)_О(-9,4)_(-14,7)ЬНИ".

Распространенный метод сжатия RLE (англ. Run Length Encoding), который заключается в записи вместо последовательности одинаковых символов одного символа и их количества, является подклассом данного алгоритма. Рассмотрим, например, последовательность "ААААААА". С помощью алгоритма RLE она будет закодирована как "(А,7)", в то же время ее можно достаточно хорошо сжать и с помощью алгоритма LZ77 : "А(-1,6)". Действительно, степень сжатия именно такой последовательности им хуже (примерно на 30-40%), но сам по себе алгоритм LZ77 более универсален, и может намного лучше обрабатывать последовательности вообще несжимаемые методом RLE.

12.2 Фрактальные методы архивации изображений

В декабре 1992 года, перед самым Рождеством, компания Microsoft выпустила свой новый компакт-диск Microsoft Encarta. С тех пор эта мультимедиа-энциклопедия, содержащая информацию о животных, цветах, деревьях и живописных местах, не покидает списки наиболее популярных энциклопедий на компакт-дисках. В недавнем опросе Microsoft Encarta опять заняла первое место, опередив ближайшего конкурента - Комптоновскую мультимедиа-энциклопедию. Причина подобной популярности кроется в удобстве использования, высоком качестве статей и, главное, в большом количестве материалов. На диск записано 7 часов звука, 100 анимационных роликов, примерно 800 масштабируемых карт, а также 7000 качественных фотографий. И все это - на одном диске! Напомним, что обычный компакт-диск в 650 Мбайт без использования компрессии может содержать либо 56 минут качественного звука, либо 1 час видео разрешения с разрешением 320х200 в формате MPEG-1, либо 700 полноцветных изображений размером 640х480.

История фрактального сжатия Идея

Фрактальная архивация основана на том, что с помощью коэффициентов системы итерируемых функций (IFS, Iterated Function System) изображение представляется в более компактной форме. Прежде чем рассматривать процесс архивации, разберем, как IFS строит изображение.

Строго говоря, IFS - это набор трехмерных аффинных преобразований, переводящих одно изображение в другое. Преобразованию подвергаются точки в трехмерном пространстве (x координата, у координата, яркость).

Наиболее наглядно этот процесс продемонстрировал сам Барнсли в своей книге "Фрактальное сжатие

Фактически, фрактальная компрессия - это поиск самоподобных областей в изображении и определение для них параметров аффинных (параллельный перенос, сдвиг, поворот, подобие) преобразований.