Алгоритм lzss

В 1982 г. Сторером (Storer) и Шиманским (Szimanski) на базе LZ77 был разработан алгоритм LZSS, который отличается от LZ77 производимыми кодами.

Код, выдаваемый LZSS, начинается с однобитного префикса, различающего собственно код от незакодированного символа. Код состоит из пары: смещение и длина, такими же как и для LZ77. В LZSS окно сдвигается ровно на длину найденной подстроки или на 1, если не найдено вхождение подстроки из буфера в словарь. Длина подстроки в LZSS всегда больше нуля, поэтому длина двоичного кода для длины подстроки - это округленный до большего целого двоичный логарифм от длины буфера.

Длина кода вычисляется следующим образом: длина подстроки не может быть больше размера буфера, а смещение не может быть больше размера словаря –1. Следовательно, длина двоичного кода смещения будет округленным в большую сторону n=log₂(размер словаря), а длина двоичного кода для длины подстроки будет округленным в большую сторону m=log₂(размер буфера). Каждый символ кодируется 8 битами (например, ASCII+). Т.е., для кодирования каждой подстроки исходного сообщения нужно n+m+8 бит.

Пример: Закодировать сообщение «Иванов Иван Иванович» с помощью метода LZSS с размеров буфера и словаря 8 и 5 символов соответственно.

Словарь (8)

Буфер (5)

Код

0 ’И’

0 ’В’

0 ’А’

0 ’Н’

0 ’О’

1 <4,1>

0 ’_’

1 <1,4>

1 <3,5>

0 ’О’

1 <4,1>

1 <2,1>

0 ‘Ч’

Длина исходного сообщения: бит

Длина закодированного сообщения: бит

% сжатия:

Задание:

1. Закодировать строку, состоящую из фамилии, имени, отчества, образованных от фамилии. Длину буфера и словаря подобрать так, чтобы кодирование было эффективным. Вычислить длину исходного сообщения и длину кода в битах. Вычислить процент сжатия.

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 1110 11 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
06.11.2018120.83 Кб7Методичка_new_ООП.doc
#
23.11.2019855.55 Кб1Методичка_автоматизация исп..doc
#
30.04.2019888.83 Кб2Методичка_ИГ(заочники).doc
#
01.03.2025855.55 Кб1Методичка_к_лаб_работам.doc
#
09.09.2019141.82 Кб2Методичка_курсовой_ЧМИ_весна 2012.doc
#
10.11.2019687.62 Кб36Методичка_лаб_раб_ТИК.doc
#
22.11.2019317.95 Кб5Методичка_лр1_2.doc
#
09.11.2019921.6 Кб21методичка_модели-метод-окончат-вариант.doc
#
01.05.2025321.02 Кб0Методичка_ООП_заочники.doc
#
01.03.2025191.49 Кб0Методичка_оформление.doc
#
01.04.2025337.92 Кб0методичка_оформление_Артамонов.doc