Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТИ.doc
Скачиваний:
6
Добавлен:
06.09.2019
Размер:
667.65 Кб
Скачать

Кодирование текста

111100000101101000011111110100011011101010110110111001000010110101101001010110010011111011000101001001101111001000101110011010010011101100010110011100111111100100101010001111111000010100001101000101110011110001010001111011011001010111110100011110010000111000110110111011110110100111100100010100001001101011010100010011100100011011000111000110011001111011100110111000011010001110100100001011010001100011001011000110111000110110011001001010101001010111100110011001001011001001010001111001110001010111011000111111011000111101101100101011111010010001000000100000101100111001101111111100111111111100001010110011000110011100100100000011010000001001110110010111101001001000110010110001100111001001000001000101010010001101111000100100100111110100100011101110011010100001100110001010100011011010110011110001010110000101011001000101000100100101111101001100011100000111010010011101101011001111011101001011101000001011001110011110100101 10011100111000101110100000101000011010011111011010110101100101000100111001000100010010011101001110011101010001001011001000101101111001001011001

Символов всего - 1067

Из них “1”-536,

“0”-531.

2 Построение кода Хаффмена

Выписываем в ряд все символы алфавита в порядке убывания вероятности их появления в тексте.

Последовательно объединяем два символа с наименьшими вероятностями появления в новый составной символ, вероятность которого полагаем равной сумме вероятностей составляющих его символов. В конце концов, построим дерево, каждый узел которого имеет суммарную вероятность всех узлов, находящихся ниже него. Прослеживаем путь к каждому узлу, получаем последовательность, которая представляет собой кодовое слово, соответствующее каждому символу.

После выполнения алгоритма будет получено кодовое дерево кода, который имеет наименьшую возможную длину кодовых слов.

Буква

Кодовое

слово

_

000

о

001

и

1010

е

1000

н

1001

р

1100

а

1101

т

0110

с

0100

в

0101

п

10110

м

11100

л

01110

ь(ъ)

101110

г

101111

у

111100

к

111110

д

111101

ц

111010

ч

011110

я

0111110

х

1110110

э

1111110

ы

11111110

з

11111111

й

11101110

ж

11101111

ю

01111110

ш

01111111