Кодирование текста
111100000101101000011111110100011011101010110110111001000010110101101001010110010011111011000101001001101111001000101110011010010011101100010110011100111111100100101010001111111000010100001101000101110011110001010001111011011001010111110100011110010000111000110110111011110110100111100100010100001001101011010100010011100100011011000111000110011001111011100110111000011010001110100100001011010001100011001011000110111000110110011001001010101001010111100110011001001011001001010001111001110001010111011000111111011000111101101100101011111010010001000000100000101100111001101111111100111111111100001010110011000110011100100100000011010000001001110110010111101001001000110010110001100111001001000001000101010010001101111000100100100111110100100011101110011010100001100110001010100011011010110011110001010110000101011001000101000100100101111101001100011100000111010010011101101011001111011101001011101000001011001110011110100101 10011100111000101110100000101000011010011111011010110101100101000100111001000100010010011101001110011101010001001011001000101101111001001011001
Символов всего - 1067
Из них “1”-536,
“0”-531.
2 Построение кода Хаффмена
Выписываем в ряд все символы алфавита в порядке убывания вероятности их появления в тексте.
Последовательно объединяем два символа с наименьшими вероятностями появления в новый составной символ, вероятность которого полагаем равной сумме вероятностей составляющих его символов. В конце концов, построим дерево, каждый узел которого имеет суммарную вероятность всех узлов, находящихся ниже него. Прослеживаем путь к каждому узлу, получаем последовательность, которая представляет собой кодовое слово, соответствующее каждому символу.
После выполнения алгоритма будет получено кодовое дерево кода, который имеет наименьшую возможную длину кодовых слов.
Буква |
Кодовое слово |
_ |
000 |
о |
001 |
и |
1010 |
е |
1000 |
н |
1001 |
р |
1100 |
а |
1101 |
т |
0110 |
с |
0100 |
в |
0101 |
п |
10110 |
м |
11100 |
л |
01110 |
ь(ъ) |
101110 |
г |
101111 |
у |
111100 |
к |
111110 |
д |
111101 |
ц |
111010 |
ч |
011110 |
я |
0111110 |
х |
1110110 |
э |
1111110 |
ы |
11111110 |
з |
11111111 |
й |
11101110 |
ж |
11101111 |
ю |
01111110 |
ш |
01111111 |