Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Иркутский государственный университет путей сообщения

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Введение в теорию информации.doc

Скачиваний:

Добавлен:

01.07.2025

Размер:

3.78 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 2518 19 20 21 22 23 24 25 > Следующая >>>

10.2.1. Код Шеннона–Фано

Для построения неравномерного экономичного кода Р. Фано и К. Шенноном предложена следующая методика (код Шеннона–Фано):

1. Все букв (или иных знаковых систем) располагается в столбик в порядке убывания вероятностей, их появления в сообщении.

2. Разбивают все буквы на две группы (верхнюю I и нижнюю II) так, чтобы вероятности для букв к каждой из этих групп были по возможности близки одна к другой.

3. Для букв первой группы в качестве первой цифры кодового обозначения используется цифра 1, а для букв второй группы – цифра 0.

4. Каждую из двух полученных групп снова делят на две части наиболее близкой суммарной вероятности;

5. Присваивают буквам вторую цифру кодового обозначения: 1 или 0 в зависимости от того, принадлежит буква к первой или ко второй из этих более мелких групп.

6. Каждую из содержащих более одной буквы групп снова делят на две части наиболее близкой суммарной вероятности и т.д.

7. Процесс повторяется до тех пор, пока каждая из групп не будет содержать одну единственную букву.

Алгоритм построения кода Шеннона–Фано приводится в Приложении 4.

Пример 10.2. Возьмем алфавит, состоящий из 6 букв, вероятности которых равны 0,4; 0,2; 0,2; 0,1; 0,05; 0,05. Необходимо составить код Шеннона–Фано.

Решение. Наилучший равномерный код состоит из трехзначных кодовых обозначений, так как в соответствии с (10.1): 2²<6<2³. Поэтому в нем на каждую букву приходится три элементарных сигнала.

Результаты решения по составлению кода Шеннона–Фано удобно представить в виде таблицы 10.1 и кодового дерева (Рисунок 10.1).

При использовании кода Шеннона–Фано среднее число элементарных сигналов, приходящихся на одну букву,

Это значительно меньше трех и очень близко к предельно минимальному значению

Таким образом, получен экономичный код.

Еще более экономичным получается код, если по методу Шеннона–Фано кодировать не отдельные буквы, а блоки букв, n–буквенные блоки.

Пример 10.3. Возьмем алфавит, состоящий из двух букв А и В, имеющих вероятности р(А)=0,7; р(В)=0,3. Энтропия:

Таблица 10.1. – Порядок составления кода Шеннона–Фано

Номер буквы	Вероятность	Разбиение на группы					Кодовое обозначение
1	0,4	I					1
2	0,2		I				01
3	0,2			I			001
4	0,1	II	II		I		0001
5	0,05			II	II	I	00001
6	0,05					II	00000

Рисунок 10.1. – Кодовое дерево

Двухбуквенный алфавит можно привести к простейшему равномерному коду: 1 – для А и 0 – для В, требующему для передачи каждой буквы один двоичный знак. Это на 0,12 (12 %) больше минимально достижимого значения Н. Требуется определить среднее значение длины кода в двух- и трехбуквенных сообщениях.

Решение. Представим коды двух- и трехбуквенных комбинаций, построенные по методу Шеннона–Фано (таблица 10.2).

Трехбуквенный код формируется 4 префиксными кодовыми деревьями, формируемыми из l=2, 3, 4 кодовых слов (последняя колонка таблицы 10.2).

Таблица 10.2. – Результаты вычислений

Комбинация букв

Вероятность

Кодовое обозначение

Комбинация букв

Вероятность

Кодовое обозначение

n=2

n=3

0,49

0,21

0,09

001

000

AAA

AAB

ABA

BAA

ABB

BAB

BBA

BBB

0,343

0,147

0,063

0,027

011

010

0010

0011

0001

0000

а). Двухбуквенный код: n=2

l=2

l=3

l=4

б). Трехбуквенный код: n=3

Рисунок 10.2. – Кодовые деревья двух- и трехбуквенного кодов

Среднее значение длины кода для n=2:

или на одну букву

что на 3,4 % отличается от минимально достижимого значения Н.

Среднее значение длины кода для n=3:

или на одну букву

что на 3,8 % отличается от минимально достижимого значения Н.

Представленные примеры отражают суть основной теоремы Шеннона о кодировании при отсутствии помех:

При кодировании сообщения, разбитого на n –буквенные блоки, можно, выбрав n достаточно большими, добиться того, чтобы среднее число двоичных элементарных сигналов, приходящихся на одну букву исходного сообщения, было сколь угодно близко к энтропия Н.

Иначе:

Очень длинное сообщение из m букв может быть закодировано при помощи сколь угодно близкого к m·Н числа элементарных сигналов, если только предварительно разбить это сообщение на достаточно длинные блоки из n букв и сопоставить отдельные кодовые обозначения (кодовые слова) сразу целым блокам.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 2518 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025508.93 Кб1Брошюра МП для ГК-12.doc
#
01.07.202554.5 Кб0БТЖ.docx
#
04.06.2015206.34 Кб88буксы с роликовыми подшипниками.doc
#
01.05.2025867.33 Кб0в путь еще.doc
#
04.06.20152.28 Mб22Вариант 1.doc
#
01.07.20253.78 Mб0Введение в теорию информации.doc
#
04.06.20151.58 Mб109Введение Программная инженерия (лекции).pdf
#
01.07.2025285.19 Кб0Ветрогенератор мощностью 7кВт.docx
#
02.08.201970.51 Кб7ВильмоваРоль ВТО в регулировании международной....docx
#
04.06.20152.18 Mб12Виноразливочная станция.doc
#
04.06.2015207.36 Кб16ВИСХАГИ отчет.doc