- •Д. В. Ломакин прикладная теория информации
- •Предисловие
- •Модели, используемые в статистической теории информации
- •Установление количественной меры информации комбинаторное определение количества информации
- •Определение количества информации по к. Шеннону
- •Прологарифмировав последнее равенство, получим
- •Свойства энтропии Энтропия
- •При равномерном распределении энтропия
- •Ценность информации
- •Собственная информация и энтропия
- •Взаимная информация
- •Условную энтропию можно представить в виде
- •3. Дискретные источники сообщений и их описание эргодические источники
- •Производительность дискретного источника сообщений
- •Марковские источники сообщений
- •4. Кодирование сообщений при передаче по каналу без помех возможность оптимального (эффективного) кодирования
- •Префиксные коды
- •Неравенство крафта
- •Предельные возможности оптимального кодирования
- •Пропускная способность дискретного канала связи
- •Вычисление пропускной способности симметричных каналов
- •Сумма не зависит от номера столбцаj и в общем
Неравенство крафта
Теорема 1. Если целые числа l1, ... , li , ..., lN удовлетворяют неравенству ,(7)
то существует код, обладающий свойством префикса с алфавитом объема ту, длины кодовых слов в котором равны этим числам. Обратно, длины кодовых слов любого кода, обладающего свойством префикса, удовлетворяют указанному неравенству .
Теорема не утверждает, что любой код с длинами кодовых слов, удовлетворяющими (7), является префиксным. Так, например, множество двоичных кодовых слов 0,00,11 удовлетворяет (7), но не обладает свойством префикса. Теорема утверждает только существование префиксного кода, но не указывает его конкретный вид. Кодовые слова 0,10,11 удовлетворяют неравенству (7) и обладают свойством префикса.
Доказательство. Пусть числа l1, ... , li , ..., lN удовлетворяют неравенству (7).
Покажем, как можно построить префиксный код с этими длинами кодовых слов, и тем самым докажем существование префиксного кода. Не нарушая общности доказательства, все числа можно перенумеровать в порядке возрастания их значений. Тогда будем иметь . Построение будем вести на полном дереве порядка .
Построение сводится к последовательному выбору узлов порядков l1, l2 , ..., lN, но так, чтобы очередной выбираемый узел не был порожден каким-либо ранее выбранным узлом. Первый узел (кодовое слово) выбирается произвольно из
числа узлов порядка l1. Этот узел порождает -ю часть
узлов более высокого порядка, которые уже не могут быть использованы. После выбора следующего узла порядка l2
уже часть узлов не может быть использована и т.д. После выбора (N -1)-го узла может быть использована часть узлов порядка lN.
Поскольку для чисел l1 , ..., lN справедливо неравенство Крафта, которое можно записать в виде ,то величина строго меньше единицы. Следовательно, существует часть узлов порядка lN , из которых можно выбрать последний N-é узел.
Отметим еще одно свойство кодовых слов. Если код однозначно декодируется, то его кодовые слова удовлетворяют неравенству Крафта. Доказательство можно найти, например, в работе [4].
Таким образом, префиксные коды составляют часть однозначно декодируемых кодов, а последние составляют часть кодов, удовлетворяющих неравенству Крафта.
Предельные возможности оптимального кодирования
Определим границы для li и l, пользуясь эвристическими соображениями, основанными на количестве информации. Очевидно, код будет самым экономным, если каждый символ кодового слова будет переносить максимально возможное количество информации.
Поскольку собственное количество информации, содержащееся в сообщении , равно -logpi, информационной емкости соответствующего кодового слова будет достаточно, чтобы перенести указанное количество информации, только в том случае, если его минимальная длина li будет находиться в пределах ,
где log my— максимальное количество информации, которое может перенести отдельный символ кодового слова.
Усредняя неравенство по всему множеству Х сообщений, получим неравенство, определяющее границы для минимальной средней длины кодового слова :
.
В данном случае довольно большой интервал изменения возможных значений . Однако при кодировании блоков (слов из п букв xi ) средняя длина приближается к значению
при неограниченном увеличении длины блока n, что следует из неравенства
,
где — среднее количество символов кодового слова, приходящееся на один блок, а — на одну букву в блоке.
Полученные неравенства справедливы для всех однозначно декодируемых кодов.