Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2. Часть 1.doc
Скачиваний:
103
Добавлен:
02.06.2015
Размер:
5.54 Mб
Скачать

1) Для любой al(al)

;

2).

ДОКАЗАТЕЛЬСТВО. Нетрудно видеть, что

,

где a – частота буквы «a» в последовательности AL. Отнесем к первой группе (AL) те и только те последовательности AL, в которых

для некоторой >0. Ко второй группе отнесем все остальные последовательности.

Покажем, что при достаточно большом L0 это разбиение удовлетворяет обоим условиям теоремы. Действительно, для

.

Отсюда нетрудно показать, что

.

Следовательно,

.

Полагая

,

получаем первое утверждение теоремы.

Рассмотрим вторую группу (AL). Нетрудно видеть, что вероятность

По неравенству Чебышева

откуда следует, что

Полагая L0=n/2, получаем второе утверждение теоремы.

СЛЕДСТВИЕ. Если LL0, то для любой AL(AL) выполняется неравенство

.

Таким образом, при достаточно больших L вероятность каждой последовательности из (AL) (за исключением последовательностей весьма маловероятного класса) заключена между 2-L(H+) и 2-L(H-).

Важно бывает знать мощности обоих групп последовательностей (см. первую теорему Шеннона). В частности, возникает вопрос о числе «наиболее вероятных» последовательностей, вероятности которых приблизительно равны .

Занумеруем все последовательности AL в порядке убывания их вероятностей:

.

Выберем , 0<<1. Пусть NL() – число последовательностей, определяемых из неравенства

.

В это число войдет некоторое число последовательностей АL второй группы, у которых Р(АL)>2L(Н(А)-), но в основном оно определяется последовательностями первой группы.

Вторая теорема Шеннона. Для любого фиксированного значения , 0<<1 справедливо соотношение

.

ИМЕННО В ЭТОМ СМЫСЛЕ ПИШУТ, что NL()=2LН(А). Как следует из формулы, этот предел не зависит от  и поэтому можно полагать  сколь угодно близким к 1, =1- и тогда nL– NL(1–) есть число последовательностей, вероятность появления которых в результате реализации нашего случайного процесса получения последовательностей пренебрежимо мала, то есть практически невозможных последовательностей.

Доказательства приведенных теорем обычно даются в курсе математической теории информации.

Таким образом, в первой и второй теоремах Шеннона устанавливается замечательное свойство «равнораспределенности» длинных сообщений, порождаемых независимыми испытаниями схемы А.

Это свойство устанавливает, грубо говоря, тот факт, что всего таких сообщений

NL2LH(A) и все они приблизительно равновероятны.

Можно ли установить похожее свойство для осмысленных сообщений, которые, очевидно, не порождаются независимыми испытаниями?

Для этого необходимо, во-первых, ввести математическую модель осмысленных сообщений, а во-вторых, определить, в соответствии с (1), энтропию на одну букву осмысленного сообщения. В качестве математической модели осмысленных сообщений обычно рассматривают последовательности, получаемые с помощью так называемых марковских процессов. Среди таких процессов имеется важная группа процессов называемая стационарными эргодическими процессами. В таких процессах каждая создаваемая процессом последовательность имеет одни и те же статистические свойства. Поэтому относительные частоты различных комбинаций исходов (букв, биграмм и т. п.), полученные из частных последовательностей будут стремиться с увеличением длин последовательностей к определенным пределам, не зависящим от этих частных последовательностей. Таким образом, для эргодического процесса возможно отождествление средних значений различных комбинаций исходов вдоль некоторой последовательности со средними значениями по ансамблю возможных последовательностей (причем вероятность расхождения равна нулю).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]