Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТИПиС конспект лекций.doc
Скачиваний:
5
Добавлен:
01.03.2025
Размер:
1.66 Mб
Скачать

3.7.3.Дифференциальная энтропия

Обобщение столь полезной меры неопределенности на непрерывные случайные величины наталкивается на ряд сложностей. Можно по-разному преодолеть эти сложности; выберем кратчайший путь. Прямая аналогия

не приводит к нужному результату; плотность является размерной величиной (размерность плотности р(х) обратна размерности х, так как элемент вероятности безразмерен), а логарифм размерной величины не имеет смысла. Однако положение можно исправить, умножив под знаком логарифма на величину , имеющую ту же размерность, что и х:

Теперь величину можно принять равной единице измерения х, что приводит к функционалу

(29)

который получил название дифференциальной энтропии. Это аналог энтропии дискретной величины, но аналог условный, относительный: ведь единица измерения произвольна. Запись (29) означает, что мы как бы сравниваем неопределенность случайной величины, имеющей плотность , с неопределенностью случайной величины, равномерно распределенной в единичном интервале. Поэтому величина h(X) в отличие от Н(Х) может быть не только положительной. Кроме того, h(X) изменяется при нелинейных преобразованиях шкалы х, что в дискретном случае не играет роли. Остальные свойства h(X) аналогичны свойствам Н(Х), что делает дифференциальную энтропию очень полезной мерой.

Пусть, например, задача состоит в том, чтобы, зная лишь некоторые ограничения на случайную величину (типа моментов, пределов сверху и снизу области возможных значений и т.п.), задать для дальнейшего (каких-то расчетов или моделирования) конкретное распределение. Одним из подходов к решению этой задачи дает принцип максимума энтропии: из всех распределений, отвечающих данным ограничениям, следует выбирать то, которое обладает максимальной дифференциальной энтропией. Смысл этого критерия состоит в том, что, выбирая экстремальное по энтропии распределение, мы гарантируем наибольшую неопределенность, связанную с ним, т.е. имеем дело с наихудшим случаем при данных условиях.

Важным шагом в построении теории информации является введение количественной меры неопределенности — энтропии. Оказывается, что функционал (28) обладает качествами, которые логично ожидать от меры неопределенности, и, наоборот, единственным функционалом с такими свойствами является именно функционал энтропии. Обобщение понятия энтропии на непрерывные случайные величины приводит к выводу, что такое обобщение — дифференциальная энтропия — возможно лишь как относительная мера.

Оказывается, что энтропия связана с глубокими свойствами случайных процессов. Например, для дискретных процессов имеет место свойство асимптотической равновероятности реализаций из высоковероятной группы.

3.7.4.Фундаментальное свойство энтропии случайного процесса.

Особое значение энтропия приобретает в связи с тем, что она связана с очень глубокими, фундаментальными свойствами случайных процессов. Покажем это на примере процесса с дискретным временем и дискретным конечным множеством возможных состояний.

Назовем каждое такое состояние символом, множество возможных состояний — алфавитом, их число m — объемом алфавита. Число всевозможных последовательностей длины n, очевидно, равно . Появление конкретной последовательности можно рассматривать как реализацию одного из возможных событий. Зная вероятности символов и условные вероятности появления следующего символа, если известен предыдущий (в случае их зависимости), можно вычислить вероятность Р(С) для каждой последовательности С. Тогда энтропия множества {C }, по определению, равна

(30)

Определим энтропию процесса Н (среднюю неопределенность, приходящуюся на один символ) следующим образом:

(31)

Существование такого предела для любого стационарного процесса можно строго доказать.

На множестве {С} можно задать любую числовую функцию , которая, очевидно, является случайной величиной. Определим с помощью соотношения Математическое ожидание этой функции

откуда следует, что и (32)

Это соотношение, весьма интересное уже само по себе, является, однако, лишь одним из проявлений гораздо более общего свойства дискретных эргодических процессов. Оказывается, что не только математическое ожидание величины Mfn(C) при имеет своим пределом H, но сама эта величина Mfn(C) стремится к H при . Другими словами, как бы малы ни были и , при достаточно большом n справедливо неравенство

(33)

т.е. близость Mfn(C) к H fn(C) при больших n является почти достоверным событием.

Для большей наглядности сформулированное фундаментальное свойство случайных процессов обычно излагают следующим образом. Для любых заданных и можно найти такое , что реализации любой длины распадаются на два класса:

группа реализаций, вероятности Р(С) которых удовлетворяют неравенству

(34)

группа реализаций, вероятности которых этому неравенству не удовлетворяют.

Так как согласно неравенству (33) суммарные вероятности этих групп равны соответственно 1- и , то первая группа называется высоковероятной, а вторая — маловероятной.

Это свойство эргодических процессов приводит к ряду важных следствий, из которых три заслуживают особого внимания.

1°. Независимо от того, каковы вероятности символов и каковы статистические связи между ними, все реализации высоковероятной группы приблизительно равновероятны (см. (34)).

В связи с этим фундаментальное свойство иногда называют "свойством асимптотической равнораспределенности". Это следствие, в частности, означает, что по известной вероятности Р(С) одной из реализаций высоковероятной группы можно оценить число реализаций в этой группе:

2°. Энтропия с высокой точностью равна логарифму числа реализаций в высоковероятной группе:

(35)

3°. При больших n высоковероятная группа обычно охватывает лишь ничтожную долю всех возможных реализаций (за исключением случая равновероятных и независимых символов, когда все реализации равновероятны и ).

Действительно, из соотношения (26) имеем , где — основание логарифма. Число всех возможных реализаций есть Доля реализаций высоковероятной группы в общем числе реализаций выражается формулой

(36)

и при эта доля неограниченно убывает с ростом n. Например, если =2, n= 100, H = 2,75, m = 8, то т.е. к высоковероятной группе относится лишь одна тридцатимиллионная доля всех реализаций!

Строгое доказательство фундаментального свойства эргодических процессов сложно и здесь не приводится. Однако следует отметить, что в простейшем случае независимости символов это свойство является следствием закона больших чисел. Действительно, закон больших чисел утверждает, что с вероятностью, близкой к 1, в длинной реализации i-й символ, имеющий вероятность встретится примерно раз. Следовательно, вероятность реализации высоковероятной группы есть , откуда , что и доказывает справедливость фундаментального свойства в этом случае.

Таким образом, связав понятие неопределенности дискретной величины с распределением вероятности по возможным состояниям и потребовав некоторых естественных свойств от количественной меры неопределенности, приходим к выводу, что такой мерой может служить только функционал, названный энтропией. С некоторыми трудностями энтропийный подход удалось обобщить на непрерывные случайные величины (введением дифференциальной энтропии) и на дискретные случайные процессы.