Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции в текстовом формате / 1_Определение информации.doc
Скачиваний:
8
Добавлен:
28.12.2023
Размер:
178.69 Кб
Скачать

Статистическая мера информации

Связь между энтропией и количеством информации.

Ансамблем называется полная группа событий, с известным распределением вероятностей, составляющих в сумме единицу.

Р1+Р2+...+Рi+…+Рk=1

Энтропия H характеризует неопределенность априорного состояния ансамбля событий, а

количество информации I - мера снятие неопределенности при получении сообщения о событии.

Количественно мера информация совпадает с мерой измерения энтропии.

Например, ансамбль знаний студента до лекции был:

У1, У2,…Ут,…Ук, где Ук – конкретная область научных дисциплин со своими вероятностями познания:

Р(У1), Р(У2),… Р(Ут)… Р(Ук) (т – индекс для дисциплины «Теория информации»).

Ситуация априорно характеризовалась энтропией Н1. После получения информации на лекции энтропия уменьшилась до Н2, так как вероятность познания Р(Ут) возросла, а значит и уменьшилась неопределенность по отношению к дисциплине «Теория информации», а также в какой-то мере упорядочился ансамбль знаний.

Тогда количество информации, полученное студентом

I = H1 - H2

Рассмотрим ансамбль случайных дискретных событий Х:

Х(х1, х2,.. хi,..хN) , где хi – конкретные случайные события с вероятностями:

р(x1), р(x2),.. р(xi),…р(x N)

Очевидно, что чем меньше априорная вероятность i-го события (снег в Африке), тем большую информацию несет сообщение этого события, и наоборот, чем вероятнее событие (лекция закончится до обеда), тем меньше информации в сообщении о событии. В предельном случае, когда вероятность события = 1 (детерминированное событие – «за зимой следует весна»), то количество информации о событии должно быть равно нулю. Поэтому количество информации можно выразить через величину 1/ р(xi). Однако формула I = 1/ p(xi) для граничных значений не подходит, так как I = ∞ при p(xi) = 0 и I = 1 при p(xi) = 1).

Мера измерения количества информации для дискретных случайных сообщений впервые была предложена Шенноном в 1948г, а затем более строго была определена советским ученым Хинчиным А.Я. :

I = loga 1/ p

Количество информации, содержащееся в конкретном сообщении о событии xi:

I(xi) = loga 1/p(xi) = - loga р(хi )

Для того, чтобы мера количества информации не зависела от конкретного события, а характеризовала совокупность сообщений ансамбля Х вводится усредненная статистическая оценка, как математическое ожидание элементов I(xi) по всем xi (1≤ i ≤ N) -

среднее количество информации, содержащееся в сообщениях ансамбля Х:

I(Х) = - I(xi) = -p(xi)loga р(хi )

Основания логарифма «а» определяет единицу измерения количества информации. Двоичная единица, соответствующая основанию, равному двум, называется битом. Основанию е = 2,718, соответствует натуральная единица – нит (в математике), 1 нит = 1,44269 бит. Основанию, равному 10, соответствует десятичная единица – дит (в астрономии) или хартли, 1 дит = 3.32193 бит.

В вычислительной технике используется двоичная система счисления, поэтому основание логарифма для вычисления количество информации будет равно двум.

Свойства количества информации дискретных сообщений:

1. Количество информации - вещественная, неотрицательная и ограниченная величина

0 =< I(Х)<=M

2. Количество информации детерминированных сообщений равно нулю, еслиодно событие равно единице, а все остальные – нулю.

I(xi) = 0 для p(xi) = 1

3. Количество информации максимально, если сообщения равновероятны.

Imax (X) = - - log2 р(х ) = log2 1/pi = log2N

I=1

Доказательство 1.

  1. I (Х) = -p(xi) log2 р(хi)– вещественная, так как p(xi) – вещественная.

  2. I (Х) = -p(xi) log2 р(хi) – неотрицательная, так как 0 ≤ p(xi) ≤1 и log2 р(хi ) ≤ 0 .

  3. I(Х) = -p(xi) log2 р(хi) – ограниченная, т.к. имеет максимальное ограниченное значение:

Приведем доказательство для ансамбля из двух сообщений:

Х {х1 = «0»; х2 = «1»}.

р(х1) = р0; р(х2)= р1.

р(х1) + р(х2) = 1 → р0 = р(х2) = 1

I (Х)= - p(xi) log2 р(хi) = - p0 log2 р 0 – p1 log2 р1 = - [p0 log2 р0 +

+ (1 - p0)  log2 (1 - р0)];

Для нахождения максимума, продифференцируем функцию и приравняем ее нулю:

d{I (Х)}/d p0 = -[log2 р0+ р0*log2e / р0 - log2 (1 - р0) - (1 - p0)log2e / (1 - р0)]= -[log2 р0+ log2e - log2 (1 - р0) - log2e] = -[ log2 р0 - log2 (1 - р0)] = 0;

Отсюда:

log2 р0 = log2 (1 - р0);

р0 = 1- р0;

р0 =½ и р1 = р0 = ½ р0= р1

Приведем доказательство для ансамбля из N сообщений:

I (Х)= - p(xi) log2 р(хi)

Составим функционал

F (Х)= - p(xi) log2 р(хi) + λ * p(xi)

Возьмем частные производные от функционала F по xк и приравняем нулю для нахождения экстремума

d{F (Х)}/d p(хк)= - log2 p(хк)+ p(хк)*log2e / p(хк) + λ = 0

Отсюда

log2 p(хк) = -log2e + λ

p(хк) = λ׳ / е = const

так как  p(xi)= 1, то I (X) будет максимальным при равных значениях p(xi).

Доказательство 2.

I(Х) = - p(xi) log2 р(хi) = 0 для р(хк) = 1, а при этом остальных хi: р(хi) = 0.

При подстановке р(хк) = 1 в формулу для хк -го сообщения

I(хк ) = - p(хк ) log2 р(хк) = - 1 log2 1 = 0.

Для остальных хi рассмотрим предел p(xi) log2 р(хi) при хi → 0.

Lim p(xi) log2 р(хi) = | y = log2 р(хi), z = 1/p(xi) | = Lim y/z = Lim y'/z' =

= - Lim {1/ р(хi)} /{1/ р(хi)2} = - Lim р(хi) = 0.

Доказательство 3.

Максимально возможное количество информации, содержащееся в N сообщениях, получается для случая равномерного распределения, то есть при p(xi )= 1/N

Imax (X) = - (1/N) *log2(1/N) = -log2(1/N) * (1/N) = log2 N

И совпадает с аддитивной мерой по формуле Хартли, где Q = N. Совпадение оценок количества информации по Шеннону и Хартли свидетельствует о том, что при максимально эффективном статистическом состоянии ансамбля событий, а именно при равновероятности всех событий ансамбля, статистическая информационная емкость полностью использует возможности структурно построения информационной системы для ансамбля событий. В случае неравных вероятностей количество информации по Шеннону меньше информационной емкости ансамбля.

Пример.

Блок 1

Устройство

кодирования

Двоичный канал связи

Блок 2

Известны априорные возможности отказа

Блоков: P1=1/4 ; P2=1/8;

Устройство кодирования передает сообщения о работоспособности системы .

Определить: а)среднее количество I(х), б) количество информации приходящийся на один двоичный разряд

Решение

Для описания всех состояний требуется 4=2 сообщений имеющих следующие априорные вероятности:

Х1– Р(Х1)– (все блоки работоспособны) Р(Х1) = (1 - P1)*(1 - P2) = 3/4*7/8 = 21/32;

Х2 – Р(Х2) – (1_ый работает, второй нет) Р(Х2) = (1 - P1)*P2 = 3/4*1/8 = 3/32;

Х3 – Р(Х3) – (1_ый отказал, второй работает) Р(Х3) = P1*(1 - P2) = 1/4*7/8 = 7/32;

Х4 – Р(Х4) – (все блоки отказали) Р(Х3) = P1* P2 = 1/4*1/8 = 1/32;

  1. I(х) = - Pi log2Pi = -(21/32* log221/32 + 3/32*log221/32 + 7/32*log27/32 + 1/32*log21/32  1,38бит/сообщ ;

Определим кол-во информации содержащейся в 1 дв.разряде.

а) Для кодирования 4 сообщений –2 дв.разряда : N= ] log2n[

- Для заданного случая: 0,69,бит/дв.разр 0 Iдв.разр 1бит

- Для равновероятного случая: 1бит/дв.разр

- Для детерминир. ситуации (P1 =1): 0бит/дв.разр