- •Понятие информации
- •Основные определения.
- •Структурная схема системы передачи информации
- •Информационная метрика.
- •Геометрическая мера
- •Комбинаторная мера
- •Статистическая мера информации
- •Количество информации объединения
- •Формула совместного количества информации объединения независимых ансамблей
- •Формула совместного количества информации объединения двух зависимых ансамблей
Статистическая мера информации
Связь между энтропией и количеством информации.
Ансамблем называется полная группа событий, с известным распределением вероятностей, составляющих в сумме единицу.
Р1+Р2+...+Рi+…+Рk=1
Энтропия H характеризует неопределенность априорного состояния ансамбля событий, а
количество информации I - мера снятие неопределенности при получении сообщения о событии.
Количественно мера информация совпадает с мерой измерения энтропии.
Например, ансамбль знаний студента до лекции был:
У1, У2,…Ут,…Ук, где Ук – конкретная область научных дисциплин со своими вероятностями познания:
Р(У1), Р(У2),… Р(Ут)… Р(Ук) (т – индекс для дисциплины «Теория информации»).
Ситуация априорно характеризовалась энтропией Н1. После получения информации на лекции энтропия уменьшилась до Н2, так как вероятность познания Р(Ут) возросла, а значит и уменьшилась неопределенность по отношению к дисциплине «Теория информации», а также в какой-то мере упорядочился ансамбль знаний.
Тогда количество информации, полученное студентом
I = H1 - H2
Рассмотрим ансамбль случайных дискретных событий Х:
Х(х1, х2,.. хi,..хN) , где хi – конкретные случайные события с вероятностями:
р(x1), р(x2),.. р(xi),…р(x N)
Очевидно, что чем меньше априорная вероятность i-го события (снег в Африке), тем большую информацию несет сообщение этого события, и наоборот, чем вероятнее событие (лекция закончится до обеда), тем меньше информации в сообщении о событии. В предельном случае, когда вероятность события = 1 (детерминированное событие – «за зимой следует весна»), то количество информации о событии должно быть равно нулю. Поэтому количество информации можно выразить через величину 1/ р(xi). Однако формула I = 1/ p(xi) для граничных значений не подходит, так как I = ∞ при p(xi) = 0 и I = 1 при p(xi) = 1).
Мера измерения количества информации для дискретных случайных сообщений впервые была предложена Шенноном в 1948г, а затем более строго была определена советским ученым Хинчиным А.Я. :
I = loga 1/ p
Количество информации, содержащееся в конкретном сообщении о событии xi:
I(xi) = loga 1/p(xi) = - loga р(хi )
Для того, чтобы мера количества информации не зависела от конкретного события, а характеризовала совокупность сообщений ансамбля Х вводится усредненная статистическая оценка, как математическое ожидание элементов I(xi) по всем xi (1≤ i ≤ N) -
среднее количество информации, содержащееся в сообщениях ансамбля Х:
I(Х) = - I(xi) = -p(xi)loga р(хi )
Основания логарифма «а» определяет единицу измерения количества информации. Двоичная единица, соответствующая основанию, равному двум, называется битом. Основанию е = 2,718, соответствует натуральная единица – нит (в математике), 1 нит = 1,44269 бит. Основанию, равному 10, соответствует десятичная единица – дит (в астрономии) или хартли, 1 дит = 3.32193 бит.
В вычислительной технике используется двоичная система счисления, поэтому основание логарифма для вычисления количество информации будет равно двум.
Свойства количества информации дискретных сообщений:
1. Количество информации - вещественная, неотрицательная и ограниченная величина
0
=<
I(Х)<=M
2. Количество информации детерминированных сообщений равно нулю, еслиодно событие равно единице, а все остальные – нулю.
I(xi) = 0 для p(xi) = 1
3. Количество информации максимально, если сообщения равновероятны.
Imax (X) = - - log2 р(х ) = log2 1/pi = log2N
I=1
Доказательство 1.
I (Х) = -p(xi) log2 р(хi)– вещественная, так как p(xi) – вещественная.
I (Х) = -p(xi) log2 р(хi) – неотрицательная, так как 0 ≤ p(xi) ≤1 и log2 р(хi ) ≤ 0 .
I(Х) = -p(xi) log2 р(хi) – ограниченная, т.к. имеет максимальное ограниченное значение:
Приведем доказательство для ансамбля из двух сообщений:
Х {х1 = «0»; х2 = «1»}.
р(х1) = р0; р(х2)= р1.
р(х1) + р(х2) = 1 → р0 = р(х2) = 1
I (Х)= - p(xi) log2 р(хi) = - p0 log2 р 0 – p1 log2 р1 = - [p0 log2 р0 +
+ (1 - p0) log2 (1 - р0)];
Для нахождения максимума, продифференцируем функцию и приравняем ее нулю:
d{I (Х)}/d p0 = -[log2 р0+ р0*log2e / р0 - log2 (1 - р0) - (1 - p0)log2e / (1 - р0)]= -[log2 р0+ log2e - log2 (1 - р0) - log2e] = -[ log2 р0 - log2 (1 - р0)] = 0;
Отсюда:
log2 р0 = log2 (1 - р0);
р0 = 1- р0;
р0 =½ и р1 = р0 = ½ р0= р1
Приведем доказательство для ансамбля из N сообщений:
I (Х)= - p(xi) log2 р(хi)
Составим функционал
F (Х)= - p(xi) log2 р(хi) + λ * p(xi)
Возьмем частные производные от функционала F по xк и приравняем нулю для нахождения экстремума
d{F (Х)}/d p(хк)= - log2 p(хк)+ p(хк)*log2e / p(хк) + λ = 0
Отсюда
log2 p(хк) = -log2e + λ
p(хк) = λ׳ / е = const
так как p(xi)= 1, то I (X) будет максимальным при равных значениях p(xi).
Доказательство 2.
I(Х) = - p(xi) log2 р(хi) = 0 для р(хк) = 1, а при этом остальных хi: р(хi) = 0.
При подстановке р(хк) = 1 в формулу для хк -го сообщения
I(хк ) = - p(хк ) log2 р(хк) = - 1 log2 1 = 0.
Для остальных хi рассмотрим предел p(xi) log2 р(хi) при хi → 0.
Lim p(xi) log2 р(хi) = | y = log2 р(хi), z = 1/p(xi) | = Lim y/z = Lim y'/z' =
= - Lim {1/ р(хi)} /{1/ р(хi)2} = - Lim р(хi) = 0.
Доказательство 3.
Максимально возможное количество информации, содержащееся в N сообщениях, получается для случая равномерного распределения, то есть при p(xi )= 1/N
Imax (X) = - (1/N) *log2(1/N) = -log2(1/N) * (1/N) = log2 N
И совпадает с аддитивной мерой по формуле Хартли, где Q = N. Совпадение оценок количества информации по Шеннону и Хартли свидетельствует о том, что при максимально эффективном статистическом состоянии ансамбля событий, а именно при равновероятности всех событий ансамбля, статистическая информационная емкость полностью использует возможности структурно построения информационной системы для ансамбля событий. В случае неравных вероятностей количество информации по Шеннону меньше информационной емкости ансамбля.
Пример.
Блок 1
Устройство
кодирования
Двоичный канал связи
Блок 2
Известны априорные возможности отказа
Блоков: P1=1/4 ; P2=1/8;
Устройство кодирования передает сообщения о работоспособности системы .
Определить: а)среднее количество I(х), б) количество информации приходящийся на один двоичный разряд
Решение
Для описания всех состояний требуется 4=2 сообщений имеющих следующие априорные вероятности:
Х1– Р(Х1)– (все блоки работоспособны) Р(Х1) = (1 - P1)*(1 - P2) = 3/4*7/8 = 21/32;
Х2 – Р(Х2) – (1_ый работает, второй нет) Р(Х2) = (1 - P1)*P2 = 3/4*1/8 = 3/32;
Х3 – Р(Х3) – (1_ый отказал, второй работает) Р(Х3) = P1*(1 - P2) = 1/4*7/8 = 7/32;
Х4 – Р(Х4) – (все блоки отказали) Р(Х3) = P1* P2 = 1/4*1/8 = 1/32;
I(х) = -
Pi
log2Pi
=
-(21/32* log221/32
+ 3/32*log221/32
+ 7/32*log27/32
+ 1/32*log21/32
1,38бит/сообщ
;
Определим кол-во информации содержащейся в 1 дв.разряде.
а) Для кодирования 4 сообщений –2 дв.разряда : N= ] log2n[
- Для заданного случая: 0,69,бит/дв.разр 0 Iдв.разр 1бит
- Для равновероятного случая: 1бит/дв.разр
- Для детерминир. ситуации (P1 =1): 0бит/дв.разр
