Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Дмитриев В.И. Прикладная теория информации.doc
Скачиваний:
638
Добавлен:
02.05.2014
Размер:
3.1 Mб
Скачать

Контрольные вопросы

1. В чем сущность процессов дискретизации и квантования?

2. Охарактеризуйте преимущества дискретной и цифровой передач информации.

3. Сформулируйте общую постановку задачи дискретизации.

4. Каковы основные методы получения координат сигнала?

5. Сравните интерполяционные и экстраполяционные способы восстановления сигнала.

6. Что понимают под среднеквадратическим критерием восстановления сигнала?

7. Сформулируйте теорему Котельникова.

8. Поясните физически возможность замены непрерывной функции с ограниченным спектром совокупностью отсчетов.

9. Каковы теоретические неудобства использования функции с ограниченным спектром в качестве модели сигнала?

10. В чем трудности технической реализации способа передачи непрерывных сигналов, основанного на теореме Котельникова?

11. Какова процедура равномерной дискретизации по критерию наибольшего отклонения?

12. Укажите преимущества и недостатки адаптивной дискретизации.

13. Запишите выражение для среднеквадратической ошибки равномерного квантования.

14. Что такое шум квантования?

15. Как рассчитать шаг квантования сигнала при наличии помехи?

16. Какие совокупности координат сигнала используются при его геометрическом представлении?

17. Запишите соотношения для определения расстояния между концами векторов, отображающих сигналы в евклидовом и гильбертовом пространствах.

18. Какова практическая значимость геометрического представления сигналов?

Глава 3. Количественная оценка информации

§ 3.1. Энтропия как мера неопределенности выбора

Ранее отмечалось, что факт получения информации всегда связан с уменьшением разнообразия или неопределенности. В данной главе ставятся задачи установления количественных мер неопределенности и информации и выяснения их основных свойств.

Начнем рассмотрение с источника информации, который может в каждый момент времени случайным образом принять одно из конечного множества возможных состояний. Такой источник называют дискретным источником информации. При этом принято говорить, что различные состояния реализуются вследствие выбора их источником. Каждому состоянию источника и ставится в соответствие условное обозначение в виде знака (в частности, буквы) из алфавита данного источника: u1, u2, ..., uN.

Для получения результата выбора источником и конкретного состояния можно высказать ряд предположений, базирующихся на априорных сведениях об источнике информации. Поскольку одни состояния выбираются источником чаще, а другие реже, то в общем случае он характеризуется ансамблем U, т. е. полной совокупностью состояний с вероятностями их появления, составляющими в сумме единицу:

причем

Обе формы записи используются в дальнейшем на равных основаниях.

Опираясь на эти сведения, введем сначала меру неопределенности выбора состояния источника. Ее можно рассматривать и как меру количества информации, получаемой при полном устранении неопределенности относительно состояния источника. Мера должна удовлетворять ряду естественных условий. Одним из них является необходимость монотонного возрастания с увеличением возможностей выбора, т. е. числа возможных состояний источника N, причем недопустимые состояния (состояния с вероятностями, равными нулю) не должны учитываться, так как они не меняют неопределенности.

Ограничиваясь только этим условием, за меру неопределенности можно было бы взять число состояний, предположив, что они равновероятны. Однако такая мера противоречит некоторым интуитивным представлениям. Например, при N=1, когда неопределенность отсутствует, она давала бы значение, равное единице. Кроме того, такая мера не отвечает требованию аддитивности, состоящему в следующем.

Если два независимых источника с числом равновероятных состояний N и Μ рассматривать как один источник, одновременно реализующий пары состояний nimj, то естественно предположить, что неопределенность объединенного источника должна равняться сумме неопределенностей исходных источников. Поскольку общее число состояний объединенного источника равно ΝΜ, то искомая функция должна удовлетворять условию

Соотношение (3.2) выполняется, если в качестве меры неопределенности источника с равновероятными состояниями и характеризующего его ансамбля U принять логарифм числа состояний:

Тогда при Ν= 1 H(U) = 0 и требование аддитивности выполняется.

Указанная мера была предложена американским ученым Р. Хартли [31] в 1928г. Основание логарифма не имеет принципиального значения и определяет только масштаб или единицу неопределенности. Так как современная информационная техника базируется на элементах, имеющих два устойчивых состояния, то обычно выбирают основание логарифма равным двум. При этом единица неопределенности называется двоичной единицей или битом и представляет собой неопределенность выбора из двух равновероятных событий (bit — сокращение от англ. binary digit — двоичная единица). Если основание логарифма выбрать равным десяти, то неопределенность получим в десятичных единицах на одно состояние (битах).

Пример 3.1. Определить минимальное число взвешиваний, которое необходимо произвести на равноплечих весах, чтобы среди 27 внешне неотличимых монет найти одну фальшивую, более легкую.

Общая неопределенность ансамбля U в соответствии с (3.3) составляет

Одно взвешивание способно прояснить неопределенность ансамбля U', насчитывающего три возможных исхода (левая чаша весов легче, правая чаша весов легче, весы находятся в равновесии) Эта неопределенность

Так как

для определения фальшивой монеты достаточно произвести три взвешивания.

Алгоритм определения фальшивой монеты следующий. При первом взвешивании на каждую чашку весов кладется по девять монет Фальшивая монета будет либо среди тех девяти монет, которые оказались легче, либо среди тех, которые не взвешивались, если имело место равновесие Аналогично, после второго взвешивания число монет, среди которых находится фальшивая, сократится до трех Последнее, третье, взвешивание дает возможность точно указать фальшивую монету

Предложенная мера, как мы убедились, позволяет решать определенные практические задачи. Однако она не получила широкого применения, поскольку была рассчитана на слишком грубую модель источника информации, приписывающую всем его возможным состояниям одинаковую вероятность.

Таким образом, степень неопределенности реализации состояния источника информации зависит не только от числа состояний, но и от вероятностей этих состояний. При неравновероятных состояниях свобода выбора источника ограничивается, что должно приводить к уменьшению неопределенности. Если источник информации имеет, например, два возможных состояния с вероятностями 0,99 и 0,01, то неопределенность выбора у него значительно меньше, чем у источника, имеющего два равновероятных состояния. Действительно, в первом случае результат практически предрешен (реализация состояния, вероятность которого равна 0,99), а во втором случае неопределенность максимальна, поскольку никакого обоснованного предположения о результате выбора сделать нельзя. Ясно также, что весьма малое изменение вероятностей состояний вызывает соответственно незначительное изменение неопределенности выбора.

Это позволяет сформулировать следующее требование к искомой мере неопределенности Н(р1 ... рi ... рN): она должна быть непрерывной функцией вероятностей состояний источника р1 ... pi ... рN с соблюдением условия I = 1. Наибольшее ее значение должно достигаться ι= 1 при равенстве вероятностей всех состояний.

Кроме того, так как мера неопределенности связывается нами только с фактом выбора, а не с множеством конкретных значений наблюдаемых явлений, то Н(р1 … ρN) должна быть функцией от функции распределения случайной величины и не должна зависеть от ее конкретных значений. Иначе говоря, Η(ρ1...ρN) должна являться функционалом распределения вероятностей.

Еще одно условие состоит в том, что мера неопределенности не должна зависеть от пути выбора состояния в ансамбле. Выбор может быть как непосредственным, так и многоступенчатым. В последнем случае неопределенность выбора состояния складывается из неопределенности выбора группы состояний и неопределенностей выбора состояния в каждой группе, рассчитанных с учетом вероятности выбора данной группы:

где q1, q2 и q3, q4 — вероятности состояний, образующих соответственно группы Ν—1 и Ν, причем ρN-1 = q1 + q2 и pN-1 = q3 + q4.

Мера неопределенности выбора дискретным источником состояния из ансамбля U, удовлетворяющая указанным условиям, была предложена американским ученым К. Шенноном [36]. Ее называют энтропией дискретного источника информации или энтропией конечного ансамбля:

где С — произвольное положительное число.

К. Шенноном высказано утверждение, а советским ученым Л. Я- Хинчиным математически строго доказано, что это единственный функционал, удовлетворяющий сформулированным условиям.

Если снова ориентироваться на измерение неопределенности в двоичных единицах, то основание логарифма следует принять равным двум. Примем также С= 1. Из (3.5)

Предложенная мера была названа энтропией не случайно. Дело в том, что формальная структура выражения (3.5) совпадает с энтропией физической системы, определенной ранее Больцманом. Согласно второму закону термодинамики энтропия Hзамкнутого пространства определяется выражением

где Mn — число молекул в данном пространстве; mi — число молекул, обладающих скоростью I + .

Так как miп есть вероятность того, что молекула имеет скорость i + Δ, то (3.7) можем записать в виде

Совпадение имеет глубокий физический смысл, так как в обоих случаях величина Hхарактеризует степень разнообразия состояний системы.

Рассмотрим взаимосвязь меры К. Шеннона с мерой Хартли. Если в источнике может быть реализовано N равновероятных состояний, то вероятность каждого из них равна рi = (1/N)(1iN)и неопределенность, по Хартли, приходящаяся на каждое состояние, выражается числом

Будем теперь считать вероятности событий различными, а неопределенность, приходящуюся на одно конкретное состояние источника, характеризовать по аналогии величиной

Эта частная неопределенность представляет собой случайную величину, зависящую от того, какое состояние источника в действительности реализуется. Усреднив по всему ансамблю U состояний источника, найдем неопределенность, приходящуюся в среднем на одно состояние:

Следовательно, мера К. Шеннона является естественным обобщением меры Хартли на случай ансамбля с неравновероятными состояниями. Она позволяет учесть статистические свойства источника информации.

Пример 3.2. Сравнить неопределенность, приходящуюся на букву источника информации u (алфавита русского языка), характеризуемого ансамблем, представленным в табл. 3.1, с неопределенностью, которая была бы у того же источника при равновероятном использовании букв.

Таблица 3.1

При одинаковых вероятностях появления всех 32 букв алфавита неопределенность, приходящаяся на одну букву, составляет

Энтропию источника, характеризуемого заданным ансамблем (табл. 3.1), находим, используя формулу (3.6):

Таким образом, неравномерность распределения вероятностей использования букв снижает энтропию источника с 5 до 4.42 дв. ед.