Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казахский национальный технический университет им. К. И. Сатпаева

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

кодирования.doc

Скачиваний:

Добавлен:

01.07.2025

Размер:

12.08 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 257 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

1.2. Информационные характеристики системы передачи сообщений

Такие понятия теории информации, как количество информации, передаваемое по каналу связи, энтропия, избыточность, пропускная способность канала являются интегральными оценками эффективнос- ти системы связи. Теория указывает потенциальные возможности сис- темы связи, которые надо стремиться реализовать на практике.

Мера количества информации

Мера количества информации должна отражать сущность работы систем передачи сообщений и служит основой для сравнения их между

собой. Для систем связи в большинстве случаев не имеет значения кон- кретное содержание сообщений, их ценность, важность, истинность или ложность. Системы передачи информации можно уподобить почте, для которой важен только сам факт отправления письма, а содержание пе- ресылаемых писем никак не учитывается. Поэтому понятие количества информации, применяемое для характеристики технических систем, значительно беднее, чем используемое нами в повседневной жизни.

Тем не менее, мера количества информации должна согласовы- ваться с интуитивными представлениями о существенных сторонах сообщений. При этом разумно руководствоваться следующими со- ображениями:

чем длиннее сообщение, тем большее количество информации оно должно содержать;

количество информации в сообщении тем больше, чем больше чис- ло возможных сообщений;

количество информации должно обладать свойством аддитивности,

т. е. количество информации, содержащееся, например, в двух незави- симых сообщениях, должно равняться сумме количества информации, переносимой каждым сообщением;

большее количество информации несут маловероятные сообщения

(сенсации).

Понятие количества информации прошло следующие этапы эволюции:

1. Сообщение состоит не из одного, а из многих символов (букв, знаков, элементов). Число возможных элементов определяется объемом m соответствующего алфавита (m_i, m_k, m_s– i – источник, к – кодер,

^s^–^{сигнал)}^,^а^числ^о^{элементо}^в^в^{сообщени}^и^–^n.^Пр^и^выбор^е^{первого}

элемента сообщения производится выбор из m возможных элементов. При выборе второго делается выбор из того же числа m элементов, но число возможных комбинаций выбора двух элементов составляет уже m²(при m = 2, например "0" и "1", возможных комбинаций 4: "00", "01", "10" и "11"). Если же сообщение содержит n элементов, то число раз- личных сочетаний этих элементов:

N = mⁿ. (2.1) Значение N определяет число возможных сообщений. Оно и может

^{служить}^мерой^к^о^лич^е^ства^инфо^р^мации.^Одна^к^о^мера^N^н^е^о^б^ладает

свойством аддитивности. Действительно, количество информации в сообщении из n символов не равно сумме количеств информации из n₁и n₂символов, так как

mⁿ# mⁿ¹+ mⁿ², если n

+ n₂

= n.

2. Для удовлетворения условию аддитивности можно выбрать в ка- честве меры количества информации не само число N, а некоторую его функцию J = f (N). Р. Хартли в 1928 г. предложил логарифмическую меру количества информации:

J = log (N) = nlog (m). (2.2) Эта мера обладает свойством аддитивности, а именно:

nlog (m) = n₁log (m) + n₂log (m), если n₁+ n₂= n.

Основание логарифма в (2.2) не имеет существенного значения. Широко пользуются логарифмом по основанию 2 (причем обозначение "2" опускается). В этом случае количество информации измеряется в двоичных единицах (дв. ед.) или битах. Однако мера (2.2) не удовлет- воряет четвертому интуитивному требованию, так как не учитывается зависимость количества информации, содержащейся в сообщении, от вероятности появления сообщения. В то же время эта вероятность ха- рактеризует неожиданность данного сообщения для получателя.

3. К. Шеннон учел требуемую зависимость и предложил определять количество информации, содержащееся в сообщении x_i(i = 1, 2, ... , m_i) и относящееся к выбору данной буквы x_iалфавита источника, в виде

J(x_i) = log [1/p(x_i)] = –log [p(x_i)] , (2.3)

^г^де^p⁽^x_i⁾^–^вер^о^ятн^о^ст^ь^п^оя^в^лени^я^{сообщени}^я^x_i^,^приче^м^су^м^м^а^в^с^е^х

^p^(x_i⁾⁼^1.

^К^а^к^следуе^т^и^з^(2.3)^,^к^о^лич^е^ст^в^о^{информации}^,^с^о^{держаще}^е^с^я^в^сооб-

щении, тем больше, чем меньше вероятность этого сообщения. Такая зависимость соответствует интуитивным представлениям об информа- ции. Действительно, сообщения, ожидаемые с большей вероятностью, легко угадываются получателем, а достоверные сообщения, вероятность которых равна 1, вообще не содержат информации, так как всегда мо- гут быть предсказаны точно (очевидно, если p (x_i) = 1, то J (x_i) = 0).

^{Наоборо}^т^,^{сообщения}^,^{являющи}^е^с^я^с^ен^с^ациями^,^имею^т^м^а^лу^ю^в^ер^о^ят-

ность появления и их трудно предсказать, поэтому они содержат боль- ше информации.

Количество информации, определяемое (2.3), является случайной величиной, принимающей значение J (x_i) с вероятностью p (x_i) в зави- симости от появления буквы x_iв сообщении источника. Однако при

передаче больших массивов сообщений важно не количество информа-

ции в одном конкретном символе J(x_i), а количество информации, ус- редненное по всем возможным сообщениям, содержащим n символов. Такой мерой количества информации является математическое ожида-

ние (среднее значение) случайной величины J(x_i), содержащей n симво- лов (букв), усредненное по всему ансамблю X:

_m_i_m_i

^J⁽^⁾^ⁿ_^p⁽^x_i⁾^J⁽^x_i⁾^^ⁿ_^p⁽^x_i⁾^l^o^g^p⁽^x_i⁾^.

(2.4)

i  1

Это соотношение носит название формулы Шеннона. Для равнове- роятных сообщений (p (x_i) = 1/m_i) меры информации по Хартли (2.2) и по Шеннону (2.4) совпадают

^J⁽^⁾^^ⁿ¹^/^m^l^o^g⁽¹^/^m⁾^ⁿ^l^o^g^m^.

i  1

Поэтому меру Шеннона (2.4) можно рассматривать как обобщение меры Хартли на ансамбль сообщений с распределением вероятностей, отличающимся от равномерного.

Энтропия источника дискретных сообщений

Для характеристики источника сообщений более удобной величи- ной является средняя величина (математическое ожидание) количества информации, содержащейся в одном символе (букве) сообщения. Эта величина называется энтропией источника сообщений. В случае отсут- ствия статистической связи между символами, энтропия источника:

^H⁽^⁾^^J⁽^⁾^/ⁿ^^ ^p⁽^x_i⁾^l^o^g^p⁽^x_i⁾^.

i  1

(2.5)

Понятие энтропии (от греческого "эн-тропе" – обращение) распрост- ранилось на ряд областей знания. Энтропия характеризует неопреде- ленность каждой ситуации. Энтропия в термодинамике определяет ве- роятность теплового состояния вещества (закон Больцмана), в матема- тике – степень неопределенности ситуации или задачи, в теории ин- формации она характеризует способность источника "отдавать" инфор- мацию. Приобретение информации сопровождается уменьшением нео- пределенности, поэтому количество информации можно измерять ко- личеством исчезнувшей неопределенности, т. е. энтропией. Энтропию называют также информационной содержательностью сообщения.

Анализируя выражение (2.5), можно отметить некоторые свойства энтропии дискретной случайной величины.

1. Энтропия источника является величиной вещественной и поло- жительной – H (x)  0. Энтропия равна 0 в случае, когда отсутствует возможность выбора, т. е. когда величина X может принимать только одно значение с вероятностью p (x) = 1. В передаче такого сообщения нет смысла, поскольку результат заранее известен получателю. Источни- ки с малой энтропией не являются информативными. Они выдают зна- ки, которые с большой вероятностью известны получателю. В этом смысле энтропия источника характеризует его информационную емкость.

2. Энтропия случайной величины, имеющей всего два значения x₁и x₂, не превышает 1. При объеме алфавита источника m_i= 2 и одинако- вой вероятности сообщений p (x₁) = p (x₂) = 0,5 энтропия достигает мак- симального значения H_ma_x(x) = 1 дв. ед. Следовательно, в качестве еди- ницы измерения информации (дв. ед., бит) взята информация, содержа-

щаяся в одном из двух равновероятных сообщений.

3. Максимальная энтропия источника H_ma_x(x) достигается лишь в слу- чае равных вероятностей выбора букв алфавита, т. е. когда p (x_i) = 1/m, (i = 1, 2, ..., m), тогда

^Hmax ⁽^x⁾^^¹^/^m^l^og⁽¹^/^m⁾^^l^o^g^m^.

i  1

(2.6)

Такой источник называют идеальным (оптимальным), так как каж- дый его символ несет максимальное количество информации. Для кон- кретизации этих свойств энтропии приведем два примера.

Пример

Определить энтропию источника сообщений, если он может выда- вать m = 5 знаков с вероятностями p (x₁) = 0,4; p (x₂) = 0,1; p (x₃) = 0,2; p (x₄) = 0,1; p (x₅) = 0,2. (Сумма всех p (x_i) = 1).

Решение:

^H⁽^x⁾^^ ^p⁽^xi ⁾^l^o^g2 ^p⁽^xi ⁾^^⁽⁰^,⁴^l^o^g2 ⁰^,⁴^⁰^,¹^l^o^g2 ⁰^,¹^

i  1

0, 2 log₂0, 2  0,1log₂0,1  0, 2 log₂0, 2)  2,12 бит/знак.

Пример

Решить предыдущий пример при условии одинаковой вероятности появления каждого из пяти знаков: p (x_i) = 1/m = 0,2.

Решение:

^H⁽^x⁾^^ ^p⁽^xi ⁾^l^o^g2 ^p⁽^xi ⁾^^⁵^⁰^,²^l^o^g2 ⁰^,²^²^,³²^бит^/^зна^к^.

i  1

^{Отметим}^,^ч^т^о^эт^о^зн^а^чени^е^H⁽^x⁾^соо^т^в^е^т^ст^в^уе^т^H_ma_x⁽^x^).

^Пр^и^н^а^личи^и^к^о^дер^а^ист^о^чника^,^в^с^в^о^ю^о^чередь^,^пр^е^дс^т^а^в^ляюще^г^о

каждую из m букв алфавита источника кодовой группой из n_kсимволов (разрядов), определяют удельную энтропию H₁(x), приходящуюся на один разряд кодовой группы:

_H₍_x₎_^H⁽^x⁾_,

_(2.7)

ⁿ_k

где n_k– длина кодовой группы (слова), а в обозначении удельной энт- ропии H₁(x) индексом 1 подчеркивается, что энтропия отнесена к одно- му разряду кодовой группы, а не к знаку источника сообщения.

Пример

Определить максимальные значения энтропии H_ma_x(x), H_1ma_x(x), H₁(x) для первичного пятиразрядного (n_К= 5) кода МТК-2, если известно, что с учетом неравновероятности появления m = 32 буквенных знаков

текста энтропия источника сообщений H(x) = 4,36 бит/знак.

Решение:

В соответствии с (2.6) и (2.7) H_ma_x(x) = log32 = 5 бит/знак;

_H₁_m_a_x

₍_x₎_^H^m^a^x⁽^x⁾_₅_/₅_₁_бит_/_разря_д_;_H_(x₎₌_4,36/₅₌_0,8₇_{бит/разряд.}

ⁿ_k¹

Это означает, что кодер источника (рис. 2.1) выдает разряды сообще- ния при кодировании буквенного алфавита источника первичным ко- дом МТК-2 с "недогрузкой" в информационном смысле на 13% по срав- нению с потенциальными возможностями.

В теории информации доказывается, что энтропия источника зави- симых сообщений всегда меньше энтропии источника независимых со- общений при том же объеме алфавита и тех же безусловных вероятно- стях сообщений.

Если источник выдает последовательность букв из алфавита объе- мом m = 32 и буквы выбираются равновероятно и независимо друг от друга, то энтропия источника (2.6) H_ma_x(x) = log m = 5 бит. Однако

^т^аки^м^ист^о^чни^к^о^м^мо^г^л^а^б^ы^быт^ь^об^е^зьяна^,^{нажимающа}^я^в^ха^о^тич^е^с^к^о^м

порядке клавиши пишущей машинки (идеальный источник!).

Если буквы передаются не хаотически, а составляют связный, на- пример русский текст, то появление их неравновероятно (см. выше – вероятность появления буквы "О" в 45 раз больше, чем буквы "Ф"), и, главное, буквы в тексте зависимы. Так, после гласных не может по- явиться "Ь", мала вероятность сочетания более трех согласных подряд, вероятность последовательности, не образующей осмысленных слов (идеальный источник), практически равна нулю. Расчеты показывают [5], что для текстов русской художественной прозы энтропия оказыва- ется менее 1,5 бит на букву. Еще меньше, около 1 бита на букву, энтро- пия поэтических произведений, так как в них имеются дополнитель- ные вероятностные связи, обусловленные ритмом и рифмами. Слово, рифмуемое с окончанием предыдущей стихотворной строки, легко уга- дывается без произнесения или чтения его, и поэтому информации не несет (H(x) = 0). Энтропия телеграмм обычно не превышает 0,8 бит на букву, поскольку их тексты довольно однообразны (особенно поздрави- тельных).

Количественно эта характеристика источника оценивается его избы- точностью.

Избыточность источника сообщений

Абсолютная избыточность источника определяется формулой

 = H

max

(x) – H(x). (2.8)

Чаще используется понятие относительной избыточности, которую и называют избыточностью источника:

__^Hmax ⁽^x⁾^^H⁽^x⁾_₁_^H⁽^x⁾_₁___,

_(2.9)

^H_m_a_x⁽^x⁾

^г^д^е^⁼^H⁽^x⁾^/^H_ma_x⁽^x⁾^–^о^тн^о^{сительна}^я^эн^т^ропия.

Избыточность 0    1 и учитывает как взаимосвязь (корреляцию)

символов в передаваемой последовательности, так и неопределенность каждого символа. Она является важной характеристикой источника, так как указывает, насколько можно сократить число символов и довести его до минимального n_mi_nв последовательности данного источника, если

то же количество информации будет передаваться последовательнос- тью, составленной из равновероятных и независимых символов, т. е. при H(x) = H_ma_x(x). Действительно, для данного (реального) источника

^к^о^лич^е^ств^о^инфо^рм^ации^,^с^о^{держаще}^е^с^я^в^п^о^следов^а^тельн^о^ст^и^и^зⁿ^сим-

волов, равно (2.5) J = nH(x), а для идеального J = n_mi_nH_ma_x. Приравни- вая количества информации этих источников, получим

_n_m_in

^H⁽^x⁾^/^H^m^a^x⁽^x⁾^_n

или избыточность кода источника

__ⁿ^ⁿ^mⁱⁿ_₁_ⁿ^mⁱⁿ_₁___,

n n

(2.10)

^г^д^е^о^{тношени}^е^⁼ⁿ_mi_n^/ⁿ^{получил}^о^{названи}^е^к^о^э^{ффициен}^т^а^с^ж^ати^я^,

^равног^о^{относительно}^й^{энтропии.}

Таким образом, источник с избыточностью  # 0 формирует последо- вательности сообщений, число n символов, в которых больше минималь-

^н^о^нео^бхо^димо^г^оⁿ_mi_n^дл^я^пере^д^а^ч^и^данно^г^о^к^о^лич^е^ств^а^инфор^м^ации.

^У^с^т^{ановлено}^,^чт^о^избыт^о^чн^о^ст^ь^те^к^сто^в^н^а^русс^к^о^м^и^ан^г^лийс^к^о^м

языках   0,7, т. е. объем книги и другой печатной продукции пример- но в 3,3 раза больше, чем это необходимо для отображения содержащей-

^с^я^в^не^й^инфор^м^аци^и^(пр^и^⁼^0,⁷^зн^а^чени^еⁿ_mi_n^/ⁿ⁼^0,³⁼^1/3,3).

^О^дна^к^о^эт^о^н^е^дае^т^пов^о^д^{утвержд}^а^ть^,^ч^т^о^т^а^ка^я^избыт^о^чн^о^ст^ь^б^е^с-

полезна. Избыточность текста обеспечивает высокую достоверность пе- редачи информации, позволяет легко находить опечатки и исправлять ошибки. В частности, получатель телеграммы догадывается об ее под- линном содержании даже при нескольких ошибочно переданных бук- вах. Отметим, что именно необходимость разговаривать при воздействии акустических помех явилась причиной того, что все национальные языки в процессе своего возникновения и развития оказались избыточными, и значение избыточности для всех языков близко к  = 0,7 – 0,9 [5].

В технических приложениях естественную избыточность источни- ков трудно использовать для повышения помехоустойчивости систем связи. Лишние символы в последовательности сообщений часто неже- лательны, так как увеличивают время передачи информации, а при ее хранении требуют дополнительной памяти в запоминающих устройствах. Вопросам устранения избыточности сообщений уделяется большое вни- мание, и с этой целью осуществляют статистическое (эффективное) кодирование дискретных сообщений, в частности, применяют коды Шеннона–Фано и Хафмена.

Отметим, что для повышения помехозащищенности канала связи целесообразно вводить избыточность снова, что делается при помехоу- стойчивом кодировании.

Производительность источника

Производительность источника H(X) есть среднее количество ин- формации, создаваемое источником в единицу времени:

_H_₍_X₎__lim^H⁽^X^T⁾_,

_T__

(2.11)

где H(X_T) – энтропия случайной последовательности, заданной на ин- тервале T.

При наличии кодера источника, с учетом определения удельной энт- ропии (2.7) выражение (2.11) преобразуется

_H_₍_X₎_^H₁⁽^X⁾__V_H₍_X₎_,

_(2.12)

__x^x¹

где

^_x^–^средня^я^{длительн}^о^ст^ь^о^дно^г^о^сим^в^о^л^а^{(разряда}⁾^к^о^дово^г^о^сло-

ва; V_x= 1/

_x^–^с^к^ор^о^ст^ь^фо^р^{мировани}^я^сим^в^о^ло^в^к^о^дер^о^м^ист^о^чни^к^а^.

Из (2.12) следует весьма важный вывод о том, что источник может генерировать сообщения с большой скоростью, но, тем не менее, его производительность с информационной точки зрения будет чрезвычай- но низкой, если H₁(X) << 1. Причиной этого является избыточность

^{источника.}

Различие понятий производительности и скорости формирования символов объясняется тем, что количество информации характеризует не сам факт появления сообщения, а определенное его свойство – сте- пень его неожиданности, нетривиальность выбора этого сообщения из множества других.

Производительностью источника можно управлять, изменяя длитель-

ность символов

^_x^.^Поэтом^у^{различаю}^т^{неуправляемы}^е^и^{управляемые}

источники. Для неуправляемых источников производительность – по- стоянная величина. Так, телеметрические датчики обычно выдают ин- формацию с постоянной скоростью и могут служить примером неуправ- ляемых источников с фиксированной скоростью создания сообщений.

Для управляемых источников формирование символов сообщений про- исходит по внешним командам и, следовательно, длительность символа может изменяться. Например, чтение чисел из запоминающего устрой- ства осуществляется импульсами, интервал между которыми определя- ется возможностями и быстродействием периферийных устройств. Оче- видно, что производительность управляемого источника может менять- ся в широких пределах.

Производительность источника является основной характеристикой при решении задач согласования источника с каналом связи.

<<< < Предыдущая 1 2 3 4 5 67 / 257 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.20254.62 Mб0Кн. Политология.doc
#
01.07.2025149.5 Кб0Кн. текст Сэндел М. Либерализм и пределы справедливости.doc
#
25.05.2015237.68 Кб61КНБК.docx
#
01.07.202549.06 Mб1книга нугманов автомобиль.doc
#
13.03.20153.35 Mб60книга22.10.02(изменение).doc
#
01.07.202512.08 Mб0кодирования.doc
#
13.03.2015388.1 Кб36кокшетау васильковка.doc
#
01.05.2025135.35 Кб0Колектор .docx
#
01.05.20251.51 Mб0колледж_каз_лаб.doc
#
01.07.20258.19 Mб0коллектор.rtf
#
13.03.2015167.17 Кб12Коллекторы НиГ.rtf