Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
101
Добавлен:
23.02.2015
Размер:
2.8 Mб
Скачать

Количество информации и избыточность

Количество информации только тогда равно энтропии, когда неопределенность ситуации снимается полностью

I=H.

В общем случае нужно считать, что количество информации есть уменьшение энтропии вследствие опыта или какого-либо другого акта познания

I=H1-H2.

Наибольшее количество информации получается тогда, когда полностью снимается неопределенность, причем эта неопределенность была наибольшей – вероятности всех событий были одинаковы. Это соответствует максимально возможному количеству информации I’, оцениваемому мерой Хартли

, (28)

где Q – число событий; р – вероятность их реализации в условиях равной вероятности всех событий.

Таким образом,

. (29)

Абсолютная избыточность информации Dабс представляет собой разность между максимально возможным количеством информации и энтропией

или . (30)

Пользуются также понятием относительной избыточности

. (31)

2.3. Семантические меры информации

Под семантикой понимается смысл, содержание информации.

Знаком называется условное изображение элементов сообщения, словом – совокупность знаков, имеющая смысловое (предметное) значение, языком – словарь и правила пользования им.

2.4. Другие меры полезности информации

2.4.1. Энтропия, шум и тезаурус

Можно рассмотреть полезность информации в зависимости как от степени новизны, так и от способности приемника к ее восприятию и обработке.

Следствием потребительского аспекта является дополнение информации понятием актуации в смысле активного запроса информации со стороны заинтересованного приемника. При этом имеется в виду тесная связь между этими понятиями, так как в каждой ситуации (запросе) может содержаться некоторая информация.

Существуют три типа вопросов: в одном отсутствует предвосхищение ответа, в другом имеется некоторая доля ответа, в третьем полностью содержится ответ и требуется только его подтверждение.

Информация (ответ)

Актуация (запрос)

Система Sx

Объект

Источник

-----

Система Sy

Субъект

Приемник

Информация

Ответ

Язык Х

-----

Актуация

Запрос

Язык Y

Структура

Энтропия

Семантика

-----

Композиция

Тезаурус

Прагматика

Обобщенное представление процесса обмена

информацией между двумя системами.

Таким образом замыкается связь между двумя системами (см. рисунок): системой Sx, являющейся поставщиком информации, и системой Sy – потребителем информации.

Также присутствует понятие тезауруса (от греческого «сокровищница»), под которым понимается запас знаний, или словарь, используемый приемником информации.

С учетом сказанного можно систему извлечения, передачи и приема информации представить в виде схемы.

Источник Приемник

(объект) (субъект)

Канал

Потеряно

Энтропия Шум

Н N Тезаурус

На этой схеме источник (объект) обладает определенной энтропией Н, которая характеризует способность источника отдавать информацию. Отдача может быть неполной.

Информация I=H1-H2поступает в канал, где часть информации теряется или искажается шумомN.

Оставшаяся информация Iдостигает приемника и воспринимается им в той степени, в какой это позволяет тезаурус.

Может оказаться, что, несмотря на высокое богатство структуры и статистики информации на передающей стороне, приемная сторона не будет нуждаться в этой информации, так как она уже ею обладает, не имеет в ней потребности или не умеет с ней обращаться.

Существует и другое положение. Если тезаурус неадекватен передаваемой информации, очень мал или вообще отсутствует, то самая новая и богатая информация не воспримется вследствие того, что она не будет понята приемником.

С приемом новой информации тезаурус может обогащаться.

Пусть богатство тезауруса количественно оценивается некоторой величиной . Изменение тезаурусапод действием сообщения Н можно оценить количеством информацииI(Н,), которое представляется графиком.

Имеется некоторое минимальное количество Imin() априорной информацииI() тезаурусав системеSy, при котором системаSyначинает понимать сообщения, поступающие от системыSx. После этого воспринимаемая информацияI(H,) возрастает при увеличенииI() до точки с координатамиImax(H,) иIопт(), где достигается максимум восприятия. Далее следует спад, обусловленный тем, что априорные знания (тезаурус приемника) становятся настолько богатыми, что источник не приносит новой полезной информации.

В точке Imax() восприятие информации прекращается, так как системаSyоказывается насыщенной знаниями в пределах возможностей системыSx– потенциального источника информации.

Если языки XиYоднозначно определены, то могут быть предусмотрены трансляторы - переводчикиYXиXY, располагаемые вSx,Syили вSxиSy(совместно).

В других случаях возникает проблема взаимопонимания, которая решается методами распознавания и самообучения.

При единстве языков может иметь место непонимание из-за действия помех и искажений.

В ранее приведенной общей схеме указаны структурные, статистические и семантические характеристики информации: структура, энтропия и семантика на стороне источника Sx; композиция сообщения, тезаурус и прагматика на стороне приемникаSy.

Композиция отражает те же стороны информационной системы, что и структура информации, тезаурус – те же, что семантика, хотя связь между этими парами понятий не является установившейся.

Наиболее близкими между собой являются понятия структуры и композиции. Структура как основа исчисления количества информации предполагает дискретное строение и декомпозицию информации, осуществляемые на передающей стороне. Поэтому естественной функцией приемной стороны является композиция, заключающаяся в том, что по возможности восстанавливаются нарушенные связи между элементами информации или воссоздается непрерывность информационного комплекса. В ряде случаев это может повлечь за собой переоценку информации

Соседние файлы в папке конспект ТИ