Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Цвылев Р.И. Информационный аспект долгосрочного планирования

.pdf
Скачиваний:
14
Добавлен:
23.10.2023
Размер:
6.64 Mб
Скачать

Если в і событии содержится исчерпывающая информа­ ция о j исходе, то создается возможность путем примене­ ния і стратегии вызвать / событие (исход). Зависимость Ец от Vj указывает на то весьма важное обстоятельство, что если полезность j исхода для агента велика, то он может добиться наступления этого исхода І8-і9.

Таким образам, функция Р; трактует полезность ин­ формации в плане максимизации определенности состо­ яния агента, когда он точно знает, что надо делать. Функция Рі может иметь линейную и нелинейную фор­ му. При этом передатчик сигналов также может нахо­ диться в некотором целеустремленном состоянии. Но это совсем не обязательное условие передачи сообщения, в то время как условие целеустремленности для приемни­ ка— обязательно. Для понимания сущности процесса передачи сообщений мы можем далее рассуждать сле­ дующим образом.

Некоторое целеустремленное состояние передатчика Sj может произвести изменение в S 2 целеустремленном состоянии приемника. Под таким изменением целеустре­ мленного состояния будет пониматься: изменение Е — оценок и как следствие этого изменение Р — оценок, из­ менение числа стратегий и исходов. Если сообщение оп­ ределить как множество сигналов х0і тогда х0 будет счи­ таться сообщением лишь в том случае, если

,ѵ0 —у (S, —>■S2).

Мы далее установим, что между двумя лицами или группами лиц осуществляется непосредственная переда­ ча сообщения, как правило, лишь в том случае, если пе­ редатчик, находясь в целеустремленном состоянии, вы­ бирает некоторое множество сигналов, которые ведут к изменению целеустремленного состояния приемника. Для иллюстрации этого положения можно привести из­ вестную легенду о суде царя Соломона. Для того что­ бы определить, кому из спорящих женщин в действи­ тельности принадлежит ребенок, царь Соломон предложил разрубить ребенка ра равные части, включив, таким образом, в набор стратегий новую, чисто гипоте­ тическую стратегию. Таким образом, находясь в некото­ ром целеустремленном состоянии S,-, царь Соломон пос­ лал спорящим женщинам сигнал ха, который изменил

18-19 Содержательная интерпретация показателя

дается и ж е ,

121

целеустремленное состояние этих женщин, результатом чего было появление у них новых стратегий »месте с Е- оценкаміи. Информация об этих ^-оценках была затем сообщена царю Соломону, что привело, в свою очередь, к изменению его целеустремленного состояния и к окон­ чательному выбору стратегии (решения). Матерью, как известно, оказалась женщина, которая, не желая гибели ребенка, отказалась от своих притязаний. Мудрость ре­ шения, таким образом, заключалась в создании новой, искусственной информации для получения дополнитель­ ной информации в виде реакции женщин и последующе­ го принятия правильного решения.

Передача информации может происходить между различного типа передатчиками и приемниками, а именно:

1)между точно определенными передатчиком и при­ емником (непосредственная передача) в реальное время. Примером такой непосредственной передачи может быть обмен информацией между двумя противниками в пери­ од военных действий, обмен информацией между продав­ цом и покупателем в период заключения различных ком­ мерческих сделок и т. д.;

2)между неопределенным передатчиком и приемни­ ком (косвенная передача) в разделенные временные ин­ тервалы. Здесь могут быть, в свою очередь, выделены

следующие три случая: а) неопределенный передатчик и неопределенный приемник («процесс накопления чело­ вечеством научных знаний», «обычная цена» на рынке на какой-либо продукт, «справедливая норма прибыли» и т. д.); б) определенный передатчик и неопределенный приемник (рекламная кампания какой-либо фирмы, из­ бирательная кампания какой-либо партии, философское учение Спинозы и т. д.); в) неопределенный передатчик и определенный приемник (организация, вырабатываю­ щая свою программу или определяющая стратегию раз­ вития, исследователь, определяющий направление и ме­ тоды своего исследования и т. д.).

В качестве передатчиков и приемников информации могут выступать также отдельные лица, группы лиц, объ­ единенные в различные организации (правительство, партия, ,фирма и т. д.).

Как уже выше отмечалось, любое целеустремленное состояние всегда характеризуется тремя основными па-

122

раметрами: Р( Еи и Ѵ} и при этом Таким образом, параметр Р{— главный результирующий пара­ метр, и именно с его учетом будет в дальнейшем стро­ иться функция измерения ценности информации. Но> предварительно введем некоторые важные определенияЦелеустремленное состояние Ss всегда находится между следующими двумя крайними состояниями, а именно:'

1) состоянием полного индетерминизма агента, при­ нимающего решение, и

2)состоянием детерминизма. Отметим, что речь „идет

вданном случае не о характеристике складывающейся ситуации, а о характеристике состояния агента, прини­ мающего решение. Агент, принимающий решение, всегда стоит перед выборам стратегии поведения из набора

стратегий, которых, естественно, должно быть как ми­ нимум две. Если вероятность выбора любой стратегии из некоторого набора стратегий равна вероятности выбора любой другой стратегии, то такое состояние агента ха­ рактеризуется как состояние полного индетерминизма. Если же в том же наборе стратегий вероятность выбора некоторой стратегии равна единице, то оно определяется как состояние детерминизма.

Рассматриваемые понятия не вполне адекватны из­ вестному понятию энтропии, хотя и основываются, в ко­ нечном счете, на представлениях энтропии. Понятие энт­ ропии относится к характеристике объективно склады­ вающихся ситуаций, независимых от .поведения агента, оценивающего эти ситуации и принимающего решения; Во всех случаях разнообразие или неопределенность той или иной ситуации всегда есть функция числа возможных исходов. Мера энтропии возрастает с увеличением числа вариантов исходов, как это демонстрируется известной формулой энтропии событий. В нашем же случае мера полного индетерминизма всегда неизменна и не зависит от числа пар «стратегия — исход», характеризующих ту или иную ситуацию. При этом предполагается, что число пар «стратегия — исход» в любой схеме описания ситуа^ Ции должно быть не меньше двух. Практический смысл введения таких модификаций в известные представления энтропии будет показан ниже,- Речь по существу идет в нашем случае о приспособлении обобщенных-энтропий­

ных понятий к более конкретным условиям процесса при­ нятия решения.

123

Обозначим состояние полного индетерминизма через ID, тогда мерой этого состояния будет:

/о = 2 (1)

т I

где Рі = — , і = 1 , 2 , . . . , от.

т

Как это видно из формулы, для любого 5,- состояния значения приведенного модуля отклонения всегда равны нулю. Состояния детерминизма обозначим через D. Ме­ рой этого состояния будет выражение:

 

Р і - -

(2)

 

т

 

где Pk = 1, кф і] Pi = 0,

i = l , 2 , . . . , от.

 

Тогда

 

 

( , _ ± ) +

О— —1= 2 —

(3)

 

т I

т

Отсюда видно, что любое S, состояние с различным количеством стратегий характеризуется своим состояни­ ем детерминизма, которое может принимать значение от единицы до двух, т. е. 1^ D < 2 .

Если исходить из того, что процесс подготовки при­ нятия решения сводится по сути дела к постепенному движению агента из некоторого состояния неопределен­ ности к состоянию все большей определенности, то не­ который набор ситуаций, описанных различным числом пар «стратегия — исход», будут, очевидно, иметь различ­ ные сравнимые длины интервалов от состояния полного индетерминизма до состояния детерминизма. Такие раз­ личия в длинах интервалов, в конечном счете, объясня­ ются различиями в мерах энтропии. Очевидно, для до­ стижения состояния полной определенности в ситуации, описанной, скажем, 10 парами «стратегия — исход» при прочих равных условиях агенту, принимающему решение, потребуется переработать относительно больший массив информации, чем в ситуации, описанной четырьмя пара­ ми «стратегия — исход». Иначе говоря, если агент в од­ ном случае имеет от альтернатив и добивается опреде­ ленности в.ситуации, а в другом случае— (от—1) аль­ тернатив, то в первом случае при прочих равных услови­ ях достигнутая им определенность с точки зрения при­

124

обретенной информации окажется «весомее», чем во вто­ ром случае. Отсюда, в формулу (4), с помощью которой идентифицируется любая точка любого интервала, вво­ дится своего рода коэффициент, учитывающий различ­ ные количества рассматриваемых альтернатив.

Следует далее подчеркнуть, что указанные состояния (полный индетерминизм и детерминизм) в неявной фор­ ме указывают на наличие или отсутствие информации в том или ином целеустремленном состоянии агента, при­ нимающего решения.

Например, в случае если т= 1, то D не определяется, так как такие целеустремленные состояния согласно приведенной ниже теореме не содержат никакой инфор­ мации. Но сначала подробно остановимся на определе­ нии понятия этологической информации и возможной оценке ее количества.

в) Понятие этологической информации и ее оценка

Введем следующее понятие этологической информации: сигналы, поступающие из окружающей среды приемни­ ка, становятся информацией постольку, поскольку они могут повлиять на поведение приемника, являющееся функцией его целеустремленного состояния (S) . Как сле­ дует из смысла этого определения, связь сигналов с по­ ведением приемника осуществляется через изменение це-. леустремленного состояния. В некотором начальном пе­ риоде происходит первоначальное накопление информа­ ции. В последующих же периодах изменение целеустрем­ ленного состояния отражает изменение информации, вы,- ражающейся, в конечном счете, в изменении поведения. Предположим, что А а.— некоторая мера количества

этологической информации в S, состоянии, и будем счи­ тать, что в соответствии с пятым условием (условием предпочтительности) и при соблюдении транзитивности выбора в любом S; состоянии всегда имеется (т—1) альтернатив выбора (единица вычитается с учетом слу­ чая, когда имеется одна лишь альтернатива и все рас­ суждения теряют смысл). Тогда:

У

\Рі - -

 

т 1

 

 

_

®

 

As. --= (m _ l)J=L

V I

р ___ 1

(4)

2_

9.

2 ] Г

~

т

*=1

 

12 5

Мера количества информации в Sj состоянии, как это видно из формулы, измеряется произведением числа имеющихся альтернатив выбора и частного от деления фактического отклонения от состояния индетерминизма на максимальное отклонение от этого состояния.

Далее условимся, что такая мера количества инфор­ мации будет выражаться в некоторых специальных единицах. Каждую такую единицу можно рассматри­ вать как произведение одного бинарного выбора между двумя альтернативами, на некоторое самое малое рас­ стояние данного S] состояния от состояния полного ин­ детерминизма, если при этом заведомо известно, что все расстояние от точки полного индетерминизма до точ­

ки детерминизма делится на некоторое

конечное число

весьма малых отрезков.

Обозначим числитель в (4)

 

 

 

P t

1 I

 

1

 

 

 

 

 

----- через —,

k

 

 

 

 

 

 

т I

 

 

 

где

k — некоторая

достаточно

большая вличина, а

один

бинарный

выбор — через Ь.

Тогда

после

простого

преобразования

А в.

предлагаемая единица

ценности

информации будет

измеряться

следующим

образом:

, 1

o- g, что полностью соответствует приведенному выше

определению.

В результате можно сформулировать задачу по

оценке поступающей информации.

 

,

 

Постановка задачи об оценке информации.

 

Пусть ,

имеется

множество возможных целеустрем­

ленных ‘ состояний

Y =

{у}.

Каждый

элемент такого

множества

у и уг, у3,

...,

yh, где

 

всегда

содер­

жит количество информации,

ценность

которой

выра­

жается в виде у\, у\,

у\ , ..., у \ . Тогда мы всегда можем

построить

некоторый последовательный

ряд разностей:

(УІ — у\), ІУІ — уЬ,

{УІ

Уз),

{yl — УІ-і)-

 

Если значения элементов этого ряда имеют тенден­ цию приближаться к нулю, то тогда этот ряд всегда мо­ жет быть произвольно прерван на любом элементе. Если же значения элементов указанного ряда имеют тенден­ цию к возрастанию или к стабилизации, то этот ряд про­ должается получением любого числа новых элемен­

те

тов. Обрыв ряда означает принятие решения и выбор альтернативных исходов пли программ из системы пред­ почтений, сложившейся к моменту выбора. В случае, если поток поступающей информации меняет поставленные цели, то весь цикл оценки информации начинается зано­ во, в том числе заново формируется и целеустремленное состояние.

Исходя из изложенного выше и обозначая через I количество получаемой информации, имеем следующую функцию дискретного характера:

In = F \{у\ УІ-і), t],

где к последовательно приобретает значения от едини­ цы до бесконечности, і — время.

В более упрощенном практическом плане идеальный момент для принятия решения наступает в некоторой

d I n

точке А кривой роста ценности информации, где---- ^ 0 ,

dt

я совпадающей по времени с некоторой точкой В кривой затрат на получение информации (рис. 14), в которой темп затрат на получение информации резко возрастает (см. приложение I «Машинный эксперимент по оценке поступающей информации»).

Выше уже отмечалось, что целеустремленное состо­ яние увязывается всегда с наличием информации. Для лучшего понимания этого весьма важного утверждения сформулируем теорему.

Теорема: При некотором информационном состоя­ нии 5 *, если соблюдается хотя бы одно из следующих условий:

О

Рі — 0 или Рі = — ;

 

т

127

2)

in — 1;

 

3)

Ei,- = Eij или

Vj — 0,

состояние S* характеризуется отсутствием информации.

Доказательство.

1) Если Pt =

0, то из наличного

набора стратегий нет потенциального выбора стратегий, так как £ „ = 0 и но смыслу 1^=0 и все сводится к третье­ му случаю.

Для случая Рі = —As-становится равным нулю в pe­

rn

1

зультате подстановки

 

 

 

Р/==±В

=

 

1

 

2)

При

m — 1 As

всегда

будет

равняться

нулю,

ввиду

того

что £ j = l .

Если

в этом

случае 0

^ Р < 1 ,

то нарушается условие m = 1,

так как в неявной форме

вводится вторая стратегия.

все имеющиеся стратегии

3)

При

Еі}— Егі и Vj— 0

равноценны с точки зрения их эффективности и полез­

ности их последствий для агента,

принимающего реше-

\

сводится к первому

ния. Следовательно, Рі— и все

т

 

случаю.

Теорема имеет важное значение для глубокого по­

нимания

процесса переработки информации агентом,

принимающим

решение. Из нее вытекают следующие

следствия.

 

 

Следствие I. Если .при .переходе из информационного

состояния

S*

в состояние S ■* соблюдаются условия

теоремы, то такой переход не сопровождается приемом новой информации, необходимой для принятия реше­ ния. В самом деле, если мы имеем пг стратегий и і столбцов исходов, то простое добавление нового столб­ ца исходов и новой m + 1 стратегии с соблюдением ус­ ловий теоремы, очевидно, не изменит информационного состояния агента, принимающего решения.

Допустим, есть данные о существовании четырех выходов из здания, которые рассматриваются как стра­ тегии поведения. Эти стратегии при некотором обуслов­ ленном состоянии среды N могут привести к исходу,

128

обозначаемому «быстрый выход» (0 (). Они же могут привести к исходам «безопасный выход» (02), «небезо­ пасный выход» (0 3). Кроме того, может быть обнару­ жен пятый 'выход. Тогда можно иметь три варианта информационных состояний, характеризуемых следую­ щими тремя ' матрицами, которые определяются как матрицы причинно-следственных цепей, или каузальные матрицы:

С Ог

С Оі

о2

С

Ог

О,

Оз

1

БВ

1

БВ

0

1

БВ

0

НВ

2

0

2

0

БеВ

2

0

БеВ

0

1) 3

БВ

2)3

БВ

БеВ

3)3

БВ

БеВ

0

4

БВ

4

БВ

0

4

ББ

0

НВ

 

 

 

 

 

5

БВ

0

0

Очевидно, все три матрицы с точки зрения информа­ ционного состояния агента, принимающего решения, равноценны. Теоретически размерность матриц можно увеличивать до бесконечности добавлением новых строк и столбцов. Однако при этом нельзя сказать, сопровож­ дается ли расширение матриц увеличением или умень­ шением информации. В данном случае речь идет лишь о накоплении некоторых данных, которые в английском языке называются одним термином «data» (сведения). Накопленные таким образом сведения могут быть ис­ пользованы или не использованы в дальнейшем. Они могут храниться, передаваться и 'периодически извле­ каться из накопителей для последующего использова­ ния. Определим накопленные таким образом сведения как информационный потенциал, который является своего рода информационным сырьем, не прошедшим еще через стадию обработки агентом, принимающим решения 20.

!0 В этом смысле процесс обучения в учебных заведениях следует рассматривать как простое накопление информационного потенциала (иначе говоря знания), который лишь в будущем станет собственно информацией. Такой информационный материал, относящийся к изу­

чаемым дисциплинам, со временем может быть переведен в специ­ альные банки данных, из которых по мере необходимости будут из­ влекаться данные для использования при решении различных проб­ лем. Только в ходе конкретного использования такие данные станут информацией.

5 Р. И. Цвылев

129

Основным содержанием такой стадии обработки яв­ ляется ' (приведение в соответствие информационного потенциала с исходом того или иного события, интере­ сующего агента. Это полностью согласуется с относи­ тельным характером всякой информации, т. е. не сущест­ вует абсолютной информации, а имеется информация о событии а относительно события ß 21. Далее отметим, что существуют специальные формы и правила записи информационного потенциала. Необходимость таких правил и форм вызывается тем, что сигналы, поступаю­ щие из окружающей среды, упорядочиваются первона­ чально в виде определенных причинно-следственных связей, которые представляются в качестве познава­ тельных структур. Очевидно формирование таких позна­ вательных структур—первый и необходимый этап в лю­ бом процессе изменения и преобразования окружающей

среды.

 

 

 

переходе из состояния

в

Следствие 2. Если при

состояние S*

не соблюдаются условия теоремы, такой

переход

сопровождается

приемом новой информации,

необходимой

для

принятия решения. В этом случае

состояние Sj*

будет определяться уже как целеустрем­

ленное

состояние

агента,

готового к приему и оценке

поступающей информации с целью .последующего приня­ тия решения. В общем виде, процесс взаимодействия агента с окружающей средой через получение информа­ ции, очевидно, может протекать так, как показано на рис. 15.

Таким 'образом, информационный потенциал, форми­ рующий целеустремленное состояние агента, становится впоследствии собственно информацией и всякое изме­ нение целеустремленного состояния сопровождается изменением уровня информации. Процессор I (рис. 15) следует рассматривать как первое кодирующее устройст­ во, на выходе которого возникает информационный по­ тенциал, отражающий правильно или ложно причинноследственные связи в окружающей среде. Если эти свя­ зи отражаются неправильно, то источник отклонений следует искать в неправильной работе самого кодирую­

щего устройства. Естественно

ожидать, что все непра-

21

Если

обозначить / (а,

ß)

как информацию а

относительно

то тогда /

(а,

ß )= tf(ß )—# a(ß ),

где # ( ß ) — энтропия

независимо­

го ß, а tfa(ß) — энтропия ß в зависимости от а.

130

Соседние файлы в папке книги из ГПНТБ