Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Башкирский Государственный Аграрный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги из ГПНТБ / Шахнович, А. Р. Математические методы в исследовании биологических систем регулирования

.pdf

Скачиваний:

Добавлен:

21.10.2023

Размер:

9.19 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 56 / 206 7 8 9 10 11 12 13 14 15 16 17 18 19 20 > Следующая >>>

Уравнения (1-5-1) и (1-5-2) описывают «динамику» собственно ав томата. Взаимодействие автомата со средой определяется ответ ной реакцией среды s [к] на действия автомата / [к]. Поэтому вход ное воздействие на автомат зависит от выходных величин и пара метров среды.

Уравнение среды можно записать как

		s [к] =	eJ (/[fe],\|[fc]).
Здесь	0 j — квантироваииая		функция; \| [к] — случайная решет
чатая	функция.	Среда может быть представлена как еще одна
обратная связь.		Здесь обычно рассматривают задачи целенаправ

ленного поведения автомата под влиянием среды. Впервые сфор мулировал и решил подобные задачи М. Л. Цетлин в 1964 г. Стра тегии автоматов в таких играх являются состояниями, а память автоматов определяет число стратегий.

В случае игры автоматов с нулевой суммой основная теорема о минимаксе (см. главу 1-3) остается справедливой.

Выше был приведен подход к теории игр автоматов, основан ный на представлении игры как динамической системы. Такой под ход, по-видимому, полезен для создания ' общей картины поста новки динамических задач и, несомненно, будет использован при решении конкретных задач. Однако в собственно теории игр ав томатов используется несколько иной подход, основанный на при веденном выше абстрактном определении автомата.

Создателем теории игр автоматов является выдающийся со ветский ученый кибернетик М. Л. Цетлин.

Ниже приведены основные положения теории игр автоматов, являющиеся сокращенным изложением его работы (1964).

Рассмотрим детерминированный автомат U, заданный своими

каноническими уравнениями
Ф(г +	1) =	Ф ( Ф ( 0 ,	s(t + l)).	(1-5-3)
/	(г) =	F (ф (0).		(1-5-4)

В этих уравнениях переменная t имеет смысл времени и предпола гается принимающей целочисленные значения t = 1, 2, ... Пред положим, что входная переменная s (t) может принимать лишь два значения: 0 и 1 (значение s = 0 соответствует единичному вы игрышу, а значение s = 1 — единичному проигрышу автомата 31). Предположим далее, что выходная переменная / (і) автомата может принимать X различных значений Д, / 2 , / х . Значения перемен ной / (t) называют действиями автомата, т. е. в момент t автомат 91 произвел d-e действие, если

/(0 = /а, а =1,2...%.

Предполагается также, что переменная ф (I) может принимать m различных значений фІ 5 ф2 ... ф т . Эти значения называются состояниями автомата, а число m — емкостью его памяти. Очевид-

но, что m > %. Автомат 3Î находится в момент t в /-м состоянии,

I — 1, 2 ...m,	если	ср (/) — q>j. Действие / а называется	соответст
вующим состоянию		cpj, если F (ср7-) = / а .
В этих обозначениях уравнение (1-5-4) описывает изменение
состояния автомата под воздействием входной переменной.
Уравнение	(1-5-4) описывает зависимость действий		автомата

от его состояний. Входная переменная принимает лишь два значе ния, так что (1-5-3) задает пару отображений в себя множества состояний автомата; одно из этих отображений задано для s = О, другое — для s = l .

Эти отображения записывают в виде специальной матрицы состояний \\а,ц (s) U, i, j = 1, 2 ... m, где каждая строка ее при любом фиксированном значении s содержит в точности один эле мент, равный единице, а остальные элементы равны нулю. Матрица


IIаи	(s) II	определяет	переходы		состояний		детерминированного
автомата следующим образом: если в момент t автомат								находился
в состоянии фг, то в момент				t +	1 он перейдет в такое			состояние
Ф;,	для	которого ац	(s (t +	1)) = 1.		Стохастический		автомат
также имеет конечное			число	состояний		ф^	ф2 ... ф т и	конечное

число действий fu / 2 ... / х ; как и для детерминированных автоматов, описанных выше, мы будем предполагать, что входная переменная принимает лишь два значения: S = 0 и S.= 1. Действия стохасти ческого автомата однозначно определяются его состоянием: / (і) =

=	F (ф (t)), а матрицы состояний \|\| аі}		(s) \|\|, s = 0, 1 являются	сто
хастическими. При этом ац (s)		имеет	смысл вероятности перехо
да	из і-го состояния в jf-e при	заданном значении входной		пере

менной. Очевидно, что детерминированные автоматы являются частным случаем стохастических. Автомат 31 находится в стацио

нарной

случайной

среде

С —С

(аг,

а2 ... ах),

если

действия ав

томата

значения

его входной

переменной связаны

следующим

образом:

действие

/ а , а = 1, 2 ... %, произведенное

автоматом в

момент

влечет за собой в момент

t -J- 1 значение

s =

(проиг-

1 — аа

рыш) с вероятностью ра

= — ^ —

и s =

О (выигрыш)

вероят-

ностыо qa

—

2— • При этом предполагается, что | аа\ ^

Пусть в момент I автомат находился в состоянии ф;, і =

1, 2 ...

... m, которому соответствует действие fai

— F (фг ). Тогда

вероят

ность ptj

перехода

автомата из состояния ф; в состояние ф; опре

деляется

формулой

Pu =

Рагаи

(!) +

Я<ч а и

(°)>

і, 7 =

1, 2 ... m,

причем матрица Р

= || ptj

|| является стохастической.

Таким обра

зом, функционирование автомата в стационарной случайной среде описывается цепью Маркова.

Обозначим через rt финальную вероятность состояния ф£ ав томата, находящегося в стационарной случайной среде С.

	Обозначим через аа;		а =	1, 2 ... % сумму			финальных		вероят
ностей таких состояний ср(,				которым		соответствует		действие		/ а .
Величины un имеют смысл вероятностей действия / а								автомата		%
в	среде	С.
	Математическое ожидание			W ($1, С) выигрыша для					автомата
Э( в среде		С выражается формулой
		W(VL, С)			2 °<*а«-
					а = 1
Очевидно,		что
		т і п ( а 1 . .. а х	) ^ W(Vi,		С)^	тах(а х ... ак).
	Целесообразность поведения автомата заключается в увеличе
нии W. Автомат 21 обладает				целесообразным			поведением		в среде
С,	если
		W (U, о			+ в » + . . . +		вх).

Для автомата, совершающего свои действия равновероятно и


независимо	от реакций		среды,		W	=•— (сц +	Q-г +	••• + а*)-
Простейшим	примером		автомата,		обладающего		целесообразным
поведением, служит		автомат L 2		l 2 ,	имеющий два состояния: ф! и
ф2 и два действия:		Д =	F (ц),)	и	/ 2 =	F (ф2 ). Автомат		сохраняет

свои состояния при выигрыше и изменяет при проигрыше. Мат рицы состояний имеют вид

II ««(1)1	0	1	К	(0)« =	1	о
	1	О
					0	1

Пусть автомат L 2 ) 2 погружен в среду С (п1, сі2 ). Построив матрицу переходных вероятностей

\\Яі Pi

Р = I р 2 Ч.Ч.

1 - я ,

г = 1,2,

находим для вычисления финальных вероятностей гг и г2 уравне ния

Воспользовавшись еще	условием		нормировки		гх -\- г2	1, имеем
Гі =	Р2		„ _	рі
Гі =	Рі +рг	'	Го = •	Р1 + Р2	'
Для математического	ожидания		выигрыша		получаем	выраже-
ние
W(L2t2,C)		=

Легко

видеть,

что W(L2,2,

С)^>а1~^при

a1=f=a2,T. е.

что

автомат

L 2

l 2

обладает целесообразным

поведением в стацио

нарной

случайной

среде.

Рассмотрим

коллективное

поведение

(игру)

автоматов

5t1, ...

3tv. Предполагается, что

каждый

из этих

автоматов

задан

своими матрицами состояний и уравнениями (1-5-3),

(1-5-4).

Пусть далее sj (l),

f (t),

cp3 (l), / = 1,

v — значения

входной

переменной, выходной переменной и состояния

автомата

момент t. Будем по-прежнему предполагать, что входная

перемен

ная s3

{і) принимает лишь два значения: s* (l) — 0 и sJ ( i ) = 1, со

ответствующие

(единичным)

выигрышу

проигрышу

автомата

в момент t. Выходная переменная /J

(і)

предполагается

при

нимающей

значение из множества Д ... fx..

Эти значения

назы

вают стратегиями автомата %' и говорят, что в момент t

автомат

9F использует свою а-ю стратегию,

если

(t) =

fa.

Значения

фі ••• фЦ переменной cpJ

(I) назовем состояниями

автомата W,

а число nij — емкостью его памяти. Очевидно, что rrij

и зада

ны матрицы

состояний

II <& (s;' (0) I),

у =

1 ... v;

i,k =

l...my,

(0 =

0,1

автоматов Э11 ... 5tv.

Перейдем к описанию

игры автоматов. Назовем партией / (t),

разыгрываемой

в момент

t, набор / (0 =

(Z1

••• f" (0)

страте

гий,

используемых в момент

автоматами

5t1 ...ЭДѴ.Исходом

s (t -f- 1)

партии

/ (t)

назовем

набор

s (t -f- 1) =

(s1

(t - f 1) ...

... sv (t -f- 1))

значений

входных

переменных (единичных

выиг

рышей и проигрышей) этих автоматов

в момент t -f- 1.

Игра Г

автоматов

Si1 ... 3tv задана, если

для каждой партии / (t) задана

вероятность Р (/, s) ее исхода s (f -f- 1); равенство

2p(/,S) = l

(1-5-5)

имеет место при любом /.

Таким образом, игра Г автоматов

... 9tv

состоит из последо

вательности партий / (I), t= 1,2 ... исходы s (f -f- 1) которых опре деляются вероятностями р (/ (t), s (t + 1)).

Платежные функции v* (f), / = 1 . . . ѵ , задающие игру Г*, имеют смысл математического ожидания выигрыша /-го игрока при

наборе	стратегий / и однозначно восстанавливаются по вероятно
стям исходов по формуле
vj(f) =	2 [p&s1 ...^-1 , 0, s^...s^-p(f,sK..s^,	1, sto...*%
		(1-5-6)

Игру V лиц Г* назовем эквивалентной игре автоматов Г. Заметим, что задание игры Г* не определяет однозначно игры автоматов Г. В самом деле, игра Г* задается ѵ функциями Ѵ] (/), а игра Г зада

ется 2Ч — 1 вероятностями р		(/,	s)	для каждой партии /.
Назовем игру ѵ автоматов		Г игрой с независимыми исходами,
если				V
				V
p(f,s) =	p(f,sK..s")=			Л pi	(/,#'),
где				3=1
где
р - '(/,0), />'(/,	1 ) > 0 ;		У	(/, 0) +	p(f, 1) = 1.

Произвольная игра Г* позволяет однозначно построить игру авто матов с независимыми исходами; при этом

	p4f,sj)		=	^a+(-i)sl'v4f)].
Система	автоматов	511	... 3ÎV, участвующих в игре Г,		находит
ся в состоянии a (t) =		(ccj. ... аѵ ), если в момент t автомат W на
ходится В СОСТОЯНИИ ф а ,			Clj =	1 ... Iflj, ) = 1 . . . Л>.
Определенные таким образом модели коллективного					поведения
автоматов	используют	язык		теории игр. Однако возникающие

здесь определения игр автоматов и способы поведения в этих иг рах значительно отличаются от точки зрения, принятой в теории игр.

В самом деле, в теории игр предполагается, что система пла тежных функций, определяющих игру, заранее сообщается ее участникам. Игрок должен использовать эту информацию для того, чтобы определить свою стратегию (обычно смешанную), кото рая в ходе самой игры уже не изменяется; для выбора стратегии разрешается использование любых вычислительных средств.

Игры автоматов определяются заданием не только системы пла тежных функций, но и конструкций играющих автоматов. Авто маты, участвующие в играх, априорной информацией об игре не обладают. Ходы определяются лишь проигрышами и выигрышами в ходе самой игры.

Роль платежных функций, задающих игру, и партнеров авто мата по игре сводится поэтому лишь к образованию более или ме нее сложной случайной среды, в которой автомат должен обладать целесообразным поведением.

П р и м е р . Игра двух автоматов с нулевой суммой. Рассмот рим игру Г, в которой участвуют автоматы. 9t1 и W, имеющие со

ответственно M ж N стратегий: (щ — М, и 2 =	N).
Предположим, что в каждой партии / = (f1,	f) этой игры один

из двух автоматов выигрывает, а другой проигрывает. Тогда ве роятности р (/, s) — р (f, f, s1 , s2 ) исходов s— (s1 , s2 ) равны нулю при s1 =

Определенную таким образом игру автоматов назовем игрой двух автоматов с нулевой суммой.

Величина

qi'P = Р (Л Л 0, 1)

имеет смысл вероятности выигрыша первого автомата в партии

PM-- = P(f\ Л t 0)

представляет собой вероятность его проигрыша в этой партии. Со гласно (1-5-5)

ql4* + pNz = 1.

Математическое ожидание тр^ выигрыша автомата 3t1 в партии / (Л f) равно в силу (1-5-6)

тІЧг = qNz — рІЧг.

Очевидно, что математическое ожидание суммы выигрышей авто

матов 3t1	и ЭД2	равно нулю. Величины тар образуют прямоуголь
ную матрицу		II maß \|\|, а =!..-. M,	ß = 1... ІѴ, совпадающую с
матрицей	эквивалентной игры двух		лиц с нулевой суммой. Если

игра является эргодической, то существуют финальные вероятно сти состояний системы участвующих в игре автоматов и величина W (ЗІ1 , 212) математического ожидания выигрыша первого авто мата не зависит от их начальных состояний. Эту величину назовем

ценой игры Г для автоматов				и 2І2 .
Обозначим, через Raia*				финальную			вероятность		состояния
системы автоматов, участвующих в игре								Г. В этом	состоянии
автоматы	и 212	находятся в состояниях						срі и ср2, и используют
стратегии	=F1	(cpà,)	и	f\	=	F2 (фа.)		соответственно. Ве
личину математического			ожидания			W (ЗІ1 ,		$12, Г) выигрыша ав
томата "2І1 можно вычислить по формуле
		W(U\U\		Г ) =	^	Л	^ .
					aid.		1

Рассмотрим игру автомата 31 с противником U, использующим фиксированную смешанную стратегию. Пусть противник U ав томата 31 в игре реализует некоторую смешанную стратегию х=

=(х1 + ••• + xN), т. е. в каждой партии использует свою ß-io

чистукГстратегию, ß = 1 ...Ne вероятностью xt + ... -f- xN = 1. По определению смешанной стратегии величины х$ являются функциями матрицы | т а р|| игры Г и не зависят от поведения парт нера.

Тогда для любой чистой стратегии / а , а = 1 ... M автомата 21 определены математические ожидания та выигрыша:

та = 2 maßXß.

Р=і

Таким образом, игра с противником, избравшим произвольную

смешанную		стратегию, определяет стационарную случайную								сре
ду С {іщ ...		тм)	и	для	любого х
				W	(U, U, Г) ==• W (U, С).
Если	... %п — асимптотически-оптимальная						последовательность
автоматов,		то,	по	определению,
W	=	lim W (U, U,			Г) =	max (тх... тм) =	max	2 т*№$-
		п-юо	і				а	р = 1
Таким образом,			автомат			при достаточной величине			п максими
зирует	свой выигрыш. Если					смешанная стратегия		х—	(хи ...	xN)

является оптимальной, то математическое ожидание выигрыша автомата 21Г1 при п ->- со стремится к величине

			N
W	= max min		2 maßXß>
	a	x	ß=i
т. е. совпадает с ценой игры по фон Нейману.
Можно сказать, что	такой	автомат «играет не хуже» своего

партнера, избравшего оптимальную стратегию, хотя и не распо лагает априорными сведенияАіи о структуре матрицы || тар || игры Г, а получает всю необходимую информацию в ходе самой игры; поведение, целесообразное в стационарной случайной среде, ока зывается целесообразным и в рассмотренном случае игры.

Приведенные выше элементы теории игр автоматов позволяют подойти к исследованию целесообразного поведения различных по сложности коллективов, состоящих из отдельных клеток, нервных центров или целых организмов.

Л И Т Е Р А Т У Р А

Гельфанд И. М., Цетлин М. Л. О математическом моделировании меха низмов центральной нервной системы. В сб. «Модели структурно-функ циональной организации некоторых биологических систем». М., «Наука», 1966.

Цетлин М. Л. Исследования по теории автоматов и моделированию биоло гических процессов. М., «Наука», 1969.

Цыпкин Я. 3. Адаптация и обучение в автоматических системах. М., «Нау ка», 1968.

Глава 1-6

ТЕОРИЯ СТАТИСТИЧЕСКИХ РЕШЕНИЙ

Теория статистических решений, являясь более общей по от ношению к приведенным выше теориям исследования динамики управляемых систем (главы 1—2, I—3), основывается на теории игр и математической статистике (Крамер, 1948).

Выше, в главе 1-3, уже было введено понятие игры, но оно было связано с детерминированными представлениями.

Втеории статистических решений рассматриваются случайные ходы, влияющие на исход игры. В статистических играх в соот ветствии с определением Б. БлекуэллаиМ . Гиршика (1958) игро ками являются природа (обозначается игрок I) и статистик (обо значается игрок I I ) .

Встатистических играх элементы cod в Й (D) (см. главу 1-0) определяют чистые стратегии природы, поэтому юй можно счи тать состояниями природы.

Структура пространства чистых стратегий статистика (II) мо жет быть более сложной, Чем структура пространства чистых стра тегий природы (I), так как статистик имеет в своем распоряжении класс возможных действий, которые он может совершать (или со ответственно решений, которые он может принимать) по отношению к неизвестному для него состоянию природы cùd. Производя оп ределенное действие без испытания, статистик допускает, что он

может потерпеть численный убыток W (ad,	а),	представляющий
собой известную функцию состояния природы		cûd и действия и =
= а, которое он выбирает из множества А.	Уменьшение убытка

может быть получено за счет проведения испытаний и получения некоторой информации относительно состояния природы ш^. Основным вопросом, возникающим при этом, является выбор стра тегии. Как отмечалось выше, в статистической игре без испытаний пространство чистых стратегий есть пространство X (элемента ми этого пространства являются возможные действия статистика).

В игре с ограниченным объемом выборки (единичным испыта нием) число стратегий статистика растет, поскольку ему необхо


димо выбрать правило, которое				свяжет точку а ЕЕ А с каждым
возможным исходом			испытания.
Это правило в		статистических играх			называется		решающей
функцией. Решающую функцию V можно рассматривать как раз
биение множества X на взаимно непересекающиеся							подмноже
ства	Ха = {х :Ѵ (я) =		о,}, сумма	которых	есть X.	Если теперь
исход	единичного	испытания может быть			отнесен	к	множеству
Ха, то совершается		действие а. Например, если параметр а может
иметь два возможных значения аг				и а 2 (с априорными вероятностя
ми соответственно рх и р2), то стратегия V					определяет		разбиение

пространства X на множество Ех (называемой критической обла

стью) и его дополнение С {Ех), такое, что если х ЕЕ Ех,			то принима
ется решение а =	ах,	а если х Е5 С (Ех), то принимается решение
а = а2 (причем рх	+	р« = 1).
Весьма важную роль в определении статистической игры име
ют два понятия — функция потерь и функция риска			(соответству
ющие определения	будут даны ниже).


Статистическая игра может быть теперь определена						следующим
образом.	Если	X =	(х, Q, {D)p)		— пространство выборок, Ù (D)—
произвольное		пространство			решений; V — класс	решающих
функций,	отображающих			решения в Q (D), R— функция риска,
то игра	Г = (Q (А),		V ,	R) называется статистической игрой с
фиксированным		объемом		выборки.

Таким образом, определяется статистическая игра, в которой рассматриваются ситуации взаимоотношений с внешним миром. Игры с разумным противником имеют ту же структуру, что и ста тистические игры. В общей теории статистических решений су ществуют несколько направлений (Фельдбаум, 1963):

—теория двуальтернативных решений рассматривает случай определения одного из двух возможных значений пара

метра ах или а2 с известными априорными вероятностями;

— теория многоальтернативных решений рассматривает слу чаи определения к различных значений параметра аи...

... ак при известных априорных вероятностях;

—теория оценки параметров рассматривает получение наи лучшей оценки значения параметра, принадлежащего к определенной области Q (А) при наличии известной априор ной плот тости вероятности Р (А);

—теория оценки процессов рассматривает получение наилуч-

--шей оценки параметра, меняющегося во времени A (t).

Исходная выборка (или сигнал) представляется вектором S, который может в общем случае содержать несколько неизвестных параметров

			S (t) =		s (ah t);	i =		i...m
Параметры		при этом		представляются			вектором параметров
Вектор	параметров			А =	(аг-);	і =	1	... т..
			рассматривается				в	пространстве параметров
Q (А),	являющемся яг-мерным пространством с декартовыми коор
динатами аи... ат,			здесь Р		(A) dÇî (А)		характеризует			вероятность
попадания конца вектора в элементарный объем										пространства
dQ(A).	Аналогично			вектор наблюдений X					= (х1),	(j =	l...k)
рассматривается в			пространстве			наблюдений			Q (х),	являющемся
А-мерным пространством с декартовыми координатами хх											... Хц:
Здесь Р (X)		d£i (X)	характеризует вероятность попадания								конца
вектора X в элементарный объем							dQ (X)		(Р (X)	— плотность
вероятности		вектора		X) .

Выше были рассмотрены игровые аспекты теории статистиче ских решений, связанные со статистическими играми.

Основная проблема при этом заключалась в выборе решающей функции и стратегий, таких, чтобы обеспечить определенное зна чение выгоды.

Одним из основных и в достаточной мере разработанных направ лений общей теории статистических решений является теория двуальтернативных решений (Фельдбаум, 1963). Основная проблема в этой теории состоит в определении одного из двух возможных значений параметра а : ях или а2. Выше был приведен подход к этой проблеме при введении понятия стратегии V , определяющего разбиение пространства на критическую область Ег и ее дополнение С (і?і), причем при a Ez Ех параметр а имеет значение аи а при а £Е €Е С (ijj) параметр а имеет значение а2 .

Решение этой задачи связано с необходимостью определения функции правдоподобия Р (XIа) (см. главу 1-0).

Определения апостериорных вероятностей Р (АІХ) с помощью формулы Бэйеса

P № ) = _ _ M W )

VР {А) Р {XIA) dQ (А)

О(А)

сводится к выбору такого значения	А,	при котором апостериор
ная плотность вероятности максимальна		(при известных априор
ных вероятностях А).
Если априорные вероятности А неизвестны, то используется
метод максимума правдоподобия на	основе сформулированного

Р. Фишером правила: наиболее правдоподобно то значение парамет

ра А, для которого функция правдоподобия L (А) = Р (XIА)				мак
симальна.	Поскольку	здесь вектор	X задан, то функция	пра
вдоподобия зависит только от А.
Применив формулу Бэйеса к определению апостериорных				веро
ятностей	значений а =	ах ж а = я2 ,	получим

Если	значения функции		правдоподобны соответственно L (а^ =
= Р	(Х/йх) и	L (а2) = Р	(XIа2),	то, разделив	выражение (1-6-1)
на выражение		(1-6-2), получим коэффициент			правдоподобия
		U(Y\	— L ( a à	— р №Ісч)
		п У А - > ~ Цо£)		Р ( Х / а 2 ) -

Применяя теперь метод максимума правдоподобия, можно утвер ждать, что при H (X) ^> 1 выносится решение а — аи а при

<<< < Предыдущая 1 2 3 4 56 / 206 7 8 9 10 11 12 13 14 15 16 17 18 19 20 > Следующая >>>

Соседние файлы в папке книги из ГПНТБ