Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Рязанский Государственный Университет им. С.А. Есенина

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Теория игр / Петросян_Теория_игр

.pdf

Скачиваний:

Добавлен:

13.02.2015

Размер:

6.14 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 3111 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

игру в случае, когда множество S совпадает с отрезком [—1, 1]. Теорема. Оптимальная смешанная стратегия v* игрока 2 за

ключается в равновероятном выборе двух наборов из т точек:

1 +	4/		4/
1 +		, 1=0, 1, ..., т-\>,	1_ — 1=о, 1, .., т-\
2/И-1			Ъп-\

Оптимальная стратегия ц* игрока 1 состоит в выборе точек

Ъп-\ -, /=0, 1, ...,2т-1

с вероятностями 1/(2/и). Значение игры равно 1/(2/и— 1). Доказательство. Пусть р* и v* — смешанные стратегии иг

роков 1 и 2 соответственно, оптимальность которых нужно до казать. Введем следующие обозначения:

, Г2т-2.-1			2m-2i+l"\|			.	,	„
li=\———,———					,	i=l, 2, ..., 2m-1.
Покажем вначале, что К{х, v*)<l/(2m—1) для									всех		хе[— 1, 1].
Действительно, при xel,			имеем
К(х, v*)=- min		2m—4J—l				1		- 2m+4i+l
К(х, v*)=- min			2m-l			+-mm		2m - l
1 /	2m-2j-l\				1 / 2 m - 2 / + l			\	1	.	(6.8)
=-[x			—	+-		2 w - l		x =	2/w-l	.	(6.8)
2 \	2m-\			/	2 \	2 w - l		/	2/w-l
Пусть теперь игрок 1 выбирает смешанную стратегию ц*, а иг
рок 2 — произвольную чистую стратегию у={у1,									.., ут).
Обозначим
	2т—2/—1				У=0, 1,			...,Ьп-\.
х,=- 2т-1					У=0, 1,			...,Ьп-\.
Тогда			2 т - 1					1
			2 т - 1					1
К{ц*, 3>)= Е					min p(x/ ,yj )~ =
= Г" S	т 1 П		Р (*»->' ^ ) + m i Q					P(*V-2. У\|) >
			1		2		1				(6.9)
	>— • т				•	=		.			(6.9)
	>— • т				•	=		.
			2т		2 т - 1		2т-1

Из неравенств (6.8), (6.9) вытекает утверждение теоремы.

100

§ 7. ОДИН КЛАСС ИГР С РАЗРЫВНОЙ ФУНКЦИЕЙ ВЫИГРЫША

Для игр, у которых функции выигрыша разрывны, нельзя гаран тировать существование значения игры в смешанных стратегиях (см. пример п. 4.12). Однако часто именно разрывность функции выигрыша позволяет найти оптимальные стратегии и значение иг ры. Нахождению решения помогают также эмпирические предполо жения о виде оптимальных стратегий игроков.

7.1. В данном параграфе будут исследованы игры с выбором момента времени или игры типа дуэли (см. примеры 4.5 п. 1.2). Основной особенностью этого класса игр на квадрате является разрывность функции выигрыша Н(х, у) вдоль диагонали х=у.

Рассмотрим игру на единичном квадрате с функцией выигрыша

{ср(х), если х=у, в(х, у), если х>у,х<у,\1/(х, у), если

где ф(х, у) — определена и непрерывна на множестве 0<х<^<1, функция (р непрерывна на [0, 1], а в(х, у) определена и непрерывна на множестве 0<j><;c< 1. Предположим, что игра Г=(Х, Y, Н), где Аг=У=[0, 1], Н—задана (7.1), имеет оптимальные смешанные стратегии ц*, v* игроков 1 и 2 соответственно. Более того, пред положим, что оптимальные смешанные стратегии /х*, v* являются распределениями вероятностей, которые имеют непрерывные плот ности /* (х) и g* (x) соответственно.

Далее в этом параграфе будем обозначать искомую стратегию / (соответственно g), понимая под этим плотность распределения. Выясним свойства оптимальных стратегий.

Пусть/— стратегия игрока 1. Для уе[0, 1] имеем

K(f, у) = ] Ф (х, УУ(х)сЬс+\в(х, yV(x)dx.		(7.2)
О	У
Предположим, что /	и g — оптимальные стратегии	игроков
1т 2. Тогда для любой точки у0, в которой
	g(yo)>0	(7.3)
(точки спектра стратегии g), выполняется
	Ktf, y0)=v,	(7.4)

где v — значение игры. Но равенство (7.3) строгое, поэтому суще ствует <5>0 такое, что для всех у: \у—у0\<5, неравенство (7.3) сохраняется. Таким образом, для этих у сохраняется и неравенство (7.4), т. е. выполняется равенство K(f, y)=v. Это означает, что

dK(f, у)/ду=0.

(7.5)

101

в(у,у)-ф(у,у)=-2у2

Уравнение (7.5) перепишем в виде
[в(У, У)-Ф(У, У)¥(у) = ] ФЛ> y¥()dx+
о
+ R ( * , y)f(x)dx, yeS(y0, 8).	(7.6)

Следовательно, получено интегральное уравнение (7.6) относите льно искомой стратегии/

7.2. Пример 16. Рассмотрим бесшумную дуэль, сформулирован ную в примере 5 п. 1.2. Функция выигрыша Н(х, у) в игре имеет вид (7.1), где

ij/(x,y)=x-y+xy;	(7.7)
в(х,у)=х-у-ху;	(7.8)
р(х) = 0.	(7.9)

Заметим, что данная игра является симметричной, поскольку Н (х, у)=—Н(у,х) (кососимметричная функция выигрыша). Поэто му анализ, аналогичный проведенному в п. 9.2 гл. 1, показывает, что значение v игры, если оно существует, равно нулю, а оптимальные стратегии игроков (если они также существуют) должны быть оди наковыми.

Имеем: ф,(зс,у)= - 1 +х; ву(х, у)= - 1 -х;

и интегральное уравнение (7.6) принимает вид

-2у2№ = ] (х-l)f(x)dx-\	(x+ l)f(x)dx.	(7.10)
О	у

Будем искать стратегию / в классе дифференцируемых плотностей
распределения, принимающих положительные значения в интервале
(а, /?) с: [0, 1] (интервал (а, /?) — спектр стратегии J). Тогда (7.10)
можно записать следующим образом:
у	Д	(7.11)
-2угт = [ (x-\)f(x)dx-l	(x+ l)f(x)dx.	(7.11)
«	У

Дифференцируя обе части (7.11)	по у, получим дифференциальное
уравнение вида
-4yf-2y2f =	(y-l)f+(y+l)f
или
Jr=-3/Xy0).		(7.12)
Интегрируя уравнение (7.12), имеем
f<y) = yy-\		(7.13)

где у — некоторая константа.

102

Теперь осталось найти а, /? и у. Напомним, что оптимальные стратегии игроков в рассматриваемой игре одинаковы. Из нашего предположения о спектре стратегии/следует, что

Wy) = Q

(7.14)

для всех у е (a, /?).

Пусть /?< 1. Поскольку функция K(f, у) непрерывна по у, из (7.14)

имеем K(f, /0=0. Следовательно,
а	(7.15)
J (x-p+Px)f(x)dx=0.	(7.15)

Однако в случае /?< 1 из (7.15) следует

K(f, 1) = J (х-1 +x)f(x)dx<0,

что противоречит оптимальности стратегии/ Таким образом, fi= 1 и K(f, 1)=0. Тогда, подставляя (7.13) в (7.15) при /?=1, получаем

1
f2x-l ,
j — <ь=о, 7^0.
Откуда вытекает
За2 -4а+1=0.	(7.16)

Решая уравнение (7.16), найдем два корня а=1 и а =1/3, первый из которых посторонний. Следовательно, а= 1/3. Коэффициент у нахо дится из условия нормировки/(у)

\ f(y)dy=y J r3efy=l,

1/3 1/3

откуда у = 1/4.

Таким образом, получено решение игры примера 5 п. 1.2: значе ние игры равно v = 0, оптимальные стратегии/и g обоих игроков (как плотности распределения) равны между собой и имеют вид

П } = 50, е с л и х < 1 / 3 '
ПХ)	(1/(4х3), если	х>•1/3.
7.3. Пример 17. Найдем решение игры «шумная дуэль» (см.
пример 4 п. 1.2) для функций меткости pY		(х)=х и р2 (у)=у. Функция
выигрыша Н(х, у) в игре имеет вид (7.1), где
	ф(х,у)=2х-1;	(7.17)
	9(х,у) = 1~2у;	(7.18)
	<р(х) = 0.	(7.19)

юз

Игра является симметричной, поэтому v = 0, а оптимальные стратегии игроков совпадают. Здесь оба игрока имеют чистую оптимальную стратегию ;с*=>>* = 1/2. Действительно,

#(1/2, у)=6 (1/2, у) = 1 -2у> О, если у < 1/2, Я(1/2, у)=ср (1/2) = 0, если у= 1/2, Я(1/2, у)=ф(112, у)=0, если у>1/2.

С точки зрения интерпретации игры решение предписывает дуэлян там стрелять одновременно, когда каждый пройдет половину диста нции до барьера.

В заключение следует отметить, что класс игр с выбором момен та времени хорошо изучен (см. [6, 3, 23]).

§ 8. РЕШЕНИЕ БЕСКОНЕЧНЫХ ОДНОВРЕМЕННЫХ ИГР ПОИСКА

В этом параграфе будет приведено решение игр поиска с бес конечным числом стратегий, сформулированных в п. 1.2. Первая из рассматриваемых игр интересна тем, что в ней оба игрока имеют оптимальные смешанные стратегии с конечным спектром.

8.1. Пример 18. (Поиск на отрезке). Рассмотрим задачу поиска на отрезке (см. пример 2 п. 1.1), которая моделируется игрой на единичном квадрате с функцией выигрыша Н(х, у) вида

я (	jl, если \|* - ,\|</, /е(0, 1),
	(О в противном случае.

Заметим, что при /> 1/2 у игрока 1 имеется чистая оптимальная: стратегия х* = 1/2 и значение игры равно единице, поскольку в этом случае Н(х*, у)=Н(1/2, у)=1, так как \у-1/2|^ 1/2^/_для всех уе[0, 1]. Предположим, что /< 1/2. Заметим, что стратегия х=1 доминиру ет все чистые стратегии х<1, а стратегия x=l — I — все стратегии х> 1—1. Действительно,

Щх,у)=Н(1,у)=\1пПрЯуе[°>Ц>

(О в противном случае,

и если х<1, то

Щх,у)=\1пПрЯуе[°>1+Х]'

(О в противном случае.

Таким образом, при х<1: Н(х, у)^Н(1, у) для всех уе[0, 1]. Анало гично имеем


)=Н(\-1,у)=!}		при уе[\-21, 1],
Н(х,у)-. „ ч . .,„	1П

[О в противном случае,

104

и если хе[1 —I, 1], то

H(x,y)=Sn \\ при уе[х—1, 1],

О в противном случае.

Таким образом, при хе[1 — /, 1] Н(х, у)^Н(1 —/, у) для всех>>е[0, 1]. Рассмотрим следующую смешанную стратегию ц* игрока ).

Пусть l=xl<x2<...<xm=l — I — точки, для которых расстояние

между любой парой соседних точек не превосходит 21. Стратегия ц* выбирает каждую из этих точек с равными вероятностями \\т. Очевидно, что при этом любая точка уе[0, 1] попадает в /-окре стность хотя бы одной точки хк. Следовательно,

К(ц*,у)>11т. (8.2) Пусть теперь v* — стратегия игрока 2, которая состоит в равнове

роятном выборе точек 0=у1<у2<-.<уя=1,

причем расстояние

между парой соседних точек больше 21. Тогда, очевидно, существует не более одной точки ук, в /-окрестности которой содержится точка

х. Следовательно,

К(х, v*)<l/«.

(8.3)

Если бы удалось построить стратегии ц*, v* так, чтобы т=п, то величина 1/и была бы значением игры, а стратегии ц*, v* — оп тимальными стратегиями игроков.

Оказывается, такие стратегии действительно можно построить. Для этого достаточно взять

J1/(2/), если 1/(2/) — целое,

(Jl/(2/)]+l в противном случае.
Здесь [а] — целая часть числа а. Точки
xt=l+~	(i-1), i=\, 2, ..., и,	(8.5)
	л—1

отстоят друг от друга не более чем на 21, а расстояние между
соседними точками
yj=—:» 7=1,2, ...,R,	(8.6)
п— 1

строго больше 21. Таким образом, 1/и — значение игры, а опти мальные стратегии ц*, v* являются равновероятными смесями чис тых стратегий, определяемых формулами (8.5), (8.6).

8.2. Пример 19. Рассмотрим обобщение предыдущей задачи в том случае, когда игрок 1 (ищущий) выбирает систему из s точек *!, .., xs, х,е[0, 1], i=l, ..., s, а игрок 2 (прячущийся) выбирает

105

независимо и одновременно с игроком /	точку уеГО,	1]. Игрок
2 считается обнаруженным, если находится такое je{\,		..., s), что
\у — Xj\^l, />0. В соответствии с этим функция выигрыша (выигрыш
игрока 1) определяется следующим образом:
1, если min	\у—х^1,	(8.7)
{О в противном случае.		(8.7)
{О в противном случае.

Предположим, что игрок 1 располагает точки х1г ..., х„ в точках Xi=l+{\—2l)(i—\)l{n — \), 1</^и, являющихся точками спектра

стратегии fi* из предыдущего примера. Очевидно, что располагать две точки хЛ, х]г в одной точке отрезка [0, 1] (т. е. выбирать

совпадающие точки) невыгодно. Пусть ц, — стратегия игрока 1,

выбирающая равновероятно любые 5-наборы не равных друг другу точек {3CJ}. Если s^n, то, расположив в каждой из точек х\ по точке

Xj, игрок 1 полностью покроет отрезок [0, 1] интервалами длины 2/ с центрами в точках Зс, и тем самым обеспечит, что для любой точки

уе[0,1] будет иметь место min \xj—j>|</, т. е. в этом случае значение

игры равно единице. Поэтому будем считать, что s<n. Число всевозможных различных выборов ^-наборов точек из множества {х,} равно Q. Имеем

К(ц*, y)=-LH(xh, ...,~Xi-у) (±\>Щ	=	*-.
Действительно, точка у обнаруживается, если	она	попадает_ в

/-окрестность хотя бы одной из выбранных стратегией (if точек {Зс,}.

Для того чтобы это произошло, необходимо игроку 1 выбрать точку xt из /-окрестности точки у. Число наборов, удовлетворяющих

этому требованию, не менее C„Z\.

Предположим теперь, что игрок 2 использует стратегию v* из предыдущего примера, а игрок ] — произвольную чистую страте гию x=(xv ..., xs). Тогда

"	1 s
K(xv ..., xs; v*)= £ H(xu ..., xs;	yj)~^-.

Таким образом, значение игры равно sin и ц*, v* — оптимальные стратегии игроков. Значение игры линейно зависит от количества выбираемых ищущим игроком точек.

106

8.3. Пример 20. (Поиск на сфере). Рассмотрим игру поиска на сфере (см. пример 3 п. 1.2). Функция выигрыша Н(х, у) имеет вид

{1, если уеМх,

(8.8)

О в противном случае,

где х={х1У ..., х, — набор s точек на сфере С и Ms= \J S(xj, г); S(XJ, r) — г-

сферическая окрестность точки Xj. Множество смешанных стратегий игрока 1 пред ставляет собой семейство вероятностных мер {М}, определенных на декартовом произведении s сфер Сх Сх... х C—Q, т. е. на fl=C.

Множество смешанных стратегий игрока 2 определим как семейство вероятност ных мер {v}, определенных на сфере С.

Рассмотрим конкретную пару стратегий (p.*, v*). В качестве стратегии v* выберем равномерную меру на сфере С, т. е. потребуем, чтобы

I	L(a)	(8.9)
	Л * = — - ,	(8.9)
	4nR2

где L(a) — лебегова мера (площадь) множества А.
Будем предполагать, что параметры игры 5, г и Л таковы, что можно выбрать
систему точек х=(хи	х2,..., ха), удовлетворяющих условию
	я
	L{Mx)=Y.L(S{xj,r)),	(8.10)
	J-i
(сферические сегменты S(xp r) не пересекаются).
Зафиксируем фигуру М, на некоторой сфере С. Тогда смешанная стратегия ц*

порождается случайным бросанием этой фигуры Мх на сферу С. Для этого в фигуре Мх фиксируется некоторая внутренняя точка z, с которой жестко связываются два

неколлинеарвых вектора а, Ъ (с углом tp>0 между ними), расположенных в касатель ной плоскости к Мх в точке z.

Точка z «бросается» на сферу С в соответствии с равномерным распределением, т. е. плотностью 1/(4яА2). Пусть в результате реализуется точка / е С . Фигура Мх с фиксированными на ней векторами параллельно переносится на сферу С так,

чтобы точки z и z7 совпали. Таким образом, векторы а, Ъ будут лежать в касательной плоскости к сфере С в точке т!.

Затем на промежутке [0, 2п] выбирают в соответствии с равномерным рас пределением угол <р\ и вектор b в касательной плоскости поворачивают вместе со связанной с ним фигурой Мх на угол ц> по часовой стрелке. В результате фигура

Мх и вектор Ъ переходят в новое положение на сфере С. Случайное размещение множества Мх на сфере в соответствии с описанной двухэтапнои процедурой и поро ждает случайный выбор точек x!v x!2, ..., x"s, соответствующих смешанной стратегии ц*, а именно: игрок / выбирает точки У,,..., У еС, в которых оказались центры хи ..., х~, сферических окрестностей S(xj, г), составляющих множество Мх.

Мера ц*, построенная таким образом, оказывается инвариантной, т. е. вероят ность покрытия множеством Мх любой точки уе С не зависит от у*. Действительно,

107

найдем вероятность этого события. Пусть П={со} —пространство всевозможных размещений Мх на сфере С. Тогда средняя площадь, покрываемая на сфере С при

бросании на нее множества Мх (математическое ожидание площади), равна L (Мх), в то же время

	L{Mx)=HJ(y,io)dydy*,	(8.11)
	ас
где J (у, со) — характеристическая функция множества на сфере		С, покрываемого
областью Мх. По теореме Фубини имеем
f J J(y, co)dydii= J J J(y, co)dydy.		(8.12)
а с	с а

Однако в силу инвариантности меры ц* интеграл \ J [у, о>)ф*, совпадающий с веро ятностью покрытия точки у множеством Мх, от у не зависит и равен р . Тогда из (8.11), (8.12) имеем

L{MX)	Е	•№(>'))
Р= —J-	°J~'	. D2	•	(8.13)
4nR2		4nR2

Обозначим через K(ji, v) математическое ожидание выигрыша при использовании игроками смешанных стратегий Л6{д} и ve{v}. Если один из игроков использует чистую стратегию, то

К(х, v)=J Н(х, y)<h= J Л=Рг(у6 Л/х ),

СИх

KQi, у)= J Н(х, у№=[ ЦХ, У№'Ъ(уеМх),

ао

ив этом случае математические ожидания соответственно имеют смысл вероят ностей попадания случайной точки в фиксированную область и накрытия случайной областью фиксированной точки. Для всех у и х=(хи ..., х,) в силу условий (8.9)

и (8.13) имеем

	L(MX)		lL(S(xj,r))
К{х, v*)	4яЛ2	<=	4яЛ2	\| 1 - / 1 - ( - )	),
	4яЛ2		4яЛ2	2 \ V W	)
	S			2- и-ш
	£	L(S(xj, r))
KQi*,y) = i~l		AnR2

так как L{S{xj, г))=2яЛ(Л - ^Л 2 - г 2 ) .

Из определения седловой точки и полученного неравенства K(ji*, у)~^К{х, v*)

•См., например: Саитало Л. А. Интегральная геометрия и геометрические вероятности. М., 1983.

108

к^'\{Ч1-$)

—значение рассмотренной игры поиска.

8.4.Рассмотрим вариант предыдущей игры, полагая, что игрок 2 выбирает некоторое односвязное множество Ус С и целью игрока 1 является максимизация площади пересечения

М Г О ^ ^ ^ П U S(X/,r)\

j-i

Цель игрока 2 противоположна. В остальном игра совпадает с игрой, рассмотренной в начале параграфа. Стратегия ц* игрока 1 совпадает с таковой в предыдущей игре. Смешанная стратегия v* игрока 2 строится аналогично стратегии р* и заключается в случайном бросании множества У на сферу (в предыдущем случае игрок 2 случайно выбирал точки yeQ. Таким образом, v* строится как инвариантная мера, которая состоит из случайного (в соответствии с равномерным распределением на С) выбора одной из фиксированных точек множества У на С и далее поворота У вокруг этой точки на случайный угол (в соответствии с равномерным распределением на [0, 2л]). Пусть К(х, v), К(ц,у) соответствуют математическим ожиданиям площади пересече ния L(Y\)MX). Тогда

КОЛ у)=К{х, v)=K0i», v)		L{Y)L{MJ
		— г — .
		2яЛ2
Если У— г-окрестность точки у, то значение игры равно
K(fl, V) =*5	(R-y/tf-t3).
Упражнения • задачи

1. Игра нападения — защиты. Игрок 1 силами А единиц намерен атаковать один
из объектов Ci	С„, ценность которых определяется числами tx>О, х2>О,.... т„>0,
причем т1>т2>...>тя. Чистой стратегией х игрока 1 является вектор Jc=(ft		(п),
л

£ ii=A, где £i — часть сил, выделенных для атаки объекта Q. Суммарные силы

обороняющейся стороны (игрок 2) равны В. Чистой стратегией у игрока 2 является выбор набора неотрицательных чисел y=(Vi, —> >ы)> удовлетворяющих условию

£ t\i=B, где щ — часть сил, предназначенных для защиты объекта Cj. Результат £таки на объект С, пропорционален разности £/ — щ, если силы атакующих превос ходят силы защищающихся, а в остальных случаях он равен нулю. Построить функцию выигрыша.

2. Игра на единичном квадрате имеет функцию выигрыша

Н(х,у)=ху-1/Зх-\12у.

Показать, что (1/2, 1/3) — ситуация равновесия в этой игре.

3. Показать, что игра на единичном квадрате с функцией выигрыша

H(x,y)=siga(x-y)

имеет седловую точку.

4 Показать, что игра на единичном квадрате типа дуэли с функцией выигрыша 109

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 3111 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в папке Теория игр

#
13.02.2015975.72 Кб49Лекция 6.pdf
#
13.02.20151.99 Mб43Лекция 7.pdf
#
13.02.2015606.31 Кб39Лекция 8.pdf
#
13.02.20151.05 Mб42Лекция 9.pdf
#
13.02.2015804.89 Кб38Методические указания по выполнению лабораторной работы.pdf
#
13.02.20156.14 Mб54Петросян_Теория_игр.pdf
#
13.02.2015608.26 Кб27Семинар 1.ppt