Добавил:

Ravochking Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Кузбасский государственный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

sadovin_h_c_sadovina_t_n_osnovy_teorii_igr.pdf

Скачиваний:

Добавлен:

01.01.2020

Размер:

667.17 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 56 / 156 7 8 9 10 11 12 13 14 15 > Следующая >>>

Последние равенства и представляют собой основу для разработки различных методов решения матричных игр.

Таким образом, можно привести следующие условия приме-

нения смешанных стратегий:
1.	Игра без седловой точки.
2.	Игроки используют	случайную	смесь	чистых стратегий
с заданными вероятностями.
3.	Игра повторяется многократно в сходных условиях.
4.	При любом ходе ни	один из	игроков	не информирован

остратегии второго игрока.

5.Допускается усреднение результатов игр.

Перейдем теперь к изучению методов решения матричных игр в смешанных стратегиях.

2.4. Решение матричной игры 2×2

Начнем рассмотрение методов нахождения оптимальных смешанных стратегий с простейшей игры, описываемой платежной матрицей

æ a	a	ö
A = ç 11	12	÷ .
è a21	a22	ø

Пусть смешанные стратегии игроков имеют вид:

S1 =

, S2

æ B

= ç

÷ .

Оптимальные

стратегии p0

=1 - p0

и цена игрыn

должны удовлетворять условиям:

ìa

+ a

=n ,

(2.14)

í 11

îa12 p1 + a22 p2 =n ,

или

a11 p1 + a21 (1 - p1 )

=a12 p1 + a22 (1 - p1 ) .

Откуда получаем следующее решение матричной игры:

a22 - a21

ï p10 =

a11 + a22 - (a12 + a21 )

- a

í p20 =

1 - p10 =

(2.15)

a11 + a22 - (a12 + a21 )

=p0

p0 =

a11a22 - a12 a21

ïn a

+ a

a11 + a22 - (a12 + a21 )

Вычислив оптимальное значение n , можем вычислить и оптимальную смешанную стратегию второго игрока из условия a11q1 + a12 q2 = v , или a11q1 + a12 (1- q1 ) = v . А именно:

q0		v - a			q0	1- q0	a		- v	,	(2.15')
	=		= 12	,			=	11

1		a11	- a12		2	1	a11 - a12

при a11 ¹ a12 .

Эту задачу можно решить и графически, учитывая, что решение системы (2.14) представляет собой геометрически точку пересечения двух прямых на плоскости ( p1 , n ) или (1 - p1 , n ).

Приведем алгоритм геометрического способа решения игры

2×2:

1. На оси абсцисс откладываем отрезок единичной длины p1 = p Î[0, 1].

2.	На оси ординат	откладываем выигрышы при	стратегии
A2 , а на прямой p =1 — выигрыши при стратегии A1 .
3.	Строим стратегии, проходящие через точки:
а) (0, a21 ) и (1, a11 );
б) (0, a22 ) и (1, a12 ) .
4.	Находим точку	пересечения прямых, которая	и дает

решение матричной игры ( p10 , v).

Проиллюстрируем данный алгоритм на рисунке:

a21	a12

n
a22
			a11
0		p10	1	p
		Рис. 2.1
№ 2.5. Решите матричную игру 2 ´ 2 ,			заданную	платежной
матрицей:
æ 3	8 ö
A = ç	4	÷ .
è7	4	ø

Решение. Определим сначала верхнюю и нижнюю цену игры:

a1	= 3,	a2	4, =a	max {3, =4}	4 ,
b1	= 7,	b2	8, =b	min {7, =8}	7 .

Так как a < b , то имеем игру без седловой точки, что при-

водит к необходимости рассмотрения смешанной стратегии. По формулам (2.15) найдем:

p0	=	4	- 7		= 0,375 ,
p0	=				= 0,375 ,
1		3 + 4	- 7	- 8
		3 + 4	- 7	- 8
p0	=1 - p0 1=- 0,375 = 0,625 ,
2		1

n = 3 ×0,375 + 7 ×0,625 = 5,5 .

По формулам (2.15´) определим смешанную стратегию второго игрока:

q0	=	5,5=-8	= 0,5, q0	1- q0	= 0,5 .
1	3 - 8		2	1
	3 - 8
Ответ: p0			= (0,375; 0,625=),		q0 (0,5; 0,5=), v 5,5 .
Проиллюстрируем это решение графически согласно приве-
денному выше алгоритму.
	n
					8
	7
	5,5
	4
					3

0,375

Рис. 2.2

2.5. Матричные игры 2×n

Пусть платежная матрица игры имеет вид:

æ a	a	...	a	ö
A = ç 11	12	...	1n	÷ .
è a21	a22	...	a2n ø

Тогда, согласно теореме 2.2, решение игры находится из уравнения:

n = min a

p0 + a 1

- p0

))

=max min

(

p + a

(1 - p)

)

, j=

1, n

( 1 j

2 j (

0£ p£1 j

1 j

2 j

Для нахождения максимума (по p ) функции

min (a1 j

p + a2 j (1- p)),

(2.16)

построим ее график. Для этого надо построить n прямых вида:

wj = a1 j p + a2 j (1 - p ) ,	(2.16´)
на плоскости ( p, w), p Î[0, 1]	и путем визуального сравнения

выбрать ломанную, огибающую их снизу. Верхняя точка этой ломанной и дает решение игры.

Геометрически это можно проиллюстрировать следующим образом:

0	p0	p0	1	p

	1	2

Рис. 2.3

Здесь нижняя огибающая выделена жирной линией.

№ 2.6. Найти оптимальную стратегию первого игрока в матричной игре, заданной матрицей 2×3:

æ1		3	5	ö
A = ç	4	2	1	÷ .
è				ø

Решение. 1. Сначала проанализируем игру на наличие седловой точки:

a1	= 1,	a2	1, =a	max{1;=1} 1 ,
b1	= 4,	b2	3, b3=	5, b min{=4; 3; 5} 3 .

Так как a < b , то седловой точки нет и надо искать решение

всмешанных стратегиях.

2.Вычислим средние выигрыши первого игрока, при условии, что второй игрок выбирает только чистые стратегии, при помощи таблицы:

		p	1	3	5

		1 – p	4	2	1

То есть, получаем следующие прямые:
w1 = p + 4(1 - p)= 4 - 3 p ,
w2 = 3 p + 2(1 - p)= p + 2 ,
w3 = 5 p + (1- p) = 4 p -1 .
3.	Построим нижнюю		огибающую		данных	трех прямых
(рис. 2.4).
4.	Видно, что максимальное значение огибающей определя-
ется	точкой пересечения		прямойw1 с прямой w2 .			Поэтому

решаем систему уравнений:

w			5
4
			3
2,5
2
1			1
1
0	0,5	1	p
	Рис. 2.4
ì4 - 3 p = w,
í
î p + 2 = w,
а именно:
4 p = 2, p = 0,5 .
Следовательно, получили следующее решение:
n = 0,5 + 2 = 2,5,	p0 = (0,5; 0,5).

Найдем теперь оптимальную стратегию для второго игрока. Здесь в зависимости от формы нижней огибающей может представиться несколько случаев.

А. Нижняя огибающая имеет единственную точку максимума

( p0 ,n 0 ).

1. Если p0 = (0;1), то есть оптимальной стратегией первого игрока является стратегия A2 , то второму игроку выгодно применять чистую стратегию, соответствующую номеру прямой

( k 0 ), проходящей через точку( 0, n ) и имеющей наибольший отрицательный наклон.

(k0 )

Рис. 2.5

2. Если p0 = (1; 0) , то оптимальной для второго игрока яв-

ляется стратегия, соответствующая номеру ( k 0 ) соответствующей прямой, имеющей наименьший положительный наклон.

(k0 )

Рис. 2.6

3. Если 0 < pi0 <1 , то в оптимальной точке пересекаются, как минимум, две прямые:

(k0 )	(l	0	)

Рис. 2.7

одна из которых ( k 0 ) имеет положительный наклон, а другая ( l 0 ) отрицательный. И оптимальная смешанная стратегия второго игрока получается при

q0 = q , 1- q0	=q , q= 0, j ¹ k,l,
k	l j

где q0 является решением уравнения

a1k q + a1l (1 - q) a=2k q + a2l (1- q ) .

B. Нижняя огибающая имеет горизонтальный участок.

(k0 )

Рис. 2.8

Тогда оптимальной для второго игрока является чистая стратегия Bk0 .

Найдем теперь оптимальную стратегию второго игрока в нашей задаче.

1. Так как в оптимальной точке пересекаются первые две прямые, то

q1 = q, q2 = 1 - q, q3 = 0,

то есть из трех стратегий применяются первые две(активными являются B1 и B2 ).

2. Приравняем соответствующие средние выигрыши второго игрока с использованием таблицы:

q	1 – q	0

1	3	5

4	2	1

а именно:

1× q + 3×(1- q ) + 0 ×5 = 4 × q + (1 - q )× 2 + 0 ×1 .

3. Решим последнее уравнение:

q + 3 - 3q 4q +=2 - 2q, 4q =1 ,

= ç

;

÷ .

Вычислим цену игры:

1 ö

n =1×

+ 3

ç1 -

= 2,5.

Следовательно, полное решение игры имеет вид:

= (0,5; 0,5),

æ 1

;

; 0

n = 2,5.

= ç

2.6.Матричные игры m×2

Вэтом случае платежная матрица игры имеет вид:

æ a11	a12		ö
ç a	a		÷
А = ç 21		22	÷ .
ç ...	...		÷
ç	am2		÷
è am1	am2		ø

Решение этой игры аналогично решению игры2 ´ n , только

в этом случае на плоскости(q,w) ищется минимум верхней огибающей прямых

wi = ai1q + ai 2 (1 - q), i =1, m .

Рассмотрим конкретный пример игры 3 ´ 2 .

№ 2.7. Найти решение игры 3 ´ 2 :

	æ1		4	ö
A =	ç	3	-2	÷
	ç			÷ .
	ç	0	5	÷
	è			ø

Решение. 1. Проанализируем игру на наличие седловой точки:

a1 =1, a2 = -2, a3 = 0, a = 1, b1 = 3, b2= 5, b= 3.

То есть a < b и необходимо применить смешанную страте-

гию.

2. Вычислим средние выигрыши второго игрока(при условии, что первый игрок выбирает только чистые стратегии). Из таблицы

q	1 – q

1	4

3	-2

0	5

получаем следующие прямые:

w = q			+ 4 1- q =			4 - 3q;
1				(	)
w	2	= 3q -		(	)
				2 1	- q= -2 + 5q;
w = 0 + 5 1 - q = 5 - 5q.
3				(	)

3. Построим верхнюю огибающую.

-2

Рис. 2.9

4. Так как наименьшее значение верхней огибающей получается как решение системы уравнений:

ìw =q + 4(1 - q ),

ïîw = 3q - 2(1 - q ),

то получаем:

3q - 2(1 - q) =q + 4 (1 - q);

3q - 2 + 2q= q + 4 - 4q ;

<<< < Предыдущая 1 2 3 4 56 / 156 7 8 9 10 11 12 13 14 15 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
22.08.20192.37 Mб1RuthlessManagementOfPeople.pdf
#
22.08.20192.15 Mб3RuthlessManagementOfPeopleAndProfits.pdf
#
29.10.20193.88 Mб6ruthven_malise_fundamentalism_a_very_short_introduction.pdf
#
18.06.20201.65 Mб23rybina_ea_i_dr_angliiskii_iazyk_dlia_magistrov_i_aspirantov.pdf
#
22.08.201962.98 Кб23rybuf.doc
#
01.01.2020667.17 Кб34sadovin_h_c_sadovina_t_n_osnovy_teorii_igr.pdf
#
29.10.20192.83 Mб33Saidov_Sravnitelnoe_pravovedenie.pdf
#
19.11.20192.41 Mб56sarkisov_o_r_lyubarskiy_e_l_ekologicheskoe_pravo.pdf
#
27.10.2020880.12 Кб4sarpova_ov_filosofiia_istoricheskogo_poznaniia_v_trudakh_shk.pdf
#
29.10.20192.12 Mб7Sartr_Zhan-Pol_Bytie_i_nichto_Opyt_fenomenologicheskoy_ontologii_-_royallib_ru.doc
#
19.04.20202.04 Mб18savin_l_v_setetsentrichnaya_i_setevaya_voyna_vvedenie_v_kont.pdf