Добавил:

Ravochking Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Кузбасский государственный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

sadovin_h_c_sadovina_t_n_osnovy_teorii_igr.pdf

Скачиваний:

Добавлен:

01.01.2020

Размер:

667.17 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 78 / 158 9 10 11 12 13 14 15 > Следующая >>>

3.БИМАТРИЧНЫЕ ИГРЫ

3.1.Основные понятия и ситуация равновесия

Вматричной игре интересы двух игроков были прямо противоположны, то есть речь шла об антагонистической игре. Однако гораздо чаще встречаются ситуации, в которых интересы игроков хотя и не совпадают, но не обязательно являются противоположным.

Рассмотрим конфликтную ситуацию, в которой два игрока имеют следующие возможности для выбора своей линии поведения:

а) 1-й

игрок

может

выбрать

любую

из

стратегий

A1 , A2 , K, Am ;

б) 2-й игрок — любую из стратегий B1 , B2

, K, Bn .

При этом в ситуации {Ai ; Bj }

выигрыш первого игрока будет

равен aij , а второго — bij

, причем, вообще говоря bij ¹ aij .

Тогда получаем две платежные матрицы размерности m ´ n :

æ a11

a12

K a1n ö

æ b11

b12

K b1n

ç a

K a

ç b

K b

(3.1)

A = ç

2n ÷ и B = ç 21

÷ .

ç K K K K ÷

am 2

bm2

è am1

K amn ø

èbm1

K bmn ø

Здесь A — платежная матрица первого игрока, B — платежная матрица второго игрока.

В этом случае говорят, что речь идет о биматричной игре двух игроков с платежными матрицами (3.1).

Отметим, что при bij = -aij получаем обычную матричную

игру.

Рассмотрим один пример биматричной игры.

№ 3.1. Преподаватель – Студент. Студент (1-й игрок) гото-

вится к зачету, который			принимает преподаватель(2-й игрок).
У студента	есть две стратегииA1 — подготовиться к зачету,
A2 — не готовиться. У преподавателя есть две стратегии: B1 по-
ставить зачет и B2		— не поставить зачет. Постройте платежные
матрицы игры.
Решение. В основу значений функции выигрыша положим
следующие качественные соображения:

Выигрыш			Сдал зачет	Не сдал зачет
студента			Сдал зачет	Не сдал зачет
студента

Готовился к зачету			оценка заслужена	очень обидно

Не готовился к зачету			удалось обмануть	оценка заслужена


Выигрыш			Поставил зачет	Не поставил зачет
преподавателя			Поставил зачет	Не поставил зачет
преподавателя

Готовился к зачету			все нормально	был не прав

Не готовился к зачету			дал себя обмануть	опять придет

Количественно выигрыши игроков можно выразить, например,
как
æ 2	-1ö	æ 1	-3ö
A = ç	÷ , B	= ç	÷ .
è1	0 ø	è -2	-1ø

Рассматривая биматричную игру, перейдем сразу к смешанным стратегиям и определим средние выигрыши игроков математическим ожиданием:

H1 ( p, q) = åaij pi q j ,	H2 ( p, q) = åbij pi q j .	(3.2)
i, j	i, j


Будем	говорить,		что	пара	векторовp0 = (p10 ,K, pm0 )		и
q0 = (q10 ,K, qn0 )		определяют равновесную ситуацию, если при лю-
бых p и	q ,	удовлетворяющих			условиям å pi =1 ,	åqi	=1 ,
0 £ pi ,q j	£ 1, справедливы неравенства:
H1 ( p, q0 ) £ H1 (p0 , q0 ),				H2 (p0 , q) £ H2 (p0 , q0 ).		(3.3)
Неравенства (3.3)			означают,		что если игрок	отклонится

от равновесной ситуации ( p0 , q0 ), то его выигрыш может только

уменьшиться.

На вопрос о существовании ситуации равновесия отвечает следующая теорема.

Теорема 3.1. (Дж. Нэш). Всякая биматричная игра имеет хотя бы одну равновесную ситуацию (точку равновесия) в смешанных стратегиях.

Остается разрешить проблему нахождения этой ситуации равновесия.

3.2. Биматричные игры 2×2

Рассмотрим биматричную игру 2 ´ 2 :

æ a			a		ö	, B =		æ b			b	ö	,
A = ç	11		12		÷	, B =		ç	11		12	÷	,
è	a	21	a	22	ø			è	b		b	ø
è		21		22	ø			è	21		22	ø
с вероятностями					p1 = p ,				p2		=1 - p , q1 = q , q2 =1 - q .
Вычислим средние выигрыши игроков
H1 ( p, q) =							)						)				)		(3.4)
= a pq + a p 1 - q								+ a		21	1- p			q + a	1- p	1 - q		,	(3.4)
11			12		(					21	(				22 (	)(

H2 ( p, q) =

(3.4’)

= b11 pq + b12 p (1- q )+ b21 (1 - p )q + b22 (1 - p )(1 - q).

Для таких игр оказывается справедливой следующая теорема, позволяющая находить смешанные стратегии.

Теорема 3.2. Выполнение неравенств (3.3):

H1 ( p, q0 ) £ H1 (p0 , q0 ), H2 (p0 , q) £ H2 (p0 , q0 ),

равносильно выполнению следующих неравенств:

ìH1 (0, q0 ) £ H1 ( p0 , q0 ),
ï	(1, q0 )£ H1 ( p0 , q0 ),
ïïH1	(1, q0 )£ H1 ( p0 , q0 ),
í	(3.5)
ïH2	( p0 ,0)£ H2 (p0 , q0 ),
ï	( p0 ,1)£ H2 (p0 , q0 ).
îïH2	( p0 ,1)£ H2 (p0 , q0 ).

Другими словами, чтобы убедиться в том, что пара ( p0 , q0 )

определяет	равновесную ситуацию, достаточно проверить спра-
ведливость	неравенств (3.3) не для всех p Î[0,1] и q Î[0,1],

а только для двух чистых стратегий каждого игрока. Перепишем формулу (3.4) в более удобном виде

H1 ( p,q) = (a11 - a12 - a21 + a22 ) pq +(a12 - a22 ) p +(a21 - a 22 )q + a22 .

Положим здесь p = 0 и p =1:

H1 (1, q) = (a11 - a12 - a21 + a22 )q + a12 + (a21 - a22 )q ,

H1 (0, q ) = (a21 - a22 )q + a22

и рассмотрим разности:

H1 ( p, q) - H1 (1, q=) (a11 - a12 - a21 + a22 ) pq + (a12 - a22 p ) -

-(a11 - a12 - a21 + a22 )q + a22 - a12 ,

H1 ( p, q) - H1 (0,= q) (a11

Полагая

ìC = a11 - a12 - a21 + a22 ,

îa = a22 - a12 ,

получим

H	1 (	p, q	)	- H	=1, q			)	Cpq
					1	(
= ( p -1)(Cq -a ),
H	1 (	p, q	)	- H	1	(		)
							0, q=		Cpq

- a12 - a21 + a22 ) pq + (a12 - a22 p ).

(3.6)

-a p - Cq +a = Cq ( p -1) -a ( p -1) =

-a p p=(Cq -a ) .

Так как в точке равновесия эти разности должны быть неотрицательными, то приходим к следующей системе неравенств:

ì( p -1)(Cq -a ) ³ 0,

íïî p (Cq -a ) ³ 0.

Для H2 ( p, q ) , при обозначениях:

ìD = b11	- b12 - b21	+ b22	,
í	- b21 ,		(3.7)
îB = b22	- b21 ,

получаем аналогичным образом:

ì(q -1)(Dp - b ) ³ 0,

íïîq (Dp - b ) ³ 0.

<<< < Предыдущая 1 2 3 4 5 6 78 / 158 9 10 11 12 13 14 15 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
22.08.20192.37 Mб1RuthlessManagementOfPeople.pdf
#
22.08.20192.15 Mб3RuthlessManagementOfPeopleAndProfits.pdf
#
29.10.20193.88 Mб6ruthven_malise_fundamentalism_a_very_short_introduction.pdf
#
18.06.20201.65 Mб23rybina_ea_i_dr_angliiskii_iazyk_dlia_magistrov_i_aspirantov.pdf
#
22.08.201962.98 Кб23rybuf.doc
#
01.01.2020667.17 Кб34sadovin_h_c_sadovina_t_n_osnovy_teorii_igr.pdf
#
29.10.20192.83 Mб33Saidov_Sravnitelnoe_pravovedenie.pdf
#
19.11.20192.41 Mб55sarkisov_o_r_lyubarskiy_e_l_ekologicheskoe_pravo.pdf
#
27.10.2020880.12 Кб4sarpova_ov_filosofiia_istoricheskogo_poznaniia_v_trudakh_shk.pdf
#
29.10.20192.12 Mб7Sartr_Zhan-Pol_Bytie_i_nichto_Opyt_fenomenologicheskoy_ontologii_-_royallib_ru.doc
#
19.04.20202.04 Mб18savin_l_v_setetsentrichnaya_i_setevaya_voyna_vvedenie_v_kont.pdf