Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
sadovin_h_c_sadovina_t_n_osnovy_teorii_igr.pdf
Скачиваний:
34
Добавлен:
01.01.2020
Размер:
667.17 Кб
Скачать

3.БИМАТРИЧНЫЕ ИГРЫ

3.1.Основные понятия и ситуация равновесия

Вматричной игре интересы двух игроков были прямо противоположны, то есть речь шла об антагонистической игре. Однако гораздо чаще встречаются ситуации, в которых интересы игроков хотя и не совпадают, но не обязательно являются противоположным.

Рассмотрим конфликтную ситуацию, в которой два игрока имеют следующие возможности для выбора своей линии поведения:

а) 1-й

 

игрок

может

выбрать

любую

из

стратегий

A1 , A2 , K, Am ;

 

 

 

 

 

 

 

 

 

 

б) 2-й игрок — любую из стратегий B1 , B2

, K, Bn .

 

 

При этом в ситуации {Ai ; Bj }

выигрыш первого игрока будет

равен aij , а второго — bij

, причем, вообще говоря bij ¹ aij .

 

 

Тогда получаем две платежные матрицы размерности m ´ n :

 

æ a11

a12

K a1n ö

æ b11

b12

K b1n

ö

 

 

ç a

 

a

 

K a

÷

ç b

b

K b

÷

(3.1)

 

A = ç

21

 

22

 

 

2n ÷ и B = ç 21

22

2n

÷ .

 

ç K K K K ÷

ç K K K K ÷

 

 

ç

 

am 2

 

 

÷

ç

bm2

 

÷

 

 

è am1

K amn ø

èbm1

K bmn ø

 

 

Здесь A — платежная матрица первого игрока, B — платежная матрица второго игрока.

В этом случае говорят, что речь идет о биматричной игре двух игроков с платежными матрицами (3.1).

Отметим, что при bij = -aij получаем обычную матричную

игру.

Рассмотрим один пример биматричной игры.

56

№ 3.1. Преподаватель – Студент. Студент (1-й игрок) гото-

вится к зачету, который

принимает преподаватель(2-й игрок).

У студента

есть две стратегииA1 — подготовиться к зачету,

A2 — не готовиться. У преподавателя есть две стратегии: B1 по-

ставить зачет и B2

— не поставить зачет. Постройте платежные

матрицы игры.

 

 

 

 

 

 

Решение. В основу значений функции выигрыша положим

следующие качественные соображения:

 

 

 

 

 

 

 

 

 

 

Выигрыш

 

 

Сдал зачет

Не сдал зачет

 

 

студента

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Готовился к зачету

 

 

оценка заслужена

очень обидно

 

 

 

 

 

 

Не готовился к зачету

 

удалось обмануть

оценка заслужена

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выигрыш

 

 

Поставил зачет

Не поставил зачет

 

 

преподавателя

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Готовился к зачету

 

 

все нормально

был не прав

 

 

 

 

 

 

Не готовился к зачету

 

дал себя обмануть

опять придет

 

 

 

 

 

 

 

Количественно выигрыши игроков можно выразить, например,

как

 

 

 

 

 

 

 

æ 2

-1ö

æ 1

-3ö

 

 

 

A = ç

÷ , B

= ç

 

÷ .

 

 

 

è1

0 ø

è -2

-1ø

 

 

 

Рассматривая биматричную игру, перейдем сразу к смешанным стратегиям и определим средние выигрыши игроков математическим ожиданием:

H1 ( p, q) = åaij pi q j ,

H2 ( p, q) = åbij pi q j .

(3.2)

i, j

i, j

 

57

Будем

говорить,

что

пара

векторовp0 = (p10 ,K, pm0 )

и

q0 = (q10 ,K, qn0 )

определяют равновесную ситуацию, если при лю-

бых p и

q ,

удовлетворяющих

условиям å pi =1 ,

åqi

=1 ,

0 £ pi ,q j

£ 1, справедливы неравенства:

 

 

H1 ( p, q0 ) £ H1 (p0 , q0 ),

H2 (p0 , q) £ H2 (p0 , q0 ).

(3.3)

Неравенства (3.3)

означают,

что если игрок

отклонится

от равновесной ситуации ( p0 , q0 ), то его выигрыш может только

уменьшиться.

На вопрос о существовании ситуации равновесия отвечает следующая теорема.

Теорема 3.1. (Дж. Нэш). Всякая биматричная игра имеет хотя бы одну равновесную ситуацию (точку равновесия) в смешанных стратегиях.

Остается разрешить проблему нахождения этой ситуации равновесия.

3.2. Биматричные игры 2×2

Рассмотрим биматричную игру 2 ´ 2 :

æ a

a

ö

, B =

æ b

 

b

ö

,

 

 

 

 

 

 

A = ç

11

12

÷

ç

11

12

÷

 

 

 

 

 

 

è

a

21

a

22

ø

 

 

è

b

 

b

ø

 

 

 

 

 

 

 

 

 

 

 

21

22

 

 

 

 

 

 

 

с вероятностями

p1 = p ,

p2

=1 - p , q1 = q , q2 =1 - q .

 

 

Вычислим средние выигрыши игроков

 

 

 

 

H1 ( p, q) =

 

 

 

)

 

 

 

 

 

)

 

 

 

)

 

(3.4)

= a pq + a p 1 - q

+ a

21

1- p

q + a

1- p

1 - q

,

11

 

 

12

(

 

 

 

(

 

 

22 (

)(

 

 

58

H2 ( p, q) =

(3.4’)

= b11 pq + b12 p (1- q )+ b21 (1 - p )q + b22 (1 - p )(1 - q).

Для таких игр оказывается справедливой следующая теорема, позволяющая находить смешанные стратегии.

Теорема 3.2. Выполнение неравенств (3.3):

H1 ( p, q0 ) £ H1 (p0 , q0 ), H2 (p0 , q) £ H2 (p0 , q0 ),

равносильно выполнению следующих неравенств:

ìH1 (0, q0 ) £ H1 ( p0 , q0 ),

ï

(1, q0 )£ H1 ( p0 , q0 ),

ïïH1

í

(3.5)

ïH2

( p0 ,0)£ H2 (p0 , q0 ),

ï

( p0 ,1)£ H2 (p0 , q0 ).

îïH2

Другими словами, чтобы убедиться в том, что пара ( p0 , q0 )

определяет

равновесную ситуацию, достаточно проверить спра-

ведливость

неравенств (3.3) не для всех p Î[0,1] и q Î[0,1],

а только для двух чистых стратегий каждого игрока. Перепишем формулу (3.4) в более удобном виде

H1 ( p,q) = (a11 - a12 - a21 + a22 ) pq +(a12 - a22 ) p +(a21 - a 22 )q + a22 .

Положим здесь p = 0 и p =1:

H1 (1, q) = (a11 - a12 - a21 + a22 )q + a12 + (a21 - a22 )q ,

H1 (0, q ) = (a21 - a22 )q + a22

59

и рассмотрим разности:

H1 ( p, q) - H1 (1, q=) (a11 - a12 - a21 + a22 ) pq + (a12 - a22 p ) -

-(a11 - a12 - a21 + a22 )q + a22 - a12 ,

H1 ( p, q) - H1 (0,= q) (a11

Полагая

ìC = a11 - a12 - a21 + a22 ,

í

îa = a22 - a12 ,

получим

H

1 (

p, q

)

- H

=1, q

)

Cpq

 

 

 

1

(

 

 

= ( p -1)(Cq -a ),

 

H

1 (

p, q

)

- H

1

(

 

)

 

 

 

 

0, q=

Cpq

- a12 - a21 + a22 ) pq + (a12 - a22 p ).

(3.6)

-a p - Cq +a = Cq ( p -1) -a ( p -1) =

-a p p=(Cq -a ) .

Так как в точке равновесия эти разности должны быть неотрицательными, то приходим к следующей системе неравенств:

ì( p -1)(Cq -a ) ³ 0,

ï

íïî p (Cq -a ) ³ 0.

Для H2 ( p, q ) , при обозначениях:

ìD = b11

- b12 - b21

+ b22

,

í

- b21 ,

 

(3.7)

îB = b22

 

 

получаем аналогичным образом:

ì(q -1)(Dp - b ) ³ 0,

ï

íïîq (Dp - b ) ³ 0.

60