- •Введение
- •1.1. Задачи теории игр в экономике
- •1.2. Конфликты и теория игр
- •1.3. Основные понятия и классификация видов игр
- •2.1. Примеры матричных игр
- •2.2. Равновесная ситуация
- •2.3. Смешанные стратегии
- •2.4. Решение матричной игры 2×2
- •2.5. Матричные игры 2×n
- •2.7. Матричные игры m×n
- •2.7.1. Доминирование стратегий
- •2.7.2. Аффинное правило
- •2.7.3. Итерационный метод решения матричных игр
- •3.1. Основные понятия и ситуация равновесия
- •3.2. Биматричные игры 2×2
- •3.3. Поиск равновесных ситуаций
- •3.4. Кооперативные игры
- •4. Игры с природой
- •4.3. Принятие решений в условиях риска
- •Критерий Байеса относительно выигрышей
- •Критерий Байеса относительно рисков
- •Критерий Лапласа относительно выигрышей
- •Критерий Байеса относительных значений вероятностей состояний природы с учетом выигрышей
- •4.4. О планировании эксперимента в играх с природой
- •4.5. Выбор решений с помощью дерева решений
- •Литература
3.БИМАТРИЧНЫЕ ИГРЫ
3.1.Основные понятия и ситуация равновесия
Вматричной игре интересы двух игроков были прямо противоположны, то есть речь шла об антагонистической игре. Однако гораздо чаще встречаются ситуации, в которых интересы игроков хотя и не совпадают, но не обязательно являются противоположным.
Рассмотрим конфликтную ситуацию, в которой два игрока имеют следующие возможности для выбора своей линии поведения:
а) 1-й |
|
игрок |
может |
выбрать |
любую |
из |
стратегий |
|||||
A1 , A2 , K, Am ; |
|
|
|
|
|
|
|
|
|
|
||
б) 2-й игрок — любую из стратегий B1 , B2 |
, K, Bn . |
|
|
|||||||||
При этом в ситуации {Ai ; Bj } |
выигрыш первого игрока будет |
|||||||||||
равен aij , а второго — bij |
, причем, вообще говоря bij ¹ aij . |
|
|
|||||||||
Тогда получаем две платежные матрицы размерности m ´ n : |
|
|||||||||||
æ a11 |
a12 |
K a1n ö |
æ b11 |
b12 |
K b1n |
ö |
|
|
||||
ç a |
|
a |
|
K a |
÷ |
ç b |
b |
K b |
÷ |
(3.1) |
|
|
A = ç |
21 |
|
22 |
|
|
2n ÷ и B = ç 21 |
22 |
2n |
÷ . |
|
||
ç K K K K ÷ |
ç K K K K ÷ |
|
|
|||||||||
ç |
|
am 2 |
|
|
÷ |
ç |
bm2 |
|
÷ |
|
|
|
è am1 |
K amn ø |
èbm1 |
K bmn ø |
|
|
Здесь A — платежная матрица первого игрока, B — платежная матрица второго игрока.
В этом случае говорят, что речь идет о биматричной игре двух игроков с платежными матрицами (3.1).
Отметим, что при bij = -aij получаем обычную матричную
игру.
Рассмотрим один пример биматричной игры.
56
№ 3.1. Преподаватель – Студент. Студент (1-й игрок) гото-
вится к зачету, который |
принимает преподаватель(2-й игрок). |
||||||
У студента |
есть две стратегииA1 — подготовиться к зачету, |
||||||
A2 — не готовиться. У преподавателя есть две стратегии: B1 по- |
|||||||
ставить зачет и B2 |
— не поставить зачет. Постройте платежные |
||||||
матрицы игры. |
|
|
|
|
|
|
|
Решение. В основу значений функции выигрыша положим |
|||||||
следующие качественные соображения: |
|
|
|
||||
|
|
|
|
|
|
|
|
Выигрыш |
|
|
Сдал зачет |
Не сдал зачет |
|
|
|
студента |
|
|
|
||||
|
|
|
|
|
|
||
|
|
|
|
|
|
||
Готовился к зачету |
|
|
оценка заслужена |
очень обидно |
|
||
|
|
|
|
|
|||
Не готовился к зачету |
|
удалось обмануть |
оценка заслужена |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Выигрыш |
|
|
Поставил зачет |
Не поставил зачет |
|
|
|
преподавателя |
|
|
|
||||
|
|
|
|
|
|
||
|
|
|
|
|
|
||
Готовился к зачету |
|
|
все нормально |
был не прав |
|
||
|
|
|
|
|
|||
Не готовился к зачету |
|
дал себя обмануть |
опять придет |
|
|
||
|
|
|
|
|
|||
Количественно выигрыши игроков можно выразить, например, |
|||||||
как |
|
|
|
|
|
|
|
æ 2 |
-1ö |
æ 1 |
-3ö |
|
|
|
|
A = ç |
÷ , B |
= ç |
|
÷ . |
|
|
|
è1 |
0 ø |
è -2 |
-1ø |
|
|
|
Рассматривая биматричную игру, перейдем сразу к смешанным стратегиям и определим средние выигрыши игроков математическим ожиданием:
H1 ( p, q) = åaij pi q j , |
H2 ( p, q) = åbij pi q j . |
(3.2) |
i, j |
i, j |
|
57
Будем |
говорить, |
что |
пара |
векторовp0 = (p10 ,K, pm0 ) |
и |
||
q0 = (q10 ,K, qn0 ) |
определяют равновесную ситуацию, если при лю- |
||||||
бых p и |
q , |
удовлетворяющих |
условиям å pi =1 , |
åqi |
=1 , |
||
0 £ pi ,q j |
£ 1, справедливы неравенства: |
|
|
||||
H1 ( p, q0 ) £ H1 (p0 , q0 ), |
H2 (p0 , q) £ H2 (p0 , q0 ). |
(3.3) |
|||||
Неравенства (3.3) |
означают, |
что если игрок |
отклонится |
от равновесной ситуации ( p0 , q0 ), то его выигрыш может только
уменьшиться.
На вопрос о существовании ситуации равновесия отвечает следующая теорема.
Теорема 3.1. (Дж. Нэш). Всякая биматричная игра имеет хотя бы одну равновесную ситуацию (точку равновесия) в смешанных стратегиях.
Остается разрешить проблему нахождения этой ситуации равновесия.
3.2. Биматричные игры 2×2
Рассмотрим биматричную игру 2 ´ 2 :
æ a |
a |
ö |
, B = |
æ b |
|
b |
ö |
, |
|
|
|
|
|
|
|||||
A = ç |
11 |
12 |
÷ |
ç |
11 |
12 |
÷ |
|
|
|
|
|
|
||||||
è |
a |
21 |
a |
22 |
ø |
|
|
è |
b |
|
b |
ø |
|
|
|
|
|
|
|
|
|
|
|
21 |
22 |
|
|
|
|
|
|
|
|||||||
с вероятностями |
p1 = p , |
p2 |
=1 - p , q1 = q , q2 =1 - q . |
|
|
||||||||||||||
Вычислим средние выигрыши игроков |
|
|
|
|
|||||||||||||||
H1 ( p, q) = |
|
|
|
) |
|
|
|
|
|
) |
|
|
|
) |
|
(3.4) |
|||
= a pq + a p 1 - q |
+ a |
21 |
1- p |
q + a |
1- p |
1 - q |
, |
||||||||||||
11 |
|
|
12 |
( |
|
|
|
( |
|
|
22 ( |
)( |
|
|
58
H2 ( p, q) =
(3.4’)
= b11 pq + b12 p (1- q )+ b21 (1 - p )q + b22 (1 - p )(1 - q).
Для таких игр оказывается справедливой следующая теорема, позволяющая находить смешанные стратегии.
Теорема 3.2. Выполнение неравенств (3.3):
H1 ( p, q0 ) £ H1 (p0 , q0 ), H2 (p0 , q) £ H2 (p0 , q0 ),
равносильно выполнению следующих неравенств:
ìH1 (0, q0 ) £ H1 ( p0 , q0 ), |
|
ï |
(1, q0 )£ H1 ( p0 , q0 ), |
ïïH1 |
|
í |
(3.5) |
ïH2 |
( p0 ,0)£ H2 (p0 , q0 ), |
ï |
( p0 ,1)£ H2 (p0 , q0 ). |
îïH2 |
Другими словами, чтобы убедиться в том, что пара ( p0 , q0 )
определяет |
равновесную ситуацию, достаточно проверить спра- |
ведливость |
неравенств (3.3) не для всех p Î[0,1] и q Î[0,1], |
а только для двух чистых стратегий каждого игрока. Перепишем формулу (3.4) в более удобном виде
H1 ( p,q) = (a11 - a12 - a21 + a22 ) pq +(a12 - a22 ) p +(a21 - a 22 )q + a22 .
Положим здесь p = 0 и p =1:
H1 (1, q) = (a11 - a12 - a21 + a22 )q + a12 + (a21 - a22 )q ,
H1 (0, q ) = (a21 - a22 )q + a22
59
и рассмотрим разности:
H1 ( p, q) - H1 (1, q=) (a11 - a12 - a21 + a22 ) pq + (a12 - a22 p ) -
-(a11 - a12 - a21 + a22 )q + a22 - a12 ,
H1 ( p, q) - H1 (0,= q) (a11
Полагая
ìC = a11 - a12 - a21 + a22 ,
í
îa = a22 - a12 ,
получим
H |
1 ( |
p, q |
) |
- H |
=1, q |
) |
Cpq |
||
|
|
|
1 |
( |
|
|
|||
= ( p -1)(Cq -a ), |
|
||||||||
H |
1 ( |
p, q |
) |
- H |
1 |
( |
|
) |
|
|
|
|
|
0, q= |
Cpq |
- a12 - a21 + a22 ) pq + (a12 - a22 p ).
(3.6)
-a p - Cq +a = Cq ( p -1) -a ( p -1) =
-a p p=(Cq -a ) .
Так как в точке равновесия эти разности должны быть неотрицательными, то приходим к следующей системе неравенств:
ì( p -1)(Cq -a ) ³ 0,
ï
íïî p (Cq -a ) ³ 0.
Для H2 ( p, q ) , при обозначениях:
ìD = b11 |
- b12 - b21 |
+ b22 |
, |
í |
- b21 , |
|
(3.7) |
îB = b22 |
|
|
получаем аналогичным образом:
ì(q -1)(Dp - b ) ³ 0,
ï
íïîq (Dp - b ) ³ 0.
60