В. А.МАТВЕЕВ
.pdfРассмотрим ситуации, составленные из выделенных стратегий первогоивторогоигроков. Каждойизнихбудетсоответствоватьнабор чистых стратегий, как объединение соответствующих чистых стратегий игроков для этой ситуации. Тогда ситуация будет равновесием по Нэшу тогда и только тогда, когда ей будет соответствовать полный набор всех чистых стратегий в игре. Действительно, в этом случае каждая чистая стратегия либо не используетсявравновесии, либоявляетсянаилучшимчистымответом на выбор другого игрока. Такая ситуация и является равновесной.
Вданнойигревыделенопятьстратегийпервогоигрокаичетыре стратегии у второго. Тогда рассматривается20 ситуаций. Три из них подходят под условие равновесия по Нэшу. Действительно,
(x*, y*) = (X 5,Y 1 ) = ((0,0,1),(1,0)) →((1,2,4); (3,5));
(x o, yo ) = (X 4 ,Y 2 ) = ((0, 1 |
3 |
, 2 |
3 |
),( 2 |
3 |
, 1 |
3 |
)) →((1,4,5); (2,3)); |
||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||
(x , y ) = (X 2 ,Y 3 ) |
= (( 2 |
3 |
, |
1 |
3 |
,0),( |
1 |
3 |
, 2 |
3 |
)) →((3,4,5); (1,2)). |
|||||
|
|
|
|
|
|
|
|
|
|
|
||||||
Отметим, что |
ситуация (x*, y*) = ((0,0,1),(1,0)) , как |
равновесие по Нэшу, была выявлена вначале по определению 3.1 или замечанию 3.1. Вычислим выигрыши игроков в равновесных ситуациях
f * (x*, y*) = ( f1* , |
f2* ) = (x*T A y* , |
x*T B y* ) = (3, |
4); |
|
||||
f o (xo , |
yo ) = ( f1o , |
f2o ) = (xoT A yo , xoT B yo ) = (3, 2 |
2 |
); |
||||
3 |
||||||||
|
|
|
|
|
|
|
||
f (x , |
y ) = ( f1 , |
f2 ) = (x T A y , |
x T B y ) = (4, |
|
2 |
). |
||
3 |
||||||||
|
|
|
|
|
|
Таким образом в рассмотренном примере имеется три равновесия по Нэшу.
Ответ: X *×Y* = (x*, y*) U(xo , yo ) U(x , y ); (x*, y*) = ((0,0,1), (1,0)); f * = ((3, 4);
141
(xo , yo ) = ((0, |
1 |
3 |
, 2 |
3 |
),(2 |
3 |
, |
1 |
3 |
)); |
f o = ((3, 2 2 |
3 |
); |
|||||
|
|
|
|
|
|
|
|
|
|
|
||||||||
(x , y ) = ((2 |
3 |
, |
1 |
3 |
,0),( |
1 |
3 |
, 2 |
3 |
)); |
f = ((4, 2 |
3 |
). |
|||||
|
|
|
|
|
|
|
|
|
|
|
Пример 16.2. Решить биматричную игру, используя алгоритм Лемке - Хаусона
|
6 |
0 |
2 |
|
|
6 |
0 |
7 |
|
|
0 |
4 |
3 |
|
|
0 |
4 |
0 |
|
A = |
, |
B = |
. |
||||||
|
7 |
0 |
0 |
|
|
2 |
3 |
0 |
|
|
|
|
|
В игре у игроков нет доминируемых стратегий. Но здесь имеется 9 ситуаций в чистых стратегиях и одна удовлетворяет определению равновесия по Нэшу (3.1). Это ситуация
(x*, y*) = ((0, 1, 0), (0,1, 0)) X×Y; f(x*, y*) = (4, 4).
В игре возможны и другие решения. Выделим их по алгоритму Лемке – Хаусона.
В рассматриваемой задаче матрица B является
транспонированные для матрицы А, т.е. АT = В. В такой игре равновесная ситуация состоят из одинаковых стратегии первого и второго игрока. Поэтому рассмотрим игру с позиций первого игрока, для второго игрока рассуждения аналогичны.
Множество смешанных стратегий первого игрока представлено на рисунке 16.4. Это множество является
фундаментальным симплексом в пространстве R3 . Каждой
смешанной стратегии первого игрока поставим в соответствие выбранные чистые стратегии первого и второго игроков. Чистые стратегии первого игрока будем отмечать 1 ,2 ,3 , а чистые стратегии второго игрока отметим 4,5,6.
Каждой смешанной стратегии первого игрока соответствуют, во-первых, чистые стратегии первого игрока, что в этой смешанной стратегии используются с вероятностью 0, вовторых, чистые стратегии второго игрока, что являются лучшими ответами на это действие первого. Так как биматричная игра невырожденная, то каждой смешанной стратегии первого игрока
142
в итоге будет соответствовать не более, чем три чистые стратегии (первого и второго игроков).
Для нахождений наилучших чистых ответов второго игрока рассмотрим его варианты выбора в зависимости от смешанной стратегии первого
x 3
K
A
|
|
1 |
|
2 |
G |
x 2 |
|
|
O |
||
B |
F |
E |
|
|
H |
3 D |
|
x1 C |
|
Рис. 16.4. |
|
|
|
|
|
|
|
|
|
|
|
6 |
0 |
7 |
|
|
xT B = (x1 , x2 , 1− x1 |
|
|
|
|
|
|
− x2 ) |
0 |
4 |
0 |
|
= |
|
|
|
2 |
3 |
0 |
|
(16.3) |
|
|
|
(2 + 4x1 − 2x2 , 3 −3x1 + x2 , 7x1 ).
|
Каждая стратегия первого игрока однозначно соответствует |
||||||||
паре |
параметров |
(x , x |
2 |
) R2 , x |
i |
≥ 0,i =1,2, x |
+x |
2 |
≤ 0. |
|
|
1 |
|
1 |
|
|
Пространствостратегий (x1 , x2 ) R2 представленонарисунке16.5. Длянахождениялучшихответоввторогоигрока рассмотримфункции
143
f1 = 2 + x1 − 2x2 , f2 = 3 −3x1 + x2 ,
f3 = 7x1.
Эти функции получены в (16.3). Выберем те стратегии первого игрока, на которые второй игрок ответит выбором своей первой, второй или третьей чистой стратегии. Соответствующие условия и преобразования приведены в таблице 16.1.
Таблица 16.1.
На рисунке16.5 в пространствепараметров выделены области и в них указаны наилучшие выборы второго игрока. На этой области отмеченыточки, которымпоставленывсоответствиедвалучшихответа
второгоигрока. Укажемнарисунке16.5 тезначенияпараметра(значит, стратегии) укоторых вероятность выбора i – ой чистой стратегии (i = 1, 2, 3) равна0. Этичистыестратегиитакжеотмеченынарисунке16.5. Здесь выбранные чистые стратегии первого игрока представлены соответственно1,2,3, аувторогоигрокастратегииотмечены, как 4,5,6.
Выберем те стратегии первого игрока, которым соответствуют три чистые стратегии (первого и второго игроков). Эти стратегии, точнее соответствующие им точки в пространстве параметров, указаны на рисунке 16.5. Это точки А, B, C, D, F. У выделенных точек отмечены два соответствующие параметра. По ним найдём
координаты этих точек в пространстве R3 .
Таким образом, получаем
144
|
A( 1 |
7 |
,0, 6 |
7 |
),→(2,4,5); |
|
||||||
|
|
|
|
|
|
|
|
|
|
|||
x 2 |
E |
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 D |
|
|
|
|
||
|
|
|
|
|
|
|
|
6 H |
|
|
||
|
|
|
5 |
|
|
|
F |
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
|
4 |
|
|
|
|
|
|
A |
|
|
G |
|
|
|
B |
C |
|||
0 |
|
1 |
|
|
3 |
|
|
|
2 |
1 |
x1 |
|
7 |
|
|
3 |
|||||||||
|
10 |
|
|
Рис. 16.5.
B(2 3 ,0, 13),→ (2,4,6);
C(1,0,0),→(2,3,6);
D(411, 711,0),→(3,5,6);
E(0,1,0),→(1,3,5);
F(8 |
23 |
,11 |
23 |
, 4 ),→ (4,5,6). (16.4) |
|
|
23 |
Так как матрица BT = A, то рассуждения для второго игрока будут дословно повторять рассуждения с позиции первого игрока.
Выберем те стратегии второго игрока, которым соответствуют три чистые стратегии (первого и второго игроков). Эти стратегии, точнеесоответствующиеимточки впространствепараметров, будут
145
те же, что у первого игрока на рисунке 16.4. По ним найдём координаты этих точек в пространстве R3 . Для обозначения этих
точек будем использовать штрихи.
Каждой такой точке поставим в соответствие, во-первых, чистые стратегии второго игрока, что в этой смешанной стратегии используются с вероятностью 0, во-вторых, чистые стратегии первого игрока, что являются лучшими ответами на это действие второго. Из приведённых слов следует, что соответствующие чистые стратегии можно получить из (16.4), поменяв в обозначениях x и y соответственно местами. Это является следствием взаимной транспонированности матриц А, В. Итак, получаем
A'( 17 ,0, 6 7) →(1,2,5);
B'(2 |
3 |
,0, 1 |
3 |
) → (1,3,5); |
||||||
|
|
|
|
|
|
|
|
|
||
C'(1,0,0) |
→ (3,5,6); |
|
||||||||
D'(4 |
11 |
, 7 |
11 |
,0) →(2,3,6); |
||||||
|
|
|
|
|
|
|
||||
E'(0,1,0) |
→(2,4,6); |
|
||||||||
F'(8 |
23 |
,11 |
23 |
, 4 |
) → |
(1,2,3). (16.5) |
||||
|
|
|
|
|
23 |
|
Рассмотрим ситуации, составленные из выделенных стратегий первого и второго игроков. Каждой из них будет соответствовать набор чистых стратегий, как объединение соответствующих чистых стратегий игроков для этой ситуации. Тогда ситуация будет равновесием по Нэшу тогда и только тогда, когда ей будет соответствовать полный набор всех чистых стратегий в игре.
В данной игре выделено по шесть стратегий для первого и второго игроков. Тогда рассматривается 36 ситуаций. Три из них подходят под условие равновесия по Нэшу. Действительно,
(x*, y*) = (E, E') = ((0,1,0),(0,1,0)) →((1,3,5,);(2,4,6));
146
(xo , yo ) = (B, B') = ((23 ,0, 13),(23 ,0, 13)) →
((2,4,6);(1,3,5));
(x , y ) = (F, F') = ((8 23,1123, 4 23),(8 23,1123, 4 23)) →
((4,5,6);(1,2,3));
Отметим, что ситуация(x*, y*) = ((0,1,0),(0,1,0)) , как равновесие
по Нэшу, была выявлена вначале по определению 3.1 или замечанию 3.1. Вычислим выигрыши игроков в равновесных ситуациях
f * (x*, y*) = ( f1* , f2* ) = (x*T |
A y* , x*T B y* ) = (4, |
4); |
|||||||
f o (xo , yo ) = ( f1o , f2o ) = (xoT A yo , xoT B yo ) = (4 |
2 |
, 4 |
2 |
); |
|||||
3 |
|
||||||||
|
|
|
|
|
|
3 |
|
||
f (x , y ) = ( f1 , f2 ) = (x T A y , x T B y ) = |
|||||||||
(2 |
10 |
, 2 |
10 |
). |
|
|
|
|
|
|
23 |
|
|
|
|
|
|||
23 |
|
|
|
|
|
|
|
Таким образом в рассмотренном примере имеется три равновесия по Нэшу.
Ответ: X *×Y* = (x*, y*) U(xo , yo ) U(x , y ); |
|
|
|||||||||||
(x*, y*) = ((0,1,0),(0,1,0)); f * = ((4, |
4); |
|
|
||||||||||
(xo , yo ) = ((2 |
3 |
,0, 1 |
3 |
),(2 |
3 |
, 1 |
3 |
)); f o = ((4 |
2 |
, 4 |
2 |
); |
|
3 |
3 |
||||||||||||
|
|
|
|
|
|
|
(x , y ) = ((8 23,1123, 4 23),(8 23,1123, 4 23)); f = ((2 1023 , 2 1023).
Задачи для самостоятельного решения
147
Задача 14.1. Решить биматричную игру, заданной матрицами выигрыша первого игрока и второго игрока, используя алгоритм Лемке – Хаусона
|
|
|
1 |
2 |
3 |
|
1 |
|
0 |
2 |
|||||
a) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(А, В) = ( |
3 |
2 |
1 |
, |
|
|
0 |
|
3 |
); |
|||||
|
|
|
|
|
|
|
|
1 |
|||||||
|
|
3 8 −1 1 3 4 |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
б) |
(C, D) = |
( |
4 |
0 |
2 |
, |
|
2 |
|
1 |
8 |
); |
|||
|
|
|
1 |
2 |
3 |
|
|
|
2 |
|
3 |
0 |
|
||
|
|
|
|
|
|
|
|
||||||||
|
|
3 |
2 |
1 |
|
|
2 |
|
|
3 |
1 |
|
|
||
|
|
|
3 |
3 |
1 |
|
|
|
2 |
|
|
2 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
( |
1 |
1 2 |
, |
|
3 |
3 1 |
). |
||||||
с) |
(E, F) = |
|
|
3 |
2 |
|
|
|
|
|
|
1 |
1 |
|
|
3 |
|
|
2 |
|
|
|
|
||||||||
|
|
|
3 |
2 |
3 |
|
|
|
3 |
|
|
1 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
148
ЗАДАНИЯ
ДЛЯ
САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ
149
Задание 1. Графоаналитическим методом найти цену и седловую точку матричной игры, заданную матрицей выигрышей первого игрока.
150