
- •Министерство науки и образования российской федерации
- •Содержание
- •1. Основные понятия теории игр.
- •2. Математическая модель игры.
- •3. Игры с природой
- •4. Биматричные игры
- •4.1. Примеры биматричных игр
- •4.2. Смешанные стратегии
- •4.3. 2 2 - Биматричные игры. Ситуация равновесия
- •4.4. Поиск равновесных ситуаций
- •4.5. Некоторые итоги
- •5. Понятие коалиционных игр.
- •Примеры
- •Пример 2
- •Задания и задачи
- •Рекомендуемые темы рефератов
- •Вопросы для подготовки к зачету
- •Список рекомендуемой литературы
- •1. Моделирование задачи оптимизации методами линейного программирования.
- •2. Геометрическая интерпретация задачи линейного программирования.
- •3. Общая задача линейного программирования.
- •6. Двойственная задача линейного программирования.
4.4. Поиск равновесных ситуаций
Геометрический смысл условий (6) рассмотрим на примерах описанных выше биматричных игр.
Борьба за рынки
Напомним, что ситуация, сложившаяся в этой задаче, задается платежными матрицами следующего вида:
А= , В= .
Заменяя в неравенствах (6) величины С, , D и их конкретными значениями
С= -10 -2-1-1= -14, = -l-2= -3, D= 5+2+1+1= 9, = 1+1= 2,
получаем
(l) (p-l) (-14q-(-3)) 0, (r) (q-l) (9p-2) 0,
р(-14q-(-3)) 0, q(9p-2) 0.
Рассмотрим сначала левую пару неравенств (l):
(p-l)(-14q +3) 0, р(-14q+3) 0.
Возможны следующие три случая:
1)р=1, 2)р=0, 3) 0<р<1.
Рассмотрим каждый из этих случаев подробно.
1. Полагая р = 1, получаем
00, -14q +30.
Отсюда q 3/14.
2. Полагая р= 0, получаем
00, -(-14q +3) 0, 00, откуда
14q -30
и, значит, q 3/14.
3. Наконец, положив 0 < р < 1, получим
-14q+30,
-14q+3 0,
что возможно лишь в случае, если
-14q+3=0,
т. е. q = 3/14.
Перенесем теперь полученные результаты на чертеж. Введем на плоскости прямоугольную систему координат (р, q) и выделим на ней единичный квадрат, соответствующий неравенствам 0 р 1, 0 q l, (рис.2).
Нанесем на этот чертеж то множество точек, которое описывается условиями 1, 2 и 3. Это множество на рис. 3 выделено жирной линией и состоит из трех прямолинейных участков – двух вертикальных лучей и одного горизонтального отрезка – и представляет собой "зигзаг".
Теперь обратимся к правой части неравенств (r):
(q-l) (9p-2) 0, q(9p-2) 0.
Три интересных для нас случая:
1) q=1, 2) q = 0, 3) 0 < q < 1
приводят к следующему результату:
1°. q =1, p 2/9,
2°. q =0, p 2/9,
3°. 0 < q < 1, р=2/9.
Перенося его на чертеж, получим второй "зигзаг", но уже горизонтальный.
Теперь остается только объединить полученное на рис. 4. Общая точка построенных зигзагов – точка равновесия – имеет координаты
Рис.4
Соответствующие смешанные стратегии игроков имеют следующий вид:
Р=
,
Q=
,
а средние выигрыши игроков таковы:
HA
=
,
HB
=
.
Дилемма узников
Выигрыши игроков А и В описываются соответствующими матрицами выплат:
А=
,
В=
.
Проведем необходимые вычисления. Имеем:
С= –1– (–9) – 0+(–6)=2, = –6– (–9)=3,
D = –1 – 0 – (–9) + (–6) =2, = –6 – (–9) = 3.
Отсюда
(l) (p-l) (2q-3) 0, (r) (q-l) (2p-3) 0,
р(2q-3) 0, q(2p-3) 0.
и тогда получаем, что
1l. p =1, q 3/2, 2l. p =0, q 3/2, 3l. 0 < p < 1, q=3/2;
1r. q =1, p 3/2, 2r. q =0, p 3/2, 3r. 0 < q < 1, р=3/2.
Полученные зигзаги изображены на рис. 5.
3/2
1
0 1 3/2
Рис. 5
Единственная равновесная ситуация – (0,0). Это ситуация, в которой каждый из игроков выбирает вторую чистую стратегию – сознаться – и его потери составляют 6.
Как мы уже отмечали ранее, отклонение от ситуации равновесия одного из игроков не дает ему никаких преимуществ. Однако при одновременном отклонении обоих каждый из них может получить больший выигрыш, нежели в равновесной ситуации. Например, в ситуации (1,1), когда оба игрока выбирают первую чистую стратегию – молчать, каждый из них теряет лишь 1.
Напомним, что по условию задачи сговор (создание коалиции) между игроками недопустим.
Совершенно ясно, однако, что в рассматриваемых обстоятельствах ситуация (1,1) неустойчива – любой из узников, изменяя свою стратегию, увеличивает свой выигрыш (избегает наказания).
Семейный спор
Выигрыши игроков А и В в этой биматричной игре задаются так:
А=
,
В=
.
Проводя необходимые вычисления:
С= 2– 0 – 0+1=3, = 1– 0=1,
D = 1 – 0 – 0 + 2 =3, = 2 – 0 = 2
и рассуждения:
(l) (p-l) (3q-1) 0, (r) (q-l) (3p-2) 0,
р(3q-1) 0, q(3p-2) 0,
получаем, что
1l. p =1, q 1/3, 2l. p =0, q 1/3, 3l. 0 < p < 1, q=1/3;
1r. q =1, p 2/3, 2r. q =0, p 2/3, 3r. 0 < q < 1, р=2/3.
Геометрически полученный результат изображен на рис. 6.
Данная игра имеет три точки равновесия. Две из них отвечают чистым стратегиям игроков:
р=1, q =1: HA(1, 1)=2, HВ(1, 1)=1,
р=0, q =0: HA(0, 0)=1, HВ(0, 0)=2,
Рис. 6
одна — смешанной:
HA
=
,
HB
=
.
В полученных результатах больше вопросов, чем ответов.
Ситуации (1,1) и (0,0) означают одновременный выбор игроками первых или соответственно вторых стратегий, т. е. определенную договоренность о совместных действиях.
Однако в данном случае есть еще одна ситуация равновесия, состоящая в выборе игроками вполне определенных смешанных стратегий. В ней оба игрока получают одинаковые выигрыши, правда, меньшие тех, которые давали две другие равновесные ситуации.
Какой же из этих трех ситуаций равновесия следует отдать предпочтение?
Если бы игроки договорились выбрать одновременно, скажем, первую чистую стратегию, причем игрок А за получение большего выигрыша, чем игрок В, заплатил бы ему 1/2, то выигрыш каждым полутора единиц можно было бы считать и выгодным, и справедливым. Однако в рамках теории бескоалиционных игр такого рода дележи не рассматриваются.
Студент - преподаватель
Наконец, обратимся к последнему из приведенных выше примеров биматричных игр – студент-преподаватель. Ожидания каждого из них относительно результатов общения в матричном виде выглядят следующим образом;
А=
,
В=
.
Проводя необходимые вычисления:
С= 2+ 1 – 1+0=2, = 0+ 1=1,
D = 1 +3+2 – 1 =5, = – 1+2 = 1
и рассуждения:
(l) (p-l) (2q-1) 0, (r) (q-l) (5p-1) 0,
р(2q-1) 0, q(5p-1) 0,
получаем, что
1l. p =1, q 1/2, 2l. p =0, q 1/2, 3l. 0 < p < 1, q=1/2;
1r. q =1, p 1/5, 2r. q =0, p 1/5, 3r. 0 < q < 1, р=1/5.
Рис. 7
Число точек пересечения у зигзагов (равновесных ситуаций) равно трем.
Две из них отвечают чистым стратегиям игроков:
р=1, q =1: HA(1, 1)=2, HВ(1, 1)=1,
р=0, q =0: HA(0, 0)=0, HВ(0, 0)= -1,
одна – смешанной:
HA
=
,
HB
=
.
В данной задаче в отличие от предыдущей все довольно ясно, наилучшим является выбор каждым из игроков первой чистой стратегии – хорошо подготовиться к зачету и поставить зачет.
Как нетрудно заметить, тем самым в этой задаче реализуется весьма редкая возможность, когда функции выигрыша каждого из игроков достигают своих максимумов одновременно.
Выгодность такой ситуации совершенно ясна. Ее устойчивость также вполне очевидна: любое отклонение от ситуации (1,1) одного из игроков или обоих игроков может привести разве что к уменьшению их выигрышей.