
- •5. Теория игр
- •5.1 Понятие об игровых моделях
- •5.1.1. Общие сведения
- •5.1.2. Основные понятия теории игр
- •5.1.3. Платежная матрица. Нижняя и верхняя цена игры
- •5.1.4. Решение игр в смешанных стратегиях
- •5.1.5. Геометрическая интерпретация игры 2х2
- •5.1.6. Приведение матричной игры к задаче линейного программирования
- •5.2. Теория игр. Смешанные стратегии. Решение игр методом линейного программирования
- •5.2.1. Основные понятия теории игр
- •5.2.2. Игра двух лиц с нулевой суммой
- •5.2.3. Решение игры
- •5.2.4. Смешанные стратегии и их свойства
- •5.2.5. Решение матричных игр в смешанных стратегиях путем сведения к паре двойственных задач
- •5.2.6. Этапы решения матричной игры
5.2.3. Решение игры
Задачей теории игр является нахождение решения игры, т. е. определение для каждого игрока его оптимальной стратегии ицены игры.
Оптимальной называется стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш (или минимально возможный средний проигрыш) независимо от поведения противника.Ценой игры называется выигрыш (проигрыш), соответствующий оптимальным стратегиям игроков.
При выборе стратегий можно базироваться на различных принципах. В теории игр наилучшим принято считать поведение игроков, при котором каждый игрок предполагает, что его противник не глупее (так называемый принцип разумности). В результате этого рекомендуется в качестве наилучшей стратегии выбирать ту, которая обеспечивает наибольший гарантированный выигрыш, т. е. выигрыш, не зависящий от действий противника который противник никак не может уменьшить. Элементы риска, а также просчеты и ошибки игроков во внимание не принимаются.
Исходя из указанного принципа, опишем формально действия игроков. Если игрок А выбрал стратегиюi, то его выигрыш составит
,
где минимум берется по всем стратегиям игрока В (по строке платежной матрицы с номером i). Так как по каждой своей стратегии (по каждой строке матрицы) игрок А выбрал гарантированный выигрыш, он среди всех своих стратегий может выбрать такую, которая обеспечит ему максимальный гарантированный выигрыш
.
Стратегия, соответствующая максимальному
значению минимумов строк, называется
максимальной стратегией, а величина- нижней ценой игры, илимаксимином.
Игрок
,
рассуждая аналогично, может среди всех
своих стратегий выбрать ту, которая
обеспечит ему минимальный гарантированный
проигрыш
.
Стратегия, соответствующая минимальному
значению максимумов столбцов, называется
минимаксной стратегией, а величина— верхней ценой игры илиминимаксом.
Если игрок А будет придерживаться максиминной стратегии, то он получит выигрыш не меньше максиминного значения, т. е.
.
Если игрок В придерживается минимаксной стратегии, то его проигрыш будет не больше минимаксного значения, а именно
В общем случае отношение между нижней и верхней ценой игры устанавливается неравенством
.
Существуют игры, для которых
.
Соответствующие этим значениям стратегии
игреков А и В являются оптимальными,
а элемент платежной матрицы, отвечающий
этим стратегиям, называется седловой
точкой. Элемент платежной матрицы,
соответствующий ее седловой точке,
являетсяценой игры. Обозначим
ее через.
Тогда при наличии седловой точки имеет
место равенство
.
Если
,
игра выгодна игрокуА. При
игра выгодна игроку В. В случае
игра выгодна обоим игрокам и называетсябезобидной илисправедливой.
Пример 5.2.3.1.В табл.5.2.3.1 дан пример игры и ее решение. В данной игре каждый из двух игроков располагает четырьмя стратегиями и не имеет информации о том, какую стратегию применит противник.
В первую очередь в каждой строке платежной
матрицы берем минимальные элементы ()
и запишем их в последний столбец табл.
2, а в каждом столбце - максимальные (
)
и запишем их в последнюю строку той же
таблицы.
Затем определяется нижняя и верхняя
цена игры путем выбора максимального
элемента в последнем столбце таблицы
и минимального - в последней строке. В
данном примере
.
Следовательно, платежная матрица имеет
седловую точку и оптимальными для
игроков являются чистые стратегии А2и В2. Цена игры
.
Таблица 5.2.3.1
|
|
|
|
|
|
|
6 |
4 |
3 |
4 |
|
|
12 |
7 |
10 |
9 |
|
|
6 |
6 |
4 |
9 |
|
|
12 |
3 |
12 |
7 |
|
|
|
|
|
|
|
Это означает, что если игрок А будет придерживаться своей оптимальной стратегий А2, он выиграет не менее 7, но может выиграть и больше, если игрок В отклонится от своей оптимальной стратегии В2. Аналогично, если игрок В придерживается своей оптимальной стратегии В2, он проиграет не более 7, но может проиграть и меньше, если игрок А выберет одну из стратегий А1, А3или А4.
Игры с седловой точкой решаются в чистых
стратегиях, и процесс решения не
представляет особой сложности. Существуют
игры, в которых платежная матрица
имеет более одной седловой точки.
Доказано, что все эти точки дают одно и
то же значение цены
,
хотя соответствуют различным парам
оптимальных стратегий.
Если седловая точка платежной матрицы отсутствует, игра решается в смешанных стратегиях.
Рассмотрим такую платежную матрицу, которая не имеет седловой точки.
Пример 5.2.3.2. Два банка А и В осуществляют капитальные вложения в пять строительных объектов. С учетом особенностей вкладов и местных условий прибыль банка А в зависимости от объема финансирования выражается элементами платежной матрицы А. Для упрощения задачи принять, что убыток банка В равен прибыли банка А. Найти решение матричной игры в чистых стратегиях, если оно существует.
Решение.Обозначим чистые стратегии
банков А и В соответственно через А1,
А2, А3, А4, А5 и В1,
В2, В3, В4, В5.
Предположим, что банк А располагает
общей суммойатыс. ден. ед., отпускаемой
на строительство пяти объектов. Аналогично
и банк В имеет суммуbтыс. ден. ед.,
отпускаемую на строительство тех же
пяти объектов. Тогда чистая стратегия− это выделение
тыс.
ден. ед. банком А на строительствоi-го
объекта,
.
Общая сумма средств, выделяемых на
строительство пяти объектов: а = а1 +
а2 + а3 + а4 + а5.
Аналогично определяются чистые стратегии
и для банка В:
−
это выделение
тыс. ден. ед. банком В на строительствоj-го объекта,
,
а общая сумма средств, выделяемых на
строительство пяти объектов: b = b1 +
b2 + b3 + b4 + b5.
Сведем исходные данные в табл. 5.2.3.2.
Таблица 5.2.3.2.
|
|
|
|
|
|
|
|
-2 |
3 |
-1 |
1 |
4 |
|
|
-1 |
4 |
-2 |
2 |
3 |
|
|
7 |
0 |
1 |
-1 |
0 |
|
|
-1 |
3 |
0 |
3 |
4 |
|
|
6 |
-1 |
1 |
-1 |
-1 |
|
|
|
|
|
|
|
|
Проверим, имеет ли игра решение в чистых
стратегиях. Для этого в каждой строке
платежной матрицы, записанной в табл.
5.2.3.2, найдем минимальное число и впишем
его значение в соответствующую строку
последнего столбца. В полученном столбце
найдем максимальный элемент (максимин):
–1,
называемый нижней ценой игры. Он является
гарантированной (минимальной) прибылью,
которую может обеспечить себе банк А
при любых стратегиях
банка В.
В каждом столбце найдем максимальное
значение элементов платежной матрицы
и впишем его в соответствующие столбцы
последней строки. В полученной строке
найдем минимальный элемент (минимакс):
1,
называемый верхней ценой игры. Он
показывает максимальный убыток, который
может получить банк В при любых
стратегиях
банка
А.
Так как
–1
≠ 1
, то игра неразрешима в чистых стратегиях
(игра не имеет седловой точки). Значит,
мы можем только заключить, что цена игры
–1 ≤
≤ 1. В следующем разделе будет изложим
метод решения данной задачи.