Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
124
Добавлен:
20.06.2014
Размер:
1.15 Mб
Скачать

5.2.3. Решение игры

Задачей теории игр является нахож­дение решения игры, т. е. оп­ределение для каждого игрока его оптимальной стратегии ицены игры.

Оптимальной называется стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально воз­можный средний выигрыш (или минимально возможный средний проигрыш) независимо от поведения противника.Ценой игры на­зывается выигрыш (проигрыш), соответствующий оптимальным стратегиям игроков.

При выборе стратегий можно базироваться на различных принципах. В теории игр наилучшим принято считать поведение игроков, при котором каждый игрок предполагает, что его противник не глупее (так называемый принцип разумности). В результате этого рекомендуется в качестве наилучшей стратегии выбирать ту, которая обеспечивает наибольший гарантированный выигрыш, т. е. выигрыш, не зависящий от действий противника который противник никак не может уменьшить. Элементы риска, а также просчеты и ошибки игроков во внимание не принимаются.

Исходя из указанного принципа, опишем формально действия игроков. Если игрок А выбрал стратегиюi, то его выигрыш сос­тавит

,

где минимум берется по всем стратегиям игрока В (по строке платежной матрицы с номером i). Так как по каждой своей стратегии (по каждой строке матрицы) игрок А выбрал гарантированный выигрыш, он среди всех своих стратегий может выбрать такую, которая обеспечит ему максимальный гарантированный выигрыш

.

Стратегия, соответствующая максимальному значению минимумов строк, называется максимальной стратегией, а величина- нижней ценой игры, илимаксимином.

Игрок , рассуждая аналогично, может среди всех своих стратегий выбрать ту, которая обеспечит ему минимальный гарантированный проигрыш

.

Стратегия, соответствующая минимальному значению максимумов столбцов, называется минимаксной стратегией, а величина верхней ценой игры илиминимаксом.

Если игрок А будет придерживаться максиминной стратегии, то он получит выигрыш не меньше максиминного значения, т. е.

.

Если игрок В придерживается минимаксной стратегии, то его проигрыш будет не больше минимаксного значения, а именно

В общем случае отношение между нижней и верхней ценой иг­ры устанавливается неравенством

.

Существуют игры, для которых

.

Соответствующие этим значениям стратегии игреков А и В явля­ются оптимальными, а элемент платежной матрицы, отвечающий этим стратегиям, называется седловой точкой. Элемент платежной матрицы, соответствующий ее седловой точке, являетсяценой иг­ры. Обозначим ее через. Тогда при наличии седловой точки име­ет место равенство

.

Если , игра выгодна игрокуА. Приигра выгодна игро­ку В. В случаеигра выгодна обоим игрокам и называетсябезобидной илисправедливой.

Пример 5.2.3.1.В табл.5.2.3.1 дан пример игры и ее решение. В данной игре каждый из двух игроков располагает четырьмя стратегиями и не имеет информации о том, какую стратегию применит противник.

В первую очередь в каждой строке платежной матрицы берем минимальные элементы () и запишем их в последний столбец табл. 2, а в каждом столбце - максимальные () и запишем их в последнюю строку той же таблицы.

Затем определяется нижняя и верхняя цена игры путем выбора максимального элемента в последнем столбце таблицы и минимального - в последней строке. В данном примере . Следовательно, платежная матрица имеет седловую точку и оптимальными для игроков являются чистые стратегии А2и В2. Цена игры.

Таблица 5.2.3.1

6

4

3

4

3

12

7

10

9

7

6

6

4

9

4

12

3

12

7

3

12

7

12

9

7

7

Это означает, что если игрок А будет придерживаться своей оптимальной стратегий А2, он выиграет не менее 7, но может вы­играть и больше, если игрок В отклонится от своей оптимальной стратегии В2. Аналогично, если игрок В придерживается своей оп­тимальной стратегии В2, он проиграет не более 7, но может про­играть и меньше, если игрок А выберет одну из стратегий А1, А3или А4.

Игры с седловой точкой решаются в чистых стратегиях, и про­цесс решения не представляет особой сложности. Существуют иг­ры, в которых платежная матрица имеет более одной седловой точки. Доказано, что все эти точки дают одно и то же значение цены , хотя соответствуют различным парам оптимальных стра­тегий.

Если седловая точка платежной матрицы отсутствует, игра решается в смешанных стратегиях.

Рассмотрим такую платежную матрицу, которая не имеет седловой точки.

Пример 5.2.3.2. Два банка А и В осуществляют капитальные вложения в пять строительных объектов. С учетом особенностей вкладов и местных условий прибыль банка А в зависимости от объема финансирования выражается элементами платежной матрицы А. Для упрощения задачи принять, что убыток банка В равен прибыли банка А. Найти решение матричной игры в чистых стратегиях, если оно существует.

Решение.Обозначим чистые стратегии банков А и В соответственно через А1, А2, А3, А4, А5 и В1, В2, В3, В4, В5. Предположим, что банк А располагает общей суммойатыс. ден. ед., отпускаемой на строительство пяти объектов. Аналогично и банк В имеет суммуbтыс. ден. ед., отпускаемую на строительство тех же пяти объектов. Тогда чистая стратегия− это выделениетыс. ден. ед. банком А на строительствоi-го объекта,. Общая сумма средств, выделяемых на строительство пяти объектов: а = а1 + а2 + а3 + а4 + а5. Аналогично определяются чистые стратегии и для банка В:− это выделениетыс. ден. ед. банком В на строительствоj-го объекта,, а общая сумма средств, выделяемых на строительство пяти объектов: b = b1 + b2 + b3 + b4 + b5.

Сведем исходные данные в табл. 5.2.3.2.

Таблица 5.2.3.2.

-2

3

-1

1

4

-2

-1

4

-2

2

3

-2

7

0

1

-1

0

-1

-1

3

0

3

4

-1

6

-1

1

-1

-1

-1

7

4

1

3

4

-1

1

Проверим, имеет ли игра решение в чистых стратегиях. Для этого в каждой строке платежной матрицы, записанной в табл. 5.2.3.2, найдем минимальное число и впишем его значение в соответствующую строку последнего столбца. В полученном столбце найдем максимальный элемент (максимин): –1, называемый нижней ценой игры. Он является гарантированной (минимальной) прибылью, которую может обеспечить себе банк А при любых стратегияхбанка В.

В каждом столбце найдем максимальное значение элементов платежной матрицы и впишем его в соответствующие столбцы последней строки. В полученной строке найдем минимальный элемент (минимакс): 1, называемый верхней ценой игры. Он показывает максимальный убыток, который может получить банк В при любых стратегияхбанка А.

Так как –1 ≠ 1, то игра неразрешима в чистых стратегиях (игра не имеет седловой точки). Значит, мы можем только заключить, что цена игры –1 ≤≤ 1. В следующем разделе будет изложим метод решения данной задачи.

Соседние файлы в папке Методические указания (лекции)