Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лек мат мет.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.54 Mб
Скачать

3.4.2. Постановка игровых задач

Рассмотрим конечную парную игру с нулевой суммой. Игрок А имеет m стратегий (А1 А2 Аm), а игрок В – n стратегий ( В1, В2 Вn). Такая игра называется игрой размерностью m х n. Пусть аij - выигрыш игрока А в ситуации, когда игрок А выбрал стратегию Аi , а игрок В выбрал стратегию Вj. Выигрыш игрока в данной ситуации обозначим bij. Игра с нулевой суммой, следовательно, аij= - bij. Для проведения анализа достаточно знать выигрыш только одного из игроков, допустим А.

Если игра состоит только из личных ходов, то выбор стратегии (Аi, Вj),однозначно определяет исход игры. Если игра содержит также случайные ходы, то ожидаемый выигрыш – это среднее значение ( математическое ожидание).

Предположим, что значения аij известны для каждой пары стратегий(Аi, Вj). Составим прямоугольную таблицу , строки которой соответствуют стратегиям игрока А, а столбцы – стратегиям игрока В. Эта таблица называется платежной матрицей.

Цель игрока А максимизировать свой выигрыш, а цель игрока В минимизировать свой проигрыш.

Будем считать все аij> 0.

Таким образом, платежная матрица имеет вид:

В1

В2

Вj

Вn

А1

a11

a12

a1j

a1n

1

А2

а21

а22

а2j

a2n

2

Аi

аi1

аi2

аij

аin

i

Аm

am1

аm2

аmj

amn

m

1

2

j

n

Задача состоит в определении:

  1. Наилучшей (оптимальной) стратегии игрока А из стратегий А1 А2 Аm;

  2. Наилучшей (оптимальной) стратегии игрока В из стратегий В1, В2 Вn.

Для решения задачи применяется принцип, согласно которому участники игры одинаково разумны и каждый из них делает все для того, чтобы добиться своей цели.

3.4.3. Методы решения игровых задач

Принцип минимакса

Проанализируем последовательно каждую стратегию игрока А. Если игрок А выбирает стратегию А1, то игрок В может выбрать такую стратегию Вj , при которой выигрыш игрока А будет равен наименьшему из чисел a1j . Обозначим его 1:

1=min a1j

j

то есть 1 – минимальное значение из всех чисел первой строки.

Это можно распространить на все строки. Поэтому игрок А должен выбрать ту стратегию, для которой число i - максимально.

 =max i

 =max min aij

i j

Величина  - гарантированный выигрыш, который может обеспечить себе игрок а при любом поведении игрока В. Величина  называется нижней ценой игры.

Игрок В заинтересован в том, чтобы уменьшить свой проигрыш, то есть обратить выигрыш игрока А в минимум. Для выбора оптимальной стратегии он должен найти максимальное значение выигрыша в каждом столбце и среди них выбрать наименьшее.

Обозначим через j максимальное значение в каждом столбце:

j =max aij

i

Наименьшее значение j обозначим .

 = min max aij

j i

 называется верхней границей игры. Принцип, диктующий игрокам выбор игрокам соответствующих стратегий, называется принципом минимакса.

Существуют матричные игры, для которых нижняя цена игры равна верхней, такие игры называются играми с седловой точкой. В этом случае == называется чистой ценой игры, а стратегии А*i, В*j , позволяющие достичь этого значения - оптимальными. Пара (А*i, В*j )называется седловой точкой матрицы, так как элемент aij .=  одновременно является минимальным в i-строке и максимальным в j- столбце. Оптимальные стратегии А*i, В*j , и чистая цена являются решением игры в чистых стратегиях, т. е. без привлечения механизма случайного выбора.

Пример 1.

Пусть дана платежная матрица. Найти решение игры, т. е. определить нижнюю и верхнюю цены игры и минимаксные стратегии.

В1

В2

В3

В4

А1

5

3

8

2

1=2

А2

1

6

4

3

2=1

А3

9

5

4

7

3=4

1=9

2=6

3=8

4=7

Здесь 1=min a1j=min(5,3,8,2) =2

j

1= max ai1 = max(5,1,9) =9 и так далее.

 =max min aij= max(2,1,4) =4

i j

 = min max aij =min(9,6,8,7) =6

j

таким образом, нижней цене игры (=4) соответствует стратегия А3 .Выбирая эту стратегию, игрок А достигнет выигрыша не менее 4 при любом поведении игрока В. Верхней цене игры (=6) соответствует стратегия игрока В. Эти стратегии являются минимаксными. Если обе стороны будут придерживаться этих стратегий, выигрыш будет равен 4 (a33).

Пример 2.

Дана платежная матрица. Найти нижнюю и верхнюю цены игры.

В1

В2

В3

А1

5

1

2

1=1

А2

2

6

2

2=2

А3

3

4

3

3=3

1=5

2=6

3=3

 =max min aij= max(1,2,3) =3

 = min max aij =min(5,6,3) =3

Следовательно,  ===3. Седловой точкой является пара (А*3, В*3 ). Если матричная игра содержит седловую точку, то ее решение находится по принципу минимакса.

Решение игр в смешанных стратегиях

Если платежная матрица не содержит седловой точки (<), то игрок А стремится увеличить выигрыш, а игрок В – уменьшить проигрыш. Если информация о действиях противной стороны отсутствует, то игроки будут многократно применять чистые стратегии случайным образом с определенной вероятностью. Такая стратегия в теории игр называется смешанной стратегией.

Для применения смешанных стратегий требуются следующие условия:

  1. В игре отсутствует седловая точка.

  2. Игроками используется случайная смесь чистых стратегий с соответствующими вероятностями.

  3. Игра многократно повторяется в одних и тех же условиях.

  4. При каждом из ходов игрок не информирован о выборе стратегии другим игроком.

  5. Допускается усреднение результатов игр.

В теории игр доказано, что любая парная игра с нулевой суммой имеет по крайней мере одно решение в смешанных стратегиях, отсюда следует, что каждая конечная игра имеет цену .  - средний выигрыш, приходящийся на одну партию, удовлетворяющий условию <=<= . Оптимальное решение игры в смешанных стратегиях обладает следующим свойством: каждый из игроков не заинтересован в отходе от своей оптимальной смешанной стратегии.

Стратегии игроков в их оптимальных смешанных стратегиях называются активными.

Теорема об активных стратегиях.

Применение оптимальной смешанной стратегии обеспечивает игроку максимальный средний выигрыш( или минимальный средний проигрыш), равный цене игры , независимо от того, какие действия предпринимает другой игрок, если он только не выходит за пределы своих активных стратегий.

Введем обозначения:

Р1 Р2 … Рm - вероятности использования игроком А стратегий А1 А2 ….. Аm;

m

Рi=1

i=1

Q1 Q2 …Qn вероятности использования игроком В стратегий В1, В2….. Вn

n

 Qi=1

i=1

Смешанную стратегию игрока А запишем в виде:

А1 А2 …. Аm

SA=

Р1 Р2 … Рm

Смешанную стратегию игрока B запишем в виде:

B1 B2 …. Bn

SB=

Q1 Q2 … Qn

Зная платежную матрицу А, можно определить средний выигрыш ( математическое ожидание) М( А,P,Q):

m n

М( А,P,Q)= aij Рi Qj

j=1 i=1

Средний выигрыш игрока А:

 =max minМ( А,P,Q)

Средний проигрыш игрока В:

 = min maxМ( А,P,Q)

Обозначим через РА* и QВ* векторы, соответствующие оптимальным смешанным стратегиям, при которых выполняется:

max minМ( А,P,Q) = min maxМ( А,P,Q)= М( А,PА*,QВ*)

При этом выполняется условие:

maxМ( А,P,QВ*) <=maxМ( А,PА*,QВ*)<= maxМ( А,PА*,Q)

Решить игру – это означает найти цену игры и оптимальные стратегии.

Геометрический метод определения цены игры и оптимальных стратегий

(Для игры 2Х2)

На оси абсцисс откладывается отрезок длиной 1.Левый конец этого отрезка соответствует стратегии А1, правый – стратегии А2.

По оси ординат откладываются выигрыши а11 и а12.

По линии , параллельной оси ординат из точки 1 откладываются выигрыши а21 и а22.

Если игрок В применяет стратегию В1, то соединяем точки а11 и а21, если – В2, то – а12 и а22.

Средний выигрыш изображается точкой N, точка пересечения прямых В1В1 и В2В2.Абсцисса этой точки равна Р2 , а ордината цене игры - .

Прямая В1В1 называется стратегией В1. Ордината любой точки отрезка В1 В1 равна величине выигрыша игрока А при применении им стратегии А1, А2, с соответствующими вероятностями Р1 и Р2 .

Ординаты точек отрезка В2 В2 равны среднему стратегий А1, А2, с соответствующими вероятностями Р1 и Р2 оманая В12 – это нижняя граница выигрыша, получаемая игроком А. В точке N он максимален ().

В1

N В2

В2

В1

Рис.3.9.

Пример.

Найти оптимальную смешанную стратегию руководителя предприятия и гарантированный средний выигрыш при выборе из двух новых технологий А1, А2. Известны выигрыши каждого вида технологий по сравнению со старой технологией. Матрица игры имеет вид

В1

В2

А1

0,4

0,9

1=0,4

А2

0,6

0,5

2=0,5

1=0,6

2=0,9

= max (0,4, 0,5)=0,5

= min (0,6, 0,9)=0,6

 не равна 

0,9

0,6

0,5

0,4 =0,55

р1=0,625 р2=0,375

Оптимальная стратегия

А 1 А2

SA=

0,375 0.625

=0,55

По сравнению с прежней технологией выигрыш составляет 55%.