Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Елтаренко Исследование операцыи 2007

.pdf
Скачиваний:
95
Добавлен:
16.08.2013
Размер:
2.72 Mб
Скачать

 

P*

 

 

a22

a12

 

;

 

 

(2.4)

 

 

 

 

 

 

 

 

 

1b

 

a22 a11

a12

a21

 

 

 

 

 

 

 

 

 

P*

1

P*

 

a11

a21

 

.

(2.5)

 

 

 

 

 

2b

 

 

1b

a22

a11

a12

a21

 

 

 

 

 

 

Цена игры (выигрыш для участника A) будет равна:

m n

 

a22a11

a12a21

 

*

*

 

a P P

 

 

.

 

 

ij ia

jb

a22 a11

a12 a21

 

j 1 i 1

 

 

Для того чтобы решения (2.2), (2.3), (2.4), (2.5) были положительными числами (вероятностями), необходимо, чтобы для элементов

матрицы aij выполнялись следующие неравенства:

a22

a21

0

 

a22

a21

0

a22

a12

0

 

a22

a12

0

a11

a21

0

или

a11

a21

0 .

a11

a12

0

 

a11

a12

0

Пример задачи. Правила игры. Каждый из участников имеет две чистые стратегии:

S1 – выбрать число 1,

S2 – выбрать число 2.

Если сумма у двух участников окажется четным числом, то выигрыш A составит эту сумму. Если же сумма окажется нечетной, то выигрывает участник B .

Данные правила отражены в следующей платежной матрице:

S1 S2

S1 2 3 .

S2 3 4

Найдем оптимальные смешанные стратегии для каждого из участников

100

P*

 

 

 

a22

a21

 

 

 

 

 

 

 

4

3

 

7

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1a

a22

a11

a12

a21

4

 

2

3 3

12

 

 

P*

 

5

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2a

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для участника B решением будет:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

 

 

4

3

 

 

 

 

 

 

7

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1b

4

2

3

3

 

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

5

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2b

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Цена игры равна:

4 2

3 3

 

 

1

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

12

 

 

 

 

 

 

Поскольку 0 , выигрывает участник В; из этого можно сделать

вывод, что правила игры несправедливы.

Отметим, что при выборе участником В оптимальной смешанной

стратегии его выигрыш

1

не будет зависеть от действий про-

12

 

 

тивника. Это следует из утверждения 1, поскольку у участника А обе чистые стратегии активные.

Графическая интерпретация решения игры 2 2. Построим за-

висимость выигрыша участника A от Pia (рис. 2.1),

 

γ

 

 

где

1

P a

(1

P

)a

 

γ1

 

 

1a 11

 

1a

21

 

 

 

а11

выигрыш участника А, если

а22

 

 

участник придерживается

 

 

 

 

 

 

 

 

 

чистой стратегии S1b ,

 

 

а21

 

γ2

 

 

P a (1 P

)a

ес-

 

 

 

2

1a

12

1a

22

 

 

 

 

 

а12

ли участник придерживается

 

 

 

чистой стратегии S2b .

 

 

0

Р*

1

Р

 

 

Приравняв

1 и

2,

полу-

 

 

 

 

Рис. 2.1. Графическая интерпретация

чим

оптимальное

значение

решения игры за участника А

P* ,

которое

соответствует

 

 

 

 

 

 

 

 

1a

 

 

 

 

 

 

 

 

 

101

 

 

 

 

 

 

 

max min

j , т.е.

A максимизировал свой выигрыш.

 

 

 

 

j

 

 

 

 

 

 

 

 

 

 

 

 

 

Теперь рассмотрим решение игры с позиции участника

B . По-

строим зависимость его проигрыша от P1b (рис. 2.2),

 

 

 

 

 

γ

 

 

 

где

1

P a

1

P

a

 

 

 

 

 

 

1b

11

 

1b

12

 

а11

γ2

а22

проигрыш участника В, если

 

 

 

участник придерживается чистой

 

 

 

 

 

 

 

γ1

стратегии S1a ,

 

 

 

 

 

 

 

 

 

 

P a

1

P

a

если

 

 

 

 

2

 

 

 

 

 

 

1b

21

 

1b

22

 

 

 

а21

 

 

а12

участник придерживается чистой

 

 

 

стратегии S2a .

 

 

 

 

 

0

 

 

1 Р1b

 

 

 

 

 

Р*1b

 

 

Оптимальное значение P*

Рис. 2.2. Графическая интерпретация

получается из условия

 

 

1b

 

 

 

решения игры за участника В

min max i

, т.е. он минимизи-

 

 

 

 

рует проигрыш.

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.3.2. Решение матричных игр 2 m графоаналитическим методом

Если участник A имеет 2 чистые стратегий, то матрица выигрышей для

 

a

 

:

a11

a12

 

 

 

ij

 

 

a21

a22

γ

 

 

 

 

 

 

γ3

 

γ1

а11

a23

 

 

 

а22

 

 

 

 

 

 

 

γ2

а12

 

 

 

 

 

а12

 

 

 

а13

 

 

 

 

 

стратегии, а B m чистых

Aимеет вид:

a1m .

a2m

Построим зависимость выигрыша участника A от P1a при чистых стратегиях

участника B

S jb ( j 1, 2,...,m) :

a P

a

1 P .

j 1 j 1a

2 j

1a

0 Р*1 Р

Рис. 2.3. Графическая интерпретация

решения игры 2xm

102

 

6

0

1

 

 

 

2

Оптимальное P1a

находим из условия max min aij Pia

 

 

j

i 1

 

 

 

(рис. 2.3). Найденному P*

соответствуют две чистые стратегии уча-

 

1a

 

 

стника B , которые будут для него активными. Таким образом, игру

2 m сводим к игре 2

2 .

 

 

Если несколько прямых пересекаются в одной точке, то нужно брать две стратегии, которые имеют более острый угол, это обеспечит более устойчивое решение.

Пример. Дана платежная матрица, необходимо найти оптимальные смешанные стратегии:

 

 

 

 

a

 

:

2

1

6 3,2

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ij

 

 

4

2

3

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Строим

зависимость

3

 

 

 

 

 

 

 

 

j

 

от

 

P1a :

 

выбираем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

стратегии S2b

и S3b

по

 

 

 

 

 

 

 

 

 

 

принципу

 

 

 

 

 

 

 

 

 

4

2

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

max min

 

aij Pia .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

j

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P1a

 

Переходим к матрице

 

 

 

 

 

 

 

 

 

 

2

2 -

 

aij

 

 

 

1

 

6

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

рассчитываем оптималь-

 

 

 

 

 

 

 

 

 

ные P*

 

и

 

P*

:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1a

 

 

 

2a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P*

 

 

 

 

 

 

3

2

 

 

 

5

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1a

3

 

1

2

6

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P*

 

7

. Решением игры для участника В является:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2a

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

103

P*

3 6

9

3 ; P*

1 ; P*

0; P*

0.

 

 

 

 

2b

12

12

4

3b

4

1b

 

4b

 

 

 

 

 

 

 

 

2.3.3. Решение матричных игр n 2 графоаналитиским

 

 

 

 

 

 

 

методом

 

 

Участник A имеет n чистых стратегий, а

B – 2 чистые страте-

гии, платежная матрица имеет вид:

a11 a12

a21 a22 .

an1 an2

Построим зависимость проигрыша участника B от P1b при чистых стратегиях A Sia (i 1, 2,...,n) :

a P

a

1 P

.

i i1 1b

i2

1b

 

а22

γ

 

 

 

γ1

 

 

 

а11

 

 

 

 

 

γ2

 

a32

 

 

а21

а12

 

 

γ3

 

а31

 

 

0

Р*1b

 

1 Р1b

Рис. 2.4. Графическая интерпретация решения игры nx2

Оптимальное P1*b нахо-

дим

из

условия

 

2

 

min max

aij Pjb

, после

i

j 1

 

 

 

чего выделяем две активные стратегии для участ-

ника A и переходим к игре

2 2 .

2.3.4. Решение матричных игр n m

Задана aij – матрица выигрышей для игрока A . Необходимо найти оптимальные смешанные стратегии:

104

S*

P*

, , P*

, , P*

a

1a

ia

 

na

S*

P*

, , P*

 

, , P* .

b

1b

jb

mb

Рассмотрим решение игры для игрока A.

Выигрыш игрока A, если B принимает фиксированную чистую стратегию Sjb , будет равен:

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

 

a P

j

1, 2, , m .

 

 

 

(2.6)

 

 

 

 

 

 

 

 

 

ij

ia

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найдем минимум из

j , обозначим его через

 

min

 

j . Будем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

 

 

искать P*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

из условия max .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ia

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Все

j

 

 

 

j

1, 2, , m ,

так как

 

 

 

 

 

– минимальное.

Поэтому

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2.6) перепишем в виде неравенств:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a P

 

( j

1, 2, , m) .

 

 

 

(2.7)

 

 

 

 

 

 

 

 

ij

ia

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для вероятностей Pia выполняется условие:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Pia

 

1.

 

 

 

 

 

 

 

 

 

 

 

 

(2.8)

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

равносильно поиску min

1

. Для удобства на-

Нахождение max

 

хождения

P

введем переменную

x

 

Pia

, тогда (2.7) перепишется

 

 

 

 

 

 

 

 

 

ia

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

1

 

в виде:

 

a x

1 ( j

1, 2, , m) , а (2.8) – в виде

 

x

.

 

 

ij

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

x*

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

Определяем

из условия, что

min

 

 

 

 

 

x при ограничениях:

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

105

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

aij xi

 

1 ( j 1, 2, , m);

 

 

 

 

 

 

 

i

1

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

0,

 

 

0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для

0 необходимо, чтобы все

 

j были положительные. Это

обеспечивается, если все aij

0 . Поэтому, если в матрице есть отри-

цательные

элементы,

увеличим

все элементы

 

aij

 

на

 

 

 

 

 

также увеличивается на C .

 

 

 

 

C abs(min(aij )). При этом

 

 

 

 

 

 

 

 

i, j

 

 

 

 

 

 

 

 

 

 

 

В результате решения поставленной задачи линейного програм-

 

 

 

 

 

n

мирования найдем x*

и значение целевой функции

x* . После

i

 

 

 

 

i

 

 

 

 

 

i 1

чего можем определить искомые P*

по формуле:

 

 

ia

 

 

 

 

 

 

x*

 

 

 

Pia

 

a

.

 

 

 

n

 

xk*

k 1

Выигрыш игрока A (цена игры) будет равен:

1

C .

 

n

 

x*

 

i

 

i 1

 

Алгоритм решения игры n x m для участника А

1.

Переходим к положительным элементам матрицы: aij C .

2.

Решаем задачу линейного программирования:

 

 

 

n

 

 

min

xi ;

 

 

 

i 1

 

 

n

 

при ограничениях

aij xi 1 ( j

1,2,...,m), xi 0.

 

 

i 1

 

 

 

 

106

*

x*

 

i

 

3. Находим вероятности: P

 

 

( ЦФ – значение целевой

 

 

ia

ЦФ

 

 

 

функции).

Выигрыш участника A определяется в соответствии с выражени-

ем:

1

 

C .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ЦФ

 

 

 

 

 

 

 

Решение игры для игрока B

 

 

 

Перейдем к матрице

 

aij

 

с неотрицательными элементами так же

 

 

как и при решении для участника А. Через i (i

1, 2, , n) обозна-

чим проигрыш игрока B при фиксированной стратегии игрока A :

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

i

 

aij Pjb .

 

 

 

 

 

 

 

 

 

j

1

 

 

 

 

 

 

 

 

 

 

m

Для вероятностей Pjb

выполняется условие:

Pjb 1.

 

 

 

 

~

 

 

 

j

1

Введем обозначение

 

max

i

. Задача минимизации ~ эквива-

i

1

лентна поиску max ~ . Произведем замену переменных:

yj P~jb .

Получаем задачу линейного программирования:

m

1

 

max yj

 

 

 

~

 

j 1

y

m

 

 

при ограничениях: aij y j 1 (при y j

0).

j 1

 

 

107

Решив задачу линейного программирования, получим y*j и зна-

чение целевой функции ( ЦФ). Цена игры –

~

1

 

, а искомые ве-

ЦФ

 

 

 

 

роятности – P*

y* ~ .

 

 

 

 

jb

j

 

 

 

 

Алгоритм решения игры n x m для участника В

1. Переходим к положительным элементам платежной матрицы: aij C .

2. Решаем задачу линейного программирования:

m

max y j ;

j 1

m

aij y j 1 (i 1, 2,...,n), y j 0.

j1

3.Интерпретируем результаты:

ЦФ1 , Pjb* y*j .

4. Корректируем :

C .

Вернемся к теореме о минимаксе (см. п. 2.3).

Теорема о минимаксе. В матричной игре без седловой точки ( ) существует точка равновесия такая, что aA ,aA , и оптимальные решения для участников находятся из условий:

 

 

n

 

 

 

для A {P*} из условия max min

 

a P

,

ia

j

 

ij

ia

 

 

i 1

 

 

 

 

 

 

для B {P*

 

m

 

 

} из условия min max

 

a P

,

jb

i

 

ij

jb

 

 

j

1

 

 

 

 

 

 

aA aB

цена игры.

 

 

 

 

 

108

 

 

 

 

Доказательство.

В соответствии с рассмотренным алгоритмом существует решение

для участника А P* , определяемое из условия:

ia

 

n

 

max min

aij Pia

aA ;

j

i 1

 

 

 

и существует решение для участника В

P* , определяемое из ус-

 

 

ib

ловия:

 

 

 

m

 

min max

aij Pjb

aB .

i

j 1

 

 

 

Из теоремы о прямой и двойственной задачах линейного программирования следует, что aA aB .

2.4.Биматричные игры

Вбиматричных играх задаются матрицы выигрышей для обоих участников:

 

aij

 

– матрица n m выигрыша для игрока A

 

 

bij

 

– матрица n m выигрыша для игрока B .

 

 

 

 

Необходимо

 

найти оптимальные смешанные стратегии P*

и

 

 

 

ia

 

P* .

 

 

 

jb

 

 

 

 

2.4.1. Принципы решения биматричных игр

 

Пусть Sa

Pia – стратегия для игрока A, а Sb Pjb – страте-

гия для игрока B .

Определение 3 (приемлемая стратегия) Смешанная стратегия Sa

является приемлемой для игрока A, если для любой другой смешанной стратегии Sa и фиксированной смешанной стратегии Sb полез-

ность для игрока A стратегии Sa больше, чем полезность стратегии

109