Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
sadovin_h_c_sadovina_t_n_osnovy_teorii_igr.pdf
Скачиваний:
34
Добавлен:
01.01.2020
Размер:
667.17 Кб
Скачать

 

 

8q = 6, =q0

 

 

 

3

, 1- q0 =

1

 

;

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

3q

0

- 2(1

- q

0

=)

9

 

 

 

1

 

7

 

 

 

 

n =

 

 

 

 

 

 

-

2 ×

 

 

 

=

 

 

 

=1,75.

 

 

 

 

 

4

4

4

 

 

5.

 

Найдем

 

 

смешанную

 

 

 

 

стратегию

первого игрока, полагая

p0

= p,

 

p0 = 1 - p, p0

= 0 ,

и

 

 

 

приравнивая средние выигрыши

1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

первого игрока:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1× p + 3 ×(1 - p)+ 0 ×0 =4 × p + (-2)×(1 - p)+ 5 ×0 ;

 

p + 3 - 3 p= 4 p - 2 + 2 p ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8 p = 5, =p0

 

 

 

 

 

5

, 1 - p0 =

3

.

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

Проверка:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n =

5

+ 3×

3

 

 

 

=5

+

9

=14

=1,75.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

8

 

 

 

8

 

 

 

8

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, получаем следующее решение игры:

 

p

0

æ 5

 

 

3

 

 

ö

, =q

0

 

æ

3

 

 

 

1 ö

 

1,75 .

 

 

= ç

 

,

 

 

 

 

,

0 ÷

 

 

ç

 

 

 

 

,

 

 

 

÷

,= n

 

 

8

 

8

 

 

 

4

 

 

 

 

 

 

è

 

 

 

 

ø

 

 

 

 

 

 

è

 

 

 

4 ø

 

 

2.7. Матричные игры m×n

Как будет показано ниже, решение любой матричной игры может быть найдено методами линейного программирования. При этом объем вычислений напрямую зависит от размерности платежной матрицы. Поэтому на практике важны любые приемы предварительного анализа игры, позволяющие уменьшить размеры платежной матрицы(уменьшить число чистых стратегий). Одним из таких приемов является доминирование (мажорирование) стратегий.

40

2.7.1.Доминирование стратегий

Вряде случаев анализ платежной матрицы показывает, что

некоторые чистые

стратегии не могут внести никакого вклада

в оптимальные смешанные стратегии, поэтому их можно отбро-

сить, что приводит к платежной матрице меньшей размерности.

Пусть A = {aij }

— произвольная платежная матрица.

m´n

Говорят, что стратегия Ai доминирует стратегию Ak , если справедливы неравенства:

aij ³ akj , j =1, n .

В этом случае из платежной матрицы можно«убрать» k-ую строку.

Аналогично, стратегия Bj доминирует стратегию Bl , если

aij £ ail , i =1, m.

В этом случае из матрицы можно «убрать» l-й столбец. Рассмотрим применение доминирования стратегий на примере

следующей матрицы выигрышей:

 

æ1

3

5

6

ö

A =

ç

4

2

1

2

÷

ç

÷ .

 

ç

3

1

1

 

÷

 

è

-1ø

Очевидно,

что

все элементы второй строки(стратегия A2 )

не меньше соответствующих элементов третьей строки, поэтому третью строку можно удалить. Тогда получим матрицу 2 ´ 4 :

æ1

3

5

6

ö

A = ç

4

2

1

2

÷ .

è

ø

41

Сравнивая поэлементно третий и четвертый столбцы, видим, что третий столбец доминирует четвертый, поэтому его также можно удалить:

æ1

3

5

ö

,

A = ç

4

2

1

÷

è

ø

 

а решение последней задачи можно найти(№ 2.7), например, графическим способом:

 

= 2,5; p

0

æ 1

1

ö

; q

0

æ 1

3

ö

n

 

ç

 

;

=; 0

÷

 

ç

 

;

=; 0; 0

÷.

 

2

 

4

 

 

 

è

2

ø

 

 

è

4

ø

Мажорирование стратегий можно распространить и на смешанные стратегии. Например, если элементы одной строки не больше некоторых выпуклых линейных комбинаций соответствующих элементов других строк, то соответствующую стратегию можно исключить, заменив ее смешанной стратегией с соответствующими частотами использования чистых стратегий.

Рассмотрим пример:

 

æ 24

0

ö

A =

ç

0

8

÷

ç

÷ .

 

ç

4

5

÷

 

è

ø

Если взять чистую стратегию A1 с частотой 0,25, а A2 с частотой 0,75, то A3 мажорируется линейной комбинацией A1 и A2 , так как:

4 < 24 ×0,25 + 0 × 0,75 = 6, 5 < 0 ×0, 25 + 8 × 0,75 = 6.

Поэтому стратегию A3 можно исключить.

42

Аналогично можно поступать и со стратегиямиBj второго игрока.

2.7.2. Аффинное правило

При поиске решения матричных игр часто бывает полезным следующее свойство: оптимальные стратегии у матричных игр B и A, элементы которых связаны соотношениями:

bij = laij + m, i 1,=m, j 1,=n ,

где l > 0, m — любое число; имеют одинаковые равновесные ситуации, а цены игр связаны равенством:

nB = ln A + m .

№ 2.8. Найти цену матричной игры 2 ´3 :

æ1

5

9

ö

B = ç

7

3

1

÷ .

è

ø

Решение. Так как bij = 2aij -1, где

æ1

3

5

ö

,

A = ç

4

2

1

÷

è

ø

 

и vA = 2,5 , то цена игры B будет равна:

nB = 2n A -1 = 2 × 2,5 -1 = 4 .

2.7.3.Итерационный метод решения матричных игр

Этот метод решения матричной игры отражает, в некоторой степени, реальную ситуацию накопления опыта по поиску игроками «хороших» стратегий в результате многократного повторения

43

конфликтных ситуаций. На каждом шаге игрок выбирает наиболее выгодную для себя стратегию, опираясь на предыдущий выбор противника. То есть игрок на собственном опыте прощупы-

вает способ

поведения другого

игрока

и

старается

отвечать

на него наиболее выгодным для себя образом.

 

 

 

Таким

образом,

происходит практическое «обучение» игро-

ков в ходе самой игры. Проиллюстрируем итерационный метод

на следующем примере.

 

 

 

 

№ 2.8.

Найти

итерационным

методом

решение матричной

игры 2 ´3 :

 

 

 

 

 

 

 

æ 2

0

3 ö

 

 

 

 

 

A = ç

3

÷ .

 

 

 

 

è1

-3ø

 

 

 

 

 

Решение.

Вычислим a = 0, b = 2 , то есть

седловой

точки

нет, и необходимо строить смешанную стратегию.

Найдем сначала точное решение геометрическим способом:

n =1, p

0

æ 2

1 ö

, q

0

æ

 

2

 

1

ö

 

ç

 

;

=÷

 

ç

0;

 

=;

 

÷ .

 

3

 

3

3

 

 

è

3 ø

 

 

è

 

 

ø

Теперь опишем правила выбора ходов (чистых стратегий) игроками, предположив для определености, что начинает первый игрок. Пусть первый игрок выберет стратегию A1 :

A1 - (2, 0, 3) .

Второй игрок ответит стратегией B2 , чтобы выигрыш первого игрока был минимален:

æ0 ö B2 - ç ÷ .

è 3ø

44

В ответ первый игрок выберет стратегиюA , чтобы его

2

выигрыш был максимальным:

A2 - (1, 3, -3) .

Второй игрок выбирает свою стратегию так, чтобы «накопленный» выигрыш первого игрока

(2, 0, 3) + (1, 3, -3) = (3, 3, 0),

был минимален — это стратегия

B3

æ 3 ö

 

 

 

 

 

- ç

÷ .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

è -3ø

 

 

 

 

 

Первый игрок выбирает свою стратегию так, чтобы его «на-

копленный» выигрыш при стратегиях B2

и B3

был максимален:

æ0 ö

æ 3 ö

æ 3ö

 

 

 

 

 

 

 

 

 

 

 

 

ç

÷

+ ç

÷

= ç

÷ ,

 

 

 

 

 

 

 

 

 

 

 

 

è

3ø

è -3

ø

è 0

ø

 

 

 

 

 

 

 

 

 

 

 

 

это стратегия A1 - (2, 0,

3) .

 

 

 

 

 

 

 

 

 

 

Второй игрок выбирает свою стратегию снова из условия

минимума «накопленного» выигрыша первого игрока:

 

 

(3, 3, 0) + (2, 0, 3) = (5, 3, 3) ,

 

 

 

 

 

 

например, эта стратегия B2 и так далее.

 

 

 

( i

j )

Разобьем

 

последовательные

ходы

игроков на

 

парыA , B

 

 

и запишем результаты в таблице:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а 2 . 3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

i

 

B1

 

 

B2

 

B3

 

n* (n)

 

j

 

A1

A2

 

n * (n)

n (n)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

3

 

 

4

 

5

 

6

 

7

 

8

9

 

10

11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1

 

2

 

 

0

 

3

 

0,00

 

2

 

0

3

 

3

1,50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

45

Продолжение табл. 2.3

n

i

B1

B2

B3

n* (n)

j

A1

A2

n * (n)

n (n)

 

 

 

 

 

 

 

 

 

 

 

2

2

3

3

0

0,00

3

3

0

1,5

0,75

 

 

 

 

 

 

 

 

 

 

 

3

1

5

3

3

1,00

2

3

3

1,0

1,0

 

 

 

 

 

 

 

 

 

 

 

4

1

7

3

6

0,75

2

3

6

1,5

1,125

 

 

 

 

 

 

 

 

 

 

 

5

2

8

6

3

0,6

3

6

3

1,2

0,9

 

 

 

 

 

 

 

 

 

 

 

6

1

10

6

6

1,0

2

6

6

1,0

1,0

 

 

 

 

 

 

 

 

 

 

 

7

1

12

6

9

0,857

2

6

9

1,286

1,071

 

 

 

 

 

 

 

 

 

 

 

8

2

13

9

6

0,75

3

9

6

1,125

0,9375

 

 

 

 

 

 

 

 

 

 

 

9

1

15

9

9

1,0

2

9

9

1,0

1,0

 

 

 

 

 

 

 

 

 

 

 

10

1

17

9

12

0,9

2

9

12

1,2

1,05

 

 

 

 

 

 

 

 

 

 

 

11

2

18

12

9

0,818

3

12

9

1,091

0,955

 

 

 

 

 

 

 

 

 

 

 

12

1

20

12

12

1,0

2

12

12

1,00

1,00

 

 

 

 

 

 

 

 

 

 

 

Дадим пояснения по составлению таблицы: 1-й столбец — номер пары ходов игроков.

2-й столбец — номер стратегии Ai , выбранной первым иг-

роком.

3-й, 4-й и 5-й столбцы — «накопленный» суммарный выигрыш первого игрока за первые n шагов, при выборе вторым игроком стратегий B1 , B2 и B3 соответственно. Минимальный из этих

выигрышей выделен жирным шрифтом и служит основанием для ответного хода второго игрока.

6-й столбец — минимальный средний выигрыш первого игрока за первые n ходов.

7-й столбец — номер стратегии Bj , выбранной вторым

игроком.

8-й и 9-й столбцы — «накопленный» суммарный выигрыш первого игрока за первыеn шагов при выборе им стратегий A1 и A2 соответственно. Максимальный выигрыш выделен жирным шрифтом и служит основанием для нового хода первым игроком.

46

10-й столбец — максимальный средний выигрыш первого игрока за первые n ходов.

11-й столбец — среднее арифметическое минимального

имаксимального среднего выигрышей первого игрока.

Та б л и ц а 2 . 4

n

p10

p20

q10

q20

q30

n

 

 

 

 

 

 

 

1

1

0

0

1

0

1,5

 

 

 

 

 

 

 

2

1/2

1/2

0

1/2

1/2

0,75

 

 

 

 

 

 

 

3

2/3

1/3

0

2/3

1/3

1,0

 

 

 

 

 

 

 

4

3/4

1/4

0

3/4

1/4

1,125

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

5/8

3/8

0

5/8

3/8

0,9375

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11

7/11

4/11

0

7/11

4/11

0,955

 

 

 

 

 

 

 

12

2/3

1/3

0

2/3

1/3

1,00

 

 

 

 

 

 

 

Считая, что смешанные стратегии игроков оцениваются частотами появлений чистых стратегий, можем на каждом шаге найти приближенно эти стратегии:

Видно, что с увеличением числа шагов приближенные значения вероятностей все меньше отличаются от точных значений.

Отметим два основных преимущества данного метода:

1.Метод прост и универсален.

2.Объем и сложность вычислений сравнительно слабо

растут при увеличении числа стратегий Ai и Bj игроков.

2.7.4.Сведение матричной игры

кзадаче линейного программирования

Рассмотрим

матричную игруm×n

с платежной матрицей

A = {aij }

. И

будем считать, что все

элементы aij платежной

 

m´n

 

 

матрицы положительны. Этого всегда можно добиться примене-

47

нием аффинного правила, то есть мы можем просто прибавить ко всем элементам матрицы A одно и то же положительное число. Тогда искомая цена игры n будет тоже являться положительным числом.

Начнем с первого игрока. Оптимальная смешанная стратегия первого игрока обеспечивает ему средний выигрыш, не меньший n , при любой чистой стратегии второго игрока. То есть будут выполняться неравенства:

m

åaij pi ³n , j =1, n,

i=1 m

å pi =1, pi ³ 0, i =1, m.

i =1

Если ввести новые переменные по формулеxi = pi , то можно n

получить:

m

åaij xi ³1, j =1, n,

i =1

 

 

 

 

 

m

 

1

 

 

 

åxi

=

, xi ³ 0, i =

1, m

.

 

i =1

n

Так как первый игрок стремится максимизировать свой выигрыш (v ® maх ) , то решение матричной игры можно свести

к следующей задаче линейного программирования: Найти:

m

 

min F (x )= min åxi

(2.17)

i =1

при следующих ограничениях:

48

ì m

 

 

 

 

 

 

 

³1, j =1, n,

ïåaij xi

í i =1

 

(2.18)

ïx ³

0,

i =

 

.

1, m

î i

 

 

 

 

 

 

Рассмотрим теперь интересы второго игрока. Его оптимальная смешанная стратегия обеспечивает ему средний проигрыш, не больший n , при любой чистой стратегии первого игрока. То есть:

n

åaij q j £n , i =1, m,

j=1 n

åq j =1, q j ³ 0, j =1, n.

j =1

Если ввести новые переменныеy j

=

qj

, j =

 

, то

можно

1, n

 

 

 

 

 

n

 

получить следующую задачу линейного программирования:

Найти

 

 

 

 

 

 

 

n

 

 

 

 

 

 

max Z (y )= max å y j

 

 

 

 

 

(2.19)

 

j =1

 

 

 

 

 

 

при следующих ограничениях:

 

 

 

 

 

 

n

 

 

 

 

 

 

ïìåaij y j £1, i =

 

,

 

 

 

 

 

 

1, m

 

 

 

 

 

(2.20)

í j =1

 

 

 

 

 

ï

³ 0, j =1, n.

îy j

Таким образом, мы пришли к следующей теореме.

Теорема 2.3. Решение матричной игры с положительной платежной матрицей равносильно решению двойственных задач линейного программирования (2.17) – (2.18) и (2.19) – (2.20).

49

При этом цена игрыn — это величина, обратная значению оптимальных сумм:

n =

 

 

1

=

1

 

,

 

 

 

 

åxi0

å yi0

 

 

 

 

а оптимальные значения pi0

и q0j равны:

p0

 

 

x0

 

,

q0

 

 

y0j

.

=

i

 

=

 

 

åxi0

å y0j

i

 

 

 

j

 

 

 

Рассмотрим теперь алгоритм решения матричной игры:

1.Ко всем элементам платежной матрицыA прибавим одно

ито же положительное число g так, чтобы все элементы платежной

матрицы стали положительными.

2. Сводим матричную игру к двойственной задаче линей-

0

y

0

,

ного программирования и находим их решения: x ,

j

i

 

 

åxi0 = å y0j .

3.Строим оптимальные смешанные стратегии игроков:

p0

 

x0

,

q0

 

y0j

.

=

i

=

 

åxi0

å y0j

i

 

 

j

 

 

4. Вычисляем цену игры:

n =

1

-g

1

- g .

 

=

åxi0

 

 

åy0j

№ 2.9. Решить матричную игру из № 2.6 сведением к задаче линейного программирования.

Решение. Сведем матричную игру к двойственной задаче линейного программирования:

F (x) = x1 + x2 ® min,

(2.21)

50

ìx1 + 4x2 ³1,

ïï3x1 + 2x2 ³1,

í

ï5x1 + x2 ³1, ïîx1 , x2 ³ 0,

– «прямая» задача линейного программирования, и

Z (y ) = y1 + y2 + y3 ® max,

ìïy1 + 3y2 + 5y3 £1, í4 y1 + 2 y2 + y3 £1,

ïîy1 , y2 , y3 ³ 0,

– «обратная» задача.

(2.22)

(2.23)

(2.24)

Симплексным методом «легче» решается обратная задача ЛП, так как здесь требуется введение двух дополнительных переменных, против трех в задаче(2.21) – (2.22). Поэтому найдем сначала оптимальную стратегию второго игрока, решив задачу

(2.23) – (2.24).

Шаг 1. Введем дополнительные переменные y4 , y5 ³ 0 :

ìíy1 + 3y2 + 5y3 + y4 =1, î4 y1 + 2 y2 + y3 + y5 =1.

Возьмем в качестве основных переменныеy4 и y5 , тогда свободными будут переменные y1 , y2 , y3 :

ìíy4 =1 - y1 - 3y2 - 5y3 , îy5 =1 - 4y1 - 2 y2 - y3 .

Получим базисное решение y = (0, 0, 0, 1, 1),

51

которое является допустимым, поэтому вычислим значение целевой функции:

Z (y ) = y1 + y2 + y3 = 0.

Так как в выражении для целевой функции все коэффициенты при переменных— положительны, то в основные можно перевести любую из них. Для этого вычислим:

y1

 

 

 

 

 

ì

 

 

 

 

 

1 ü

1

 

,

 

 

 

 

 

 

 

 

 

= min í1,

 

 

 

 

ý =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

î

 

 

 

 

 

4 þ

 

 

 

 

 

 

 

 

 

 

 

 

 

y2

 

 

 

 

 

ì1

 

 

 

 

1

ü

 

 

1

 

 

 

 

 

 

 

 

 

 

= min í

 

 

 

 

,

 

 

 

ý =

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

î3 2

þ

 

 

 

 

 

 

 

 

 

 

 

y3

 

 

 

 

 

ì1

 

 

 

 

 

 

ü

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

= min í

 

 

 

,1ý =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

î5

 

 

 

 

 

 

þ

 

 

 

 

 

 

 

 

 

 

Следовательно,

 

 

переводим в

основные переменнуюy2 ,

а в свободные — переменную y4 .

 

Шаг 2. Основные переменные: y2

и y5 , свободные: y1 , y3 , y4 :

ìy

 

=

 

1

 

 

-

1

y -

5

y -

1

y

 

,

 

 

2

 

 

 

 

 

 

4

 

 

ï

3

 

 

 

3

 

 

 

 

 

1

3

 

 

 

 

3

 

3

 

 

 

 

ï

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

í

 

 

1

 

 

 

 

10

 

 

 

 

 

 

7

 

 

 

 

 

 

2

 

 

 

 

 

ïy =

 

-

 

y +

 

y +

y

.

 

 

 

 

 

 

 

ï

5

3

 

 

 

 

3

 

 

 

1

 

3

 

 

 

 

3

3

 

 

4

 

 

î

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Получаем базисное решение:

 

y =

æ

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 ö

 

 

 

 

 

 

 

 

ç0,

 

 

 

 

, 0,

0,

 

 

 

 

 

÷ ,

 

 

 

 

 

 

 

 

 

3

 

3

 

 

 

 

 

 

 

 

 

 

è

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ø

 

 

 

 

 

 

 

 

которое является допустимым, поэтому вычисляем значение целевой функции:

52

 

1

 

2

 

 

2

 

 

1

 

1

 

Z (y )=

 

+

 

 

y1

-

 

 

y3

-

 

y4

=

 

.

3

3

3

3

3

Так как в выражении для целевой функции коэффициент

при y1

является положительным, то переменную y1 необходимо

перевести в основные:

 

 

 

 

 

 

 

 

y1

ì

1

ü

 

 

1

 

.

 

 

 

 

 

= min í1,

 

 

 

ý =

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

î

þ

10

 

 

 

 

 

 

 

Следовательно, в свободные переходит переменная y5 .

Шаг 3. Основные переменные: y1 и y2 , свободные: y3 , y4 , y5 :

ìy =

 

1

+

 

7

y +

1

 

y

 

-

3

y ,

 

 

 

 

 

 

4

 

 

ï

1

 

10

 

 

10

 

3

5

 

 

 

10

 

5

ï

 

 

 

 

 

 

 

 

 

 

 

 

 

í

 

 

 

 

 

3

 

 

 

19

 

 

2

 

 

 

 

1

 

ïy

2

=

 

-

 

 

y -

 

y +

 

y .

 

 

 

 

 

ï

 

 

10

 

10

3

5

 

4

 

10

5

î

 

 

 

 

 

 

 

 

 

Получаем базисное решение:

æ 1

 

3

 

ö

 

y = ç

 

 

,

 

 

, 0, 0, 0

÷

,

10

10

è

 

 

ø

 

которое является допустимым, потому вычислим значение целевой функции:

Z (y )=

2

-

1

y3

-

1

y4

-

1

y5

=

2

.

5

5

5

5

5

Так как все коэффициенты при переменных в выражении для целевой функции отрицательны, то оптимальное решение задачи

(2.23) – (2.24) найдено:

ymax

æ

1

,

3

,0,0,0

ö

, Zmax

=

2

= 0,4 .

= ç

 

 

 

÷

 

 

 

 

5

 

è

10 10

 

ø

 

 

 

53

Определим

 

теперь оптимальную стратегию второго игрока

и цену игры:

 

 

 

 

 

 

 

 

 

 

 

 

а) цена игры:

 

 

 

 

 

 

n =

 

1

 

 

= 2,5 ;

 

 

 

 

 

Zmax

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б) оптимальная смешанная стратегия:

q0

=

0,1

 

=

1

,

q0

=

0,3

=

3

, q0 = 0 ,

 

 

 

 

 

 

1

 

 

0, 4

 

4

 

2

0, 4

 

4

3

 

 

 

 

 

 

 

 

 

то есть

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

q

0

 

 

æ

1

 

 

3

 

 

 

ö

 

 

 

 

 

 

=

ç

 

,

 

 

 

 

,

0

÷ .

 

 

 

 

 

 

4

4

 

 

 

 

 

 

 

 

 

 

è

 

 

 

 

 

ø

 

 

 

 

 

Чтобы определить оптимальную стратегию первого игрока найдем решение задачи (2.21) – (2.22), воспользовавшись свойствами решений взаимно двойственных задач линейного программирования, а именно:

Fmin

= Zmax

 

2

 

xmin

æ

1

 

1

 

1

ö

=

 

,

= ç

 

,

 

, 0, 0,

 

÷ .

5

5

5

5

 

 

 

 

 

è

 

 

ø

Следовательно, оптимальная смешанная стратегия первого игрока равна:

p0

=

1

 

2

=

1

, p0

=

1

 

2

=

1

,

 

 

 

 

 

1

5

5

2

2

5

5

2

 

 

 

 

то есть

p

0

æ

1

 

1

ö

 

= ç

 

,

 

÷ .

 

2

2

 

 

è

 

ø

54

s Вопросы для самоконтроля

1.Дайте определение матричной игры.

2.Каким образом строится платежная матрица в матричной игре?

3.Каковы цели игроков в матричной игре?

4.Дайте определения верхней и нижней цен игры.

5.Какая ситуация в игре называется равновесной?

6.Какие стратегии называются оптимальными?

7.Что произойдет, если игроки отклонятся от оптимальных стратегий?

8. Какая игра называется«матричной игрой с седловой точкой»?

9.Дайте определение смешанных стратегий. Как их можно представить?

10.На какой вопрос отвечает основная теорема теории матричных игр?

11.Назовите пять условий применения смешанной стратегии.

12.Приведите алгоритм решения матричной игры 2 ´ 2 .

13. Какие ситуации возможны при решении матричной игры

2 ´ n ?

14.Каким образом можно уменьшить платежную матрицу?

15.Что такое аффинное правило?

16.Каковы основные преимущества итерационного метода?

17. Приведите алгоритм решения матричной игры сведением

к задаче линейного программирования.

18.Какие методы решения матричной игры, на Ваш взгляд, являются наиболее удобными?

55