Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Оптимізаційны методи та моделі.doc
Скачиваний:
5
Добавлен:
01.07.2025
Размер:
5.7 Mб
Скачать

6.5. Загальний розв’язок гри m X n методом лінійного програмування

Нехай задана гра mn. Гравець А має m стратегій А1, А2,…,А3, гравець В має n стратегій В1, В2,…, Вn. Задана платіжна матриця .

Необхідно знайти розв’язок гри, тобто дві оптимальні змішані стратегії гравців А і В.

S (A) = , S (B) = (6.1)

де = 1, = 1, а також визначити ціну гри ν.

Наша оптимальна стратегія S (A) повинна забезпечувати нам виграш не менший за ν, при будь-якій поведінці противника; і виграш що дорівнює ν при його оптимальній поведінці — стратегія S (A).

Аналогічно, стратегія S (B) повинна забезпечувати противнику програш не більший ніж ν при будь-якій нашій поведінці; і програш, що дорівнює при нашій оптимальній поведінці стратегія S (A).

Величина ціни гри ν в даному випадку нам не відома. Будемо вважати, що вона дорівнює деякому додатньому числу. Для нього достатньо, що всі елементи матриці були невід’ємними. Такого результату завжди можна домогтися додаючи до елементів досить велику додатню величину L. При цьому ціна гри збільшиться на L, а розв’язок не зміниться.

Нехай ми обрали свою нормальну стратегію SА . Тоді наш середній виграш при стратегії Bj противника буде дорівнювати:

= + +…+

Наша оптимальна стратегія має таку властивість, що при будь-якій поведінці противника забезпечує виграш, не менший за ν. Отже для будь-якої стратегії (j=1, 2…, n) числа (j= 1, 2,…, n) не можуть бути меншими за ν. Отримуємо ряд умов:

(6.2)

Крім того, р + р +…+ р = 1. (6.3)

Невідомими є р , р ,…,р і ν.

Поділимо нерівності на додатню величину ν і позначимо:

, …. (6.4)

Тоді умови запишуться у вигляді співвідношень:

(6.5)

де , ,…, — невід’ємні числа

Поділивши нерівності на і використавши позначення, маємо:

(6.6)

Ми хочемо зробити свій гарантований виграш максимально можливим: max. Очевидно при цьому права частина рівності (6.6) прийме мінімальне значення, тобто:

L= x1 + x2 + … + xm min (6.7)

Таким чином, задача знаходження розв’язку гри зводиться до задачі лінійного програмування: визначити невід’ємної величини, x1, x2…, xm, що задовольняють (6. 5) і мінімізують лінійну форму (6.7).

Як результат розв’язку сформульованої задачі лінійного програмування знаходимо ціну гри v і значення імовірностей p1, p2.... pm,, тобто оптимальну змішану стратегію SA* гравця А. Аналогічно знаходиться оптимальна змішана стратегія гравця В.

6.6. Наближені методи розв’язання матричних ігр

Часто в практичних задачах немає необхідності знаходити точний розв’язок гри. Достатньо знайти наближений розв’язок, який дає середній виграш, близький до ціни гри. Прийнятий для практики розв’язок можна отримати за допомогою методу ітерації.

Суть методу полягає в тому, що моделюється процес гри і підраховується середній виграш.

Починається з того, що гравець А обирає навмання одну з своїх стратегій, наприклад А1. Противник на це відповідає тією своєю стратегією Вj, яка найменш вигідна для гравця А, тобто обертає виграш при стратегії Аi на мінімум. На цей хід гравець А відповідає тією своєю стратегією Аk, яка дає максимальний середній виграш при використанні противником стратегії Вj. Далі знову черга противника. Він відповідає на пару ходів Аі і Аk тією своєю стратегією Вl, яка дає найменш середній виграш при цих двох стратегіях і так далі.

На кожному кроці ітераціонного процесу кожний гравець відповідає на будь-який хід іншого гравця тією самою стратегією, яка є оптимальною відносно всіх його ходів, що розглядаються як деяка змішана стратегія, в якій чисті стратегії представлені в пропорціях, що відповідають чистоті їх застосування.

Якщо таку імітацію процесу гри продовжувати досить довго, то середній виграш, що проводиться на одну пару ходів (елементарну гру), буде прямувати до ціни гри, а частоти p1, p2, …, pm, q1, q2,..., qn, з якими зустрічаються стратегії гравців в цьому розиграші, будуть наближатися до частот, що визначають оптимальні стратегії. Розрахунки показують, що збіжність методу дуже повільна, однак застосування ЕОМ усуває цю перешкоду.

Проілюструємо застосування ітераціонного методу на прикладі гри 3 x 3 (табл. 6.14)

Таблиця 6.14

В

А

В1

В2

В3

В4

А1

8

2

4

2

А2

4

5

6

4*

А3

1

7

3

1

ßj

8

7

6*

≠ß


Проведемо невеликий аналіз матриці гри згідно з загальною схемою розв’язку.

Нижня ціна гри = 4, ß = 6, тобто ≠ß.

Отже сідлової точки немає, домінуючих і дублюючих стратегій також немає.

Перші 14 кроків ітераціонного процесу наведені табл. 6.15. В першому стовпці подано номер елементарної гри (пари ходів n); в другому-номер і обраної стратегії гравця А; в в наступних трьох-накопичений виграш за перші n ігр при стратегіях противника В1, В2, В3. Мінімальне з цих значень підкреслене.

Далі йде номер j стратегії, яку обрав противник, і відповідно, накопичений виграш за n ігр при стратегіях А1, А2, А3.

Підкреслені значення визначають вибір відповідної стратегії іншого гравця. В наступних графах послідовно наведені мінімальний середній виграш ν, що дорівнює мінімальному накопиченому виграшу, поділеному на кількість ігор n; максимальний середній виграш υ, що дорівнює максимальному виграшу, поділеному на n, і їх середнє арифметичне:

ν* = .

При збільшенні n всі три величини ν, ν, ν*, будуть наближатися до ціни гри ν, але величина ν, очевидно, буде наближатися до неї порівняно швидше.

Таблиця 6.15

N

партії

N

стратегії

гравця А

Накопичений виграш

гравця В

за партію

N

стратегії

гравця В

Накопиче-

ний виграш

гравця А

за партію

Нижня

ціна

Верхня

ціна

Середній

Виграш

n

i

B1

В2

В2

j

A1

A2

A3

ν

ν

ν*

1

3

B2

66

3

1

8

4

1

1

8

4. 50

2

1

B3

7

7

3

12

10

4

3. 50

6

4. 75

3

1

1

9

11

2

14

15

11

3. 67

5. 0

4. 33

4

2

9

11

17

2

16

20

18

4

5. 0

4. 5

5

2

17

16

23

2

18

25

25

4. 2

5. 0

4. 6

6

2

21

21

29

2

20

30

32

4. 33

5. 33

4. 82

7

3

25

26

32

1

28

34

33

4. 29

4. 86

4. 57

8

2

29

33

38

1

36

38

34

4. 25

4. 75

4. 50

9

2

30

38

44

1

44

42

35

4. 23

4. 89

4. 56

10

1

34

43

43

2

46

47

42

4. 5

4. 70

4. 60

11

2

38

45

54

1

54

51

43

4. 55

4. 91

4. 72

12

1

46

50

58

2

56

56

50

4. 33

4. 66

4. 49

13

2

50

52

64

2

58

61

57

4. 38

4. 70

4. 54

14

2

58

57

70

2

60

66

64

4. 43

4. 71

4. 56

Після закінчення гри необхідно підрахувати, скільки разів гравцем А застосовувалася кожна стратегія. Тоді оптимальна змішана стратегія гравця А буде задаватися набором відношень:

….

де ri число, що показує, скільки разів застосовують стратегія А.

Аналогічно знаходиться змішана стратегія SB* гравця В.

Збіжність ітерацій тут досить повільна, але все-таки навіть такий невеликий розрахунок дає можливість знайти орієнтоване значення ціни гри і виявити перевагу корисних стратегій.

При використанні ЕОМ цінність методу значно збільшується.

Перевага ітераціонного методу розв’язку ігр полягає в тому, що об’єм і складність обчислень порівняно слабо зростають по мірі збільшення числа стратегій m і n.