Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Оптимізаційны методи та моделі.doc
Скачиваний:
5
Добавлен:
01.07.2025
Размер:
5.7 Mб
Скачать

6.3. Аналіз матричних ігр

Нижня і верхня ціни гри. Принцип мінімаксу

Розглянемо скінчену гру гравців А і В. Гравець А має m стратегій, гравець В-n стратегій. Стратегії першого гравця: А1, А2, ..., Аm, стратегії другого гравця: В1, В2, ..., Вn. Нехай відомі виграші для кожної пари стратегій. Складемо матрицю гри або платіжну матрицю (табл. 6.2). Поставимо собі задачу: визначити свою оптимальну стратегію.

Обираючи стратегію Аі, ми завжди повинні розраховувати на те, що противник відповість на її тією з стратегій Вj, для якої ваш виграш мінімальний.

Таблиця 6.2

Гравець А

Гравець В

В1

….

Вj

….

Bn

А1

а11

….

a1j

….

a1n

….

….

….

….

….

….

Аі

аі1

….

aij

….

ain

….

….

….

….

….

….

Аm

а

….

amj

….

amn

Визначимо це значення виграшу, тобто мінімальне з чисел в і-тому рядку. Позначивши його через , отримаємо:

Випишемо числа поруч з матрицею праворуч у вигляді додаткового стовпця (табл. 6.3)

Таблиця 6.3

B

A

B1

B2

…..

Bn

i

A1

A11

a12

…..

a1n

1

A2

A21

a22

…..

a2n

2

…..

…..

…..

…..

…..

…..

Am

am1

am2

…..

amn

m

1

2

…..

n

Очевидно, першому гравцю найкраще вибрати таку стратегію, яка дає найбільшу величину . Позначимо

Отримана величина називається нижньою ціною гри або максиміном. Стратегія, що відповідає цій величині, називається максимінною стратегією.

Нижня ціна гри означає той максимальний виграш, який ми можемо гарантувати в грі проти розумного противника, обираючи одну з своїх стратегій.

Очевидно, аналогічне міркування можна провести і за противника (гравця В). Він зацікавлений в тому, щоб обернути виграш в мінімум. Якщо гравець В обере якусь j-ту стратегію, то гравець А відповість такою і-ю стратегією, яка зробить виграш максимальним. Позначимо виграш 0 це максимальне значення, яке відповідає j-тій стратегії. Знизу матриці визначимо максимальні значення аіj по кожному стовпцю:

Ясно, що сторона В обере таку стратегію, яка веде цей програш до мінімуму. Позначимо:

Величина називається верхньою ціною гри або мінімаксом, а відповідна їй стратегія — мінімаксною.

Верхня ціна гри — це мінімальний програш, на який може розраховувати «противник», який вибравши одну а своїх стратегій, розраховуючи на найгіршу для себе нашу поведінку.

Додержуючись своєї найбільш обережної мінімаксної стратегії, противник гарантує собі слідуюче: щоб ми не здійснили проти нього, він у всякому разі програє суму, яка не перебільшує .

Принцип, який потребує від обох гравців вибору відповідно максимінної і мінімаксної стратегій, називається принципом мінімакса.

Якщо = , то гра має так звану сідлову точку. Сідловій точці відповідає пара стратегій, які називаються оптимальним, а їх сукупність — розв’язком гри.

Чиста ціна гри: = = .

Приклад: Організується захист малорозмірного об’єкту: можливі 4 варіанти оборони А1, А2, А3, А4. Супротивник може застосовувати 4 варіанти нападу В1, В2, В34. Відома платіжна матриця, в якій вказується відсоток знешкодженних засобів супротивника із загального числа при будь-якій стратегії. Необхідно вибрати такий варіант оборони, щоб забезпечити максимальне число знешкоджених засобів супротивника. Платіжна матриця задана табл. 6.4.

Таблиця 6.4

Варіанти захисту

Варіанти нападу

i

В1

В2

В3

В4

А1

50

60

90

40

40

А2

90

50

40

80

40

А3

80

70

90

90

70*

А4

80

30

50

70

30

j

90

70*

90

90

=

Тут . Оптимальними («чистими») стратегіями є стратегії А3 і В2.

Розв’язок гри має наступну чудову властивість: у грі з сідловкою точкою відхилення від оптимальної стратегії не вигідне ні одному а гравців. Тому така гра стійка.

Якщо який-небудь гравець буде намагатися відхилися від своєї оптимальної лінії поведінки, то він цього лише програє. Якщо сідлова точка у грі відсутня,то розв’язок гри лежить в області замішаних стратегій.

Основна теорема теорії гри була доведена в 1928 р. Фон Нейманом. Вона стверджує, що кожна кінцева гра має, у крайньому разі, один вариант розв’язку (хоча б у класі змішаних стратегій).

Причому ціна гри завжди лежить між нижньою і верхньою ціною гри: .

Розглянемо гру 2 2,в якій відома платіжна матриця (табл. 6.5):

Таблиця 6.5

В

А

q

1-q

i

Р

3

6

3

1-р

5

4

4*

i

5*

6

Аналізуючи матрицю, знаходимо нижню і верхню ціну гри:

=4, =5.

Тут ≠ , отже сідлової точки немає. Отже, шукаємо розв’язок в області змішаних стратегій. Гравець А повинен прийняти свою змішану стратегію SA,гравець В-стратегію SB:

, .

Знайдемо середній виграш:

M[а]=3pq + 6p(1 – q) + 5(1 – p)q + 4(1 – p) (1 – q).

Розв’язати гру з позиції гравця А — це означає знайти таке значення імовірності Р, яке забезпечить максимальне значення М[а] при будь-яких значеннях q, тобто при будь-яких діях гравця В, який намагається зменшити це значення. Формально це можна записати та

{max min М [а]} max

p q

Після деяких алгебраїчних перетворень у виразі для М[а], отримаємо:

M[а]= −4(p – 1/4) (q – 1/2) + 4,5.

Аналізуючи цей вираз, приходимо до висновку, що якщо Р=1/4, то при будь-яких q значення середнього виграшу лишається рівним 4,5. Тому оптимальними стратегіями гравців А і В є стратегії:

, S*B = .

ЗАГАЛЬНЕ ОЗНАЧЕННЯ: в грі m x n змішана стратегія гравця А

,

Є ОПТИМАЛЬНОЮ, якщо вона забезпечує максимальне значення середнього виграшу при будь-яких діях гравця В, який намагається зменшити цей виграш, тобто це та стратегія, яка відповідає:

aij pi qj.

Для гравця В оптимальною стратегією буде та, яка відповідає:

aij pi qj.

В теорії гри доведено, що

Це значення називають ЦІНОЮ ГРИ:

.

Введемо поняття корисної стратегії. КОРИСНА СТРАТЕГІЯ — це стратегія, імовірність якої в оптимальній змішаній стратегії не дорівнює нулю.