
4. Розв’язування гри в мішаних стратегіях.
Якщо гра не має сідлової точки, то застосування чистих стратегій не дає оптимального розв’язку гри. Так в прикладі 12.1 , сідлова точка відсутня. В такому випадку можна отримати оптимальний розв’язок, випадковим чином чередуючи чисті стратегії.
Мішаною
стратегією
гравця
називається застосування чистих
стратегій
з імовірностями
,
причому сума імовірностей дорівнює 1:
.
Мішані стратегії гравця записують у вигляді матриці:
,
або
у вигляді рядка
.
Аналогічно мішані стратегії гравця позначаються:
,
або
,
де
сума імовірностей появи стратегій
дорівнює 1:
Чисті
стратегії можна вважати окремим випадком
мішаних стратегій і задавати рядком, в
якому 1 відповідає чистій стратегії, а
інші елементи – 0. На основі принципу
мінімаксу визначається оптимальний
розв’язок гри: це пара оптимальних
стратегій
в загальному випадку мішаних, що володіють
наступною властивістю: якщо один з
гравців притримується своєї оптимальної
стратегії, то іншому не може бути вигідним
відступати від своєї. Виграш, що відповідає
оптимальному розв’язку, називається
ціною гри. Ціна гри задовольняє нерівності:
,
де
і
-- нижня і верхня ціна гри. Справедлива
слідуюча основна теорема теорії гри
(теорема Неймана):
Теорема. Кожна скінчена гра має принаймні один оптимальний розв’язок, можливо, серед мішаних стратегій.
Ця теорема має велике практичне значення – вона дає конкретні моделі знаходження оптимальних стратегій при відсутності сідлової точки.
Розглянемо гру розміру , яка є найпростішим прикладом скінченої гри. Якщо така гра має сідлову точку, то оптимальний розв’язок – це пара чистих стратегій, що відповідають цій точці.
Гра,
в якій відсутня сідлова точка, у
відповідності з основною теоремою, має
оптимальний розв’язок, що визначається
парою мішаних стратегій
і
.
Для
того щоб знайти їх, скористаємось
теоремою про активні стратегії. Якщо
гравець
притримується своєї оптимальної
стратегії
,
то його середній виграш буде рівним
ціні гри
,
якою б активною стратегією не користувався
гравець
.
Для гри
будь-яка чиста стратегія противника є
активною, якщо відсутня сідлова точка.
Виграш гравця
(програш гравця
)
– випадкова величина, математичне
сподівання (середнє значення) якої є
ціною гри. Тому середній виграш гравця
( оптимальна стратегія ) буде дорівнювати
і для першої і для другої стратегії
супротивника.
Нехай
гра задана платіжною матрицею
.
Середній
виграш гравця
,
якщо він використає оптимальну мішану
стратегію
,
а гравець
-- стратегію
дорівнює ціні гри
:
.
Такий же виграш і при застосуванні другим гравцем стратегії , тобто
.
Враховуючи,
що
,
одержимо систему рівнянь для визначення
оптимальної стратегії
і ціни гри
:
(
12.1
)
Розв’язуючи цю систему, одержимо оптимальну стратегію
і ціну гри
.
Застосовуючи
теорему про активні стратегії для
знаходження
-- оптимальної стратегії гравця
,
одержимо, що при будь-якій чистій
стратегії гравця
(
чи
) середній програш гравця
дорівнює ціні гри
,
тобто
(
12.2
)
Тоді
оптимальна стратегія
визначається формулами
Приклад. Застосуємо одержані результати для знаходження оптимальних стратегій для гри «Пошук»:
Розв’язок. Гра «Пошук» задана платіжною матрицею без сідлової точки:
.
Шукаємо розв’язок в мішаних стратегіях. Для гравця середній виграш дорівнює ціні гри (при і ); для гравця середній програш дорівнює ціні гри (при і ). Системи рівнянь мають вигляд:
(
12.3 )
Розв’язуючи
ці системи, одержуємо
Це означає, що оптимальна стратегія
кожного гравця полягає в тому, щоб
чергувати свої чисті стратегії випадковим
чином, вибираючи кожне із сховищ з
імовірністю
.
При цьому середній виграш дорівнює 0.