- •Тема 5. Методи розв’язування задач теорії ігор
- •5.1. Основні поняття теорії ігор
- •5.2. Матричні ігри двох осіб з нульовою сумою. Матриця гри. Верхня та нижня ціна гри. Теорема про мінімакс
- •5.3. Змішані стратегії в іграх двох осіб з нульовою сумою
- •5.4. Представлення гри у вигляді задач лінійного програмування.
- •5.5. Ігри порядку 2 2, 2 n та m 2. Графічне розв’язування ігор.
- •5.6. Прийняття рішень в умовах невизначеності
- •Контрольні запитання
5.4. Представлення гри у вигляді задач лінійного програмування.
Надалі будемо вважати, що всі виграші не є негативними — з цією метою додамо до всіх елементів матриці гри значення найбільшого за абсолютним значенням негативного елементу. В результаті такого перетворення оптимальні стратеґії не зміняться, лише ціна гри збільшиться на відповідне значення.
Якщо
один з гравців застосовує свою оптимальну
стратеґію
,
то інший не може покращити своє положення,
тобто для оптимальної стратеґії
справедливі співвідношення
,
,
за умови
.
Перетворимо цю задачу, здійснивши
підстановку
,
і отримаємо
,
,
тому що
.
Таким чином маємо задачу лінійного
проґрамування, розв’язуючи яку, отримаємо
значення
,
за допомогою яких шляхом оберненої
підстановки визначимо оптимальні
значення ймовірностей, що складають
оптимальну мішану стратеґію.
Таким чином, підсумовуючи, оптимальні мішані стратеґії гравців А та В задовільняють другий наслідок з основної теореми теорії антаґоністичних ігор двох осіб, а саме:
, , ,
,
,
.
Здійснивши
підстановки
та
і враховуючи, що гравець А прагне
максимізувати свій середній виграш, а
гравець В — мінімізувати програш,
отримаємо пару двоїстих задач лінійного
програмування, розв’язання яких
дозволить визначити оптимальні стратеґії
гравців А та В:
,
,
,
.
Таким чином, процедура розв’язування гри є наступною:
розрахунок нижньої та верхньої ціни гри; якщо вони рівні між собою, то гра розв’язана — стоп (розв’язок гри є розв’язком в чистих стратеґіях);
в іншому випадку спрощуємо гру, виключаючи доміновані стратеґії;
для спрощеної гри формулюємо пару задач лінійного програмування, розв’язуючи одну з яких встановлюємо оптимальну мішану стратеґію одного з гравців (зручніше гравця В);
за розв’язком прямої задачі знаходимо розв’язок двоїстої;
шляхом оберненої підстановки визначаємо оптимальні мішані стратеґії для спрощеної гри, та доповнюємо їх домінованими чистими стратеґіями з ймовірностями використання, що рівні нулю.
Приклад 3. Знайти розв’язок гри, заданої наступною матрицею:
|
|
3 B1>B2 |
|
3 B3>B4 |
4 B1>B5 |
|
|
|
B1 |
B2 |
B3 |
B4 |
B5 |
|
|
A1 |
4 |
7 |
2 |
3 |
4 |
|
|
A2 |
3 |
5 |
6 |
8 |
9 |
|
|
A3 |
4 |
4 |
2 |
2 |
8 |
|
6 A1>A3 |
A4 |
3 |
6 |
1 |
2 |
4 |
|
1 A1>A4 |
A5 |
3 |
5 |
6 |
8 |
9 |
|
2 A2>A5 |
|
=4 |
=7 |
=6 |
=8 |
|
|
|
Гра
не має сідлової точки — спрощуємо гру,
виключаючи доміновані стратеґії.
Стратеґія Аi домінує стратеґію
Aj, якщо в Ai виграші не менші,
ніж в Aj, і хоча би один строго
більший. Стратеґії еквівалентні, якщо
всі виграші цих двох стратеґій однакові.
З числа еквівалентних стратеґій також
залишаємо лише одну. Стратеґія Bi
домінує стратеґію Вj, якщо в Bi
програші не більші, ніж в Bj, і хоча
би один строго менше. Таким чином
оптимальні мішані стратеґії гравців А
та В будуть мати відповідно вигляд
,
,
де ненульові значення отримуються після
розв’язування спрощеної гри розміром
.
Приклад 4. Знайти розв’язок гри, заданої наступною матрицею:
Так як доміновані стратеґії відсутні, для розв’язування гри застосовуємо представлення у вигляді пари двоїстих задач лінійного проґрамування:
Q=q1+ q2+ q3+ q4 Max p1+ p2+ p3 Min
3q1+6q2+ q3+4q4 <= 1 3p1+5p2+ p3 >=1
5q1+2q2+4q3+2q4 <= 1 (1) 6p1+2p2+4p3 >=1 (2)
q1+4q2+3q3+5q4 <= 1 p1+4p2+3p3 >=1
qj >=0 4p1+2p2+5p3 >=1, pi>=0.
Розв’язуємо задачу (1) за допомогою звичайного симплекс-методу, і переходимо шляхом обернених підстановок v=1/Q*, yj=qjv до визначення оптимальної мішаної стратеґії гравця В. З останньої симплекс-таблиці цієї задачі визначаємо оптимальні значення pi, за допомогою яких, використовуючи підстановку xi=piv розраховуємо значення оптимальної мішаної стратеґії гравця А.
