
- •4.1. Економічна інтерпретація задач параметричного програмування
- •4.2. Типи задач параметричного програмування
- •4.3. Геометрична інтерпретація
- •4.4. Розв’язування задач
- •4.5 Інші типи задач
- •Висновки
- •Контрольні запитання
- •5.1. Загальна характеристика та класифікація ігрових задач
- •5.2. Матрична гра з нульовою сумою
- •Максимін для неї
- •5.3. Мішані стратегії
- •5.4. Розв’язування матричної гри
- •5.4.І. Графічний метод
- •5.4.2. Зведення матричної гри з нульовою сумою до задач лінійного програмування
- •Висновки
- •Контрольні запитання
5.2. Матрична гра з нульовою сумою
Найповніше розроблені методи розв’язування скінченої парної гри з нульовою сумою, яку й розглянемо далі. Такі ігри описують найпростіші конфліктні ситуації і теоретично більш розроблені.
Гру називають грою з нульовою сумою, якщо одна із сторін виграє все те, що програє інша, тобто сума виграшу сторін
,
де
–
дії сторін, які називають стратегіями.
Таким чином, така гра є замкненою системою, оскільки виграш однієї сторони відбувається повністю за рахунок програшу іншої.
Величина
– це результат гри для вибраної
-пари
стратегій, яку називають наслідком гри.
Ця величина показує ступінь виграшу
першої сторони та програшу іншої, коли
зроблено і-й
хід та дано
-ту
відповідь супротивника.
Якщо стратегії
та
вибирають однозначно з ймовірністю,
яка дорівнює одиниці, то такі стратегії
називають чистими.
Розглянемо парну гру з нульовою сумою.
Нехай маємо т
стратегій
першої сторони та п
стратегій
другої сторони гри. Кожна пара стратегій
(по одній з кожної сторони)
та
відображають конкретну
-ту
стратегію, яка оцінюється деякою функцією
.
Усі наслідки гри
зобразимо у вигляді платіжної матриці
,
тобто.
.
У цій матриці рядки відображують т
стратегій сторони А,
колонки – п
стратегій сторони В:
|
|
|
... |
|
|
|
|||
|
||||
... |
||||
|
Величини
платіжної матриці можна зобразити або
числом, або залежністю у вигляді функції
виграшу
.
Якщо
,
то виграє сторона А,
якщо
,
то виграє сторона В.
При розв’язуванні матричної гри з нульовою сумою достатньо знати матрицю тільки одного гравця. Для другого гравця виграш відрізняється тільки знаком .
Розглянемо простий приклад гри.
Підприємство
випускає три види продукції
,
,
,
попит на які змінюється і може набувати
чотири стани
,
,
та
.
Згідно з попитом задаються розміри цін
одиниці кожного виду продукції у вигляді
платіжної матриці
:
|
|
|
|
|
|
1 |
1 |
2 |
6 |
|
4 |
3 |
1 |
4 |
|
2 |
5 |
3 |
3 |
Треба знайти оптимальну поведінку однієї із сторін: при цьому перша сторона – підприємство – максимізує свій виграш, тобто робить спробу продати свій товар найдорожче, друга сторона – покупець – намагається мінімізувати свій програш, тобто купити товар найдешевше.
З отриманої матриці
очевидно, що коли є попит
,
то краще підприємству випускати продукцію
і далі
та
.
3 іншого боку, коли випускається продукція
,
то найдешевший товар буде при попиті
або
і т.д.
Розглянемо процес вибору стратегій, коли йдеться про гру з нульовою сумою. Такі задачі розв’язують за принципом мінімаксу.
Формалізація принципу мінімаксу така:
коли вибрано
стратегію
,
то друга сторона В
намагається зменшити свій програш
,
а тому сторона А
з можливих значень
повинна вибрати максимальне, тобто
.
Ця величина є
гарантованим успіхом (виграшем) сторони
А
для будь-якої відповіді сторони
її називають максиміном або нижньою
межею ціни гри з боку А.
Тому
,
де
– ціна гри.
Отже , коли гравець А дотримується стратегії максиміну, то йому гарантовано успіх не менш ніж величина а.
З боку В,
за аналогією, проводимо аналіз усіх
матриці і знаходимо найбільшу небезпеку
від А
,
а потім для її
зменшення вибираємо найменшу величину
з множини
:
.
Ця величина вказує
на найменші збитки з боку В
у разі правильної гри, тобто сторона В
не повинна програвати більше ніж
(обмеження програшу). Цю величину
називають мінімаксом або верхньою межею
ціни гри з боку А
оскільки
виграти більше сторона А
не може у разі правильної гри з боку В
. Таким чином, має місце
.
Узагалі маємо
.
Розглянемо процес вибору стратегії з боку А згідно з матрицею прикладу.
Якщо вибрано
стратегію
,
то, цілком зрозуміло, що з іншого боку
в особі покупця, найбільш зручний попит
відповідає мінімальному програшу
,
аналогічно для маємо
,
а для
.
Значення
– це ціни на продукцію, якщо мінімальна
ціна регулювалась би попитом. Цілком
очевидно, що в разі інших відповідей з
боку В
виграш сторони А
зростає, а з боку В
зменшується.
Такий вибір підсумків гри можна записати у вигляді
.
За аналогією маємо
та
,
.
Існують ігри, в матриці підсумків яких є такий елемент, що одночасно є мінімальним серед максимальних стратегій по колонкам та максимальним серед мінімальних стратегій по рядкам. У цьому разі ситуацію називають рівноважною оскільки вибір цього елемента влаштовує обидві сторони.
Такий елемент називають сідловою точкою матриці, а саму гру – грою із сідловою точкою. Термін „сідлова точка” використовують за аналогією з конфігурацією сідла, яке скривлюється вгору за одним напрямком і вниз – за іншим (рис. 5.2).
Для
такої гри
,
де
–
елемент
-ї
колонки,
;
–
сідлова точка
(точка рівно-ваги);
– елемент
-
го рядка,
Рис.5.2
.
Гра із сідловою точкою має єдиний розв’язок, який задовольняє обидві
сторони. Такий
розв’язок є оптимальний, а вибрані
стратегії згідно з цим розв’язком є
чисті. Отже, якщо обидві сторони
відповідають правильно, то розв’язок
буде єдиним
,
що влаштовує обидві сторони, тобто
.
Наприклад, нехай задано таку матрицю:
|
|
|
|
|
|
1 |
0 |
3 |
5 |
|
3 |
2 |
4 |
3 |
|
0 |
1 |
-1 |
4 |