
- •Розділ 3. Елементи теорії ігор
- •3.1. Предмет і деякі основні поняття теорії ігор
- •3.2. Матричні ігри. Розв’язування матричних ігор в чистих стратегіях
- •3.3. Розв’язування матричних ігор в змішаних стратегіях
- •Приклад 3.3. Виконати всі можливі спрощення платіжної матриці
- •Приклад 3.4. Спростити платіжну матрицю
- •3.4. Числові методи розв’язування матричних ігор
- •3.5. Елементи теорії статистичних ігор
- •Контрольні запитання та задачі
- •Які ситуації називаються конфліктними?
- •Розділ 4. Нелінійне програмування (нп)
- •4.1. Відомості з теорії функцій багатьох змінних
- •4.1.1. Функція. Частинні похідні. Диференціал
- •4.1.2. Екстремум функції багатьох змінних
- •4.2. Задача нелінійного програмування
- •4.3. Дробово-лінійне програмування
- •4.4. Метод множників Лагранжа. Економічний зміст множників Лагранжа
- •4.5. Графічний метод розв'язування задач нп
- •4.6. Теорема Куна-Таккера
- •Контрольні запитання та задачі
- •5.1. Основні поняття дп
- •5.2. Постановка задач дп. Метод функціональних рівнянь р.Белмана
- •5.3. Економічні задачі, що розв'язуються методом дп
- •5.3.1. Задача розподілу ресурсів
- •5.3.2. Задача про збільшення виробничих потужностей за рахунок відрахувань з прибутку
- •5.3.3. Задача про вибір найбільш економного маршруту постачання вантажу
- •5.3.4. Задача мінімізації витрат пального літаком при набиранні висоти і швидкості
- •5.3.5. Задача заміни обладнання
- •5.4. Детерміновані та стохастичні задачі дп
- •Контрольні запитання та задачі
- •Розділ 6. Елементи стохастичного програмування
- •6.1. Загальна характеристика задач стохастичного програмування
- •6.2. Задача розподілу ресурсів в стохастичному варіанті
- •6.3 Задача про агента
- •Контрольні запитання та задачі
- •Розділ 7. Використання Пакетів прикладних програм при розв’язуванні злп
- •7.1. Загальні зауваження
- •7.2. Розв’язування задач математичного програмування за допомогою ms excel
- •7.2.1. Розв’язування злп записаних в стандартному вигляді
- •Ввести умову задачі:
- •Розв’язати задачу:
- •Послідовність виконання операцій
- •Ввід початкових даних.
- •7.2.2. Розв’язування зцлп
- •Після натискання кнопки Выполнить отримуємо:
- •У кінцевому звіті маємо: .
- •7.2.3.Транспортна задача
- •7.3. Використання пакету Maple для розв’язування задач лінійного програмування
- •Зразки контрольних робіт та індивідуальні завдання
- •Контрольна робота №1
- •Критерій оцінювання
- •Контрольна робота №2
- •Критерій оцінювання
- •Індивідуальні завдання Індивідуальне завдання 1
- •Індивідуальне завдання 2
- •Індивідуальне завдання 3
- •Індивідуальне завдання 4
- •Індивідуальне завдання 5
- •Індивідуальне завдання 6
- •Індивідуальне завдання 7
- •Індивідуальне завдання 8
- •Індивідуальне завдання 9
Елементи теорії ігор Розділ 3
Розділ 3. Елементи теорії ігор
3.1. Предмет і деякі основні поняття теорії ігор
В процесі людської діяльності виникають ситуації, в яких інтереси окремих осіб або протилежні, або не співпадають, і в яких кожна особа хоче досягти найкращого результату за рахунок іншої. Подібного роду ситуації трапляються і в різних сферах виробничої діяльності.
Для вказаних ситуацій (назвемо їх конфліктними) характерно, що ефективність рішень, які приймаються в ході конфлікту кожною із сторін, суттєво залежить від дій протилежної сторони. При цьому жодна зі сторін не може повністю контролювати стан справ, оскільки кожній з них рішення доводиться приймати в умовах невизначеності. В одних випадках конфліктні ситуації виникають в результаті свідомої діяльності людей, в інших – вони породжуються недостатньою інформативністю про умови проведеної операції.
Розділ математики, який вивчає конфліктні ситуації, називається теорією ігор. Це така математична теорія, яка визначає рекомендації з раціонального способу дій для кожної із сторін в ході конфліктної ситуації.
Гра – це спрощена модель конфліктної ситуації, яка відрізняється від реального конфлікту тим, що ведеться за певними правилами, які визначають можливі дії її учасників. Суть гри полягає в тому, що кожен із учасників приймає такі рішення, які на його думку можуть забезпечити найкращий результат. Результат – це значення деякої функції, яка називається функцією виграшу (платіжною функцією).
Величина виграшу залежить від стратегії, яку застосовує гравець. Стратегія – це сукупність правил, які однозначно визначають кожен варіант проведення гри. Протягом гри гравці здійснюють певні ходи. Хід – це вибір і реалізація гравцем одного із можливих варіантів поведінки. Ходи бувають особисті і випадкові. При особистому ході гравець свідомо вибирає і реалізує ту чи іншу стратегію. При випадковому ході вибір стратегії проводиться з використанням механізму випадкового вибору.
За характером виграшу ігри діляться на ігри з нульовою і ненульовою сумою. В перших загальний капітал гравців не міняється, а лише перерозподіляється в ході гри, в зв’язку з чим сума виграшів рівна нулю. В других— сума виграшів учасників гри відмінна від нуля.
За виглядом функцій виграшу ігри діляться на матричні, біматричні, неперервні, опуклі та інші, а за кількістю ходів – на одноходові (виграш розподіляється після одного ходу гравця) і багатоходові (виграш розподіляється після декількох ходів).
3.2. Матричні ігри. Розв’язування матричних ігор в чистих стратегіях
Нехай у кожного з двох гравців A і
B скінченне число можливих дій –
чистих стратегій: гравець A володіє
m чистими стратегіями A1,
A2, …, Am, а гравець
B – n чистими стратегіями B1,
B2, …., Bn. Щоб
гра була повністю визначена, необхідно
вказати правило, яке кожній парі чистих
стратегій (Aі;Bj
)ставить у відповідність число aij
– виграш гравця A за рахунок гравця
B або програш гравця B. При aij<0
гравець A платить гравцю B суму
.
В грі, яка складається тільки з особистих
ходів, вибір пари чистих стратегій
(Aі;Bj) єдиним
чином визначає її результат. Якщо ж в
грі використовуються і випадкові ходи,
то її результат обумовлюється середнім
значенням виграшу (математичним
сподіванням).
Якщо відомі значення aij виграшу для кожної пари (Aі; Bj) стратегій, то можна записати матрицю гри (платіжну матрицю)
Таблиця 3.1
Ai |
Bj |
|
||
B1 |
………. |
Bn |
||
A1 |
|
……. |
|
|
….. |
…… |
…….. |
…… |
……. |
Am |
|
…….. |
|
|
βj |
β1 |
…….. |
βn |
|
Платіжна матриця – це табличний запис функції виграшу. Описані ігри називають матричними. Окрема партія в такій грі реалізується наступним чином. Гравець A вибирає один із рядків платіжної матриці (одну з своїх чистих стратегій). Елемент матриці, який стоїть на перетині вибраного рядка і стовпця, визначає виграш гравця A (програш гравця B ).
Метою гравців є вибір найбільш вигідних стратегій, при яких гравець A вибирає максимальний виграш, а B – мінімальний програш. В теорії ігор виходять з припущення, що кожен гравець вважає свого супротивника розумним і намагається не дати йому досягти найкращого результату.
Визначення 3.1. Стратегія гравця A називається оптимальною, якщо при її застосуванні виграш гравця A не зменшиться, якими б стратегіями не користувався гравець B.
Визначення 3.2. Стратегія гравця B називається оптимальною, якщо при її застосуванні програш гравця B не збільшується, які б стратегії не застосовував гравець A.
Враховуючи наведені визначення, гравець
A аналізує матрицю виграшів наступним
чином: для кожної своєї чистої стратегії
Aі він визначає мінімальне
значення
,
виграшу в залежності від застосованих
гравцем B чистих стратегій Bj.
Потім серед усіх мінімальних виграшів
він шукає таку чисту стратегію Ai0,
при якій цей виграш буде максимальний,
тобто знаходить
.
(3.1)
Визначення 3.3. Число
,
яке визначається рівністю (3.1),
називається нижньою чистою ціною гри
(максиміном).
Воно показує, який мінімальний виграш може отримати гравець A, застосовуючи свої чисті стратегії при будь-яких діях гравця B. Відповідна стратегія Ai0 гравця A називається максимінною.
Аналогічно, гравець B намагається
максимально зменшити свій програш. Тому
він для кожної чистої стратегії Bj
шукає
,
а потім серед Bj (див.
таблиця 3.1) знаходить стратегію Bj0,
при якій його програш буде мінімальним,
тобто
.
(3.2)
Визначення 3.4. Число
,
яке визначається за формулою (3.2),
називається верхньою чистою ціною гри
(мінімаксом).
Воно показує, який максимальний програш може бути в гравця B внаслідок використання чистих стратегій. Відповідна чиста стратегія Bj гравця B називається мінімаксною.
Таким чином, використовуючи чисті
стратегії, гравець A забезпечує
виграш не менше
,
а гравець В в результаті застосування
своїх чистих стратегій може не дозволити
гравцю A виграти більше, ніж
.
Визначення 3.5. Принцип обережності, який диктує гравцям вибір максимінної і мінімаксної стратегій, називають принципом мінімакса.
Приклад 3.1. Знайти максимінну і мінімаксну стратегії в грі з матрицею
.
Розв’язок. Заповнимо для даної матриці таблицю 3.2
Таблиця 3.2
Ai |
Bj |
|
|||
B1 |
B2 |
B3 |
B4 |
||
A1 |
0 |
4 |
-1 |
3 |
-1 |
A2 |
1 |
0 |
2 |
2 |
0 |
A3 |
3 |
1 |
-2 |
-1 |
-2 |
βj |
3 |
4 |
2 |
3 |
|
,
.
Отже, максимінною стратегією для гравця A є стратегія A2, а мінімаксною стратегією гравця B – стратегія B3.
Зв’язок між нижньою чистою ціною гри і верхньою чистою ціною гри встановлює наступна теорема, яку ми сформулюємо без доведення.
Теорема 3.1. В матричній грі її
нижня чиста ціна
гри не перевищує верхньої чистої ціни
,
тобто
.
Якщо в матричній грі нижня і верхня
чисті ціни співпадають, тобто
,
то кажуть, що ця гра має сідлову точку
в чистих стратегіях і чисту ціну гри
.
Визначення 3.6. Позначимо через
i* і j*
номери чистих стратегій, при яких має
місце рівність
.
Пару чистих стратегій
гравців A і B, при яких досягається
ця рівність, називають сідловою точкою
матричної гри, а елемент
платіжної матриці, який стоїть на
перетині i*-го рядка, j*-
го стовпчика, – сідловим елементом.
Сідловий елемент
є найменшим в i*-му рядку
і найбільшим в j*-му
стовпчику, тобто
.
Тому, якщо гравець B відхилиться від
своєї мінімаксної стратегії, його
програш може збільшитися. Аналогічно
відхилення гравця A від своєї
максимінної стратегії веде до зменшення
його виграшу. Таким чином, мінімаксні
стратегії в грі з сідловою точкою мають
властивість стійкості. Звідси випливає,
що якщо в матриці гри існує сідловий
елемент, то найкращими для гравців є їх
мінімаксні стратегії.
Визначення 3.7. Чисті стратегії Aі* і Bj*, які утворюють сідлову точку і виділяють в матриці гри сідловий елемент, називаються оптимальними чистими стратегіями відповідно гравців A і B.
Визначення 3.8. Набір
називається розв’язком гри.
Приклад 3.2. Знайти розв’язок гри, заданої матрицею
.
Розв’язок. Заповнимо для даної матриці таблицю 3.3.
Таблиця 3.3
Ai |
Bj |
|
||||||||
B1 |
B2 |
B3 |
B4 |
|
||||||
A1 |
4 |
2 |
3 |
2 |
2 |
|||||
A2 |
6 |
1 |
-1 |
-3 |
-3 |
|||||
A3 |
9 |
-2 |
-5 |
1 |
-5 |
|||||
βj |
9 |
2 |
3 |
2 |
|
,
,
.
В даному випадку маємо дві сідлові точки
(A1,
B2)
і (A1,
B4).
Отже, розв’язками гри будуть: {A1;
B2;
2}
і {A1;
B4;
2}.