- •Міністерство освіти і науки україни національний транспортний університет Дослідження операцій в моделюванні управлінських рішень
- •Isbn 978-966-632-185-8
- •I. Предмет і завдання дослідження операцій
- •1.1. Що таке дослідження операцій
- •1.2. Основні поняття та принципи дослідження операцій
- •1. 3. Математичні моделі операцій
- •1.4. Багатокритеріальні задачі дослідження операцій
- •1.5. Системний підхід до задач дослідження операцій
- •1.6. Типові класи задач дослідження операцій
- •1. Задачі управління запасами
- •2. Задачі розподілу ресурсів
- •3. Задачі ремонту і заміни обладнання
- •4. Задачі масового обслуговування
- •5. Задачі впорядкування
- •6. Задачі сітьового планування і управління (спу)
- •7. Задачі вибору маршруту (сітьові задачі на транспорті)
- •8. Комбіновані задачі
- •II. Класифікація методів оптимізації
- •2.1. Математичне формулювання загальної задачі оптимізації
- •2.2. Геометрична інтерпретація задач оптимізації
- •2.3. Класифікація методів оптимізації по виду цільової функції
- •2.4. Характеристика градієнтних методів пошуку екстремуму
- •III. Лінійне програмування
- •3.1. Задачі лінійного програмування
- •3.2. Основна задача лінійного програмування
- •3.3. Транспортна задача лінійного програмування
- •IV. Динамічне програмування
- •4.1. Метод динамічного програмування
- •4.2. Приклади розв’язання задач динамічного програмування
- •4.3. Завдання динамічного програмування в загальному вигляді. Принцип оптимальності
- •V. Елементи теорії масового обслуговування
- •5.1. Основні поняття теорії масового обслуговування
- •5.2. Класифікація систем масового обслуговування
- •5.3. Основні елементи систем масового обслуговування
- •5.4. Параметри смо і загальна методика дослідження
- •5.5. Системи масового обслуговування з відмовами
- •5.6. Кількісні показники смо з відмовами
- •5.7. Короткий опис основних типів пуассонівських смо
- •5.7.1. Смо з відмовами:
- •5.7.2. Смо з очікуванням і обмеженим потоком заявок
- •5.7.3. Смо змішаного типу з обмеженням по довжині черги
- •5.7.4. Смо змішаного типу з обмеженням за часом перебування заявки в черзі і на обслуговуванні
- •5.7.5. Приклади розв’язку задач тмо
- •VI. Теорія ігор
- •6.1. Ігрові моделі прийняття рішень
- •6.2. Прямокутні матричні ігри
- •6.3. Аналіз матричних ігр
- •6.4. Елементарні методи розв’язку ігор
- •6.4.1. Загальна схема розв’язання
- •6.4.2. Методи розв’язку гри 2 X 2
- •6.4.3. Методи розв’язання ігор 2хn
- •Ордината точки n дорівнює ціні гри ν, а абсциса дорівнює частоті застосування стратегії а1.
- •Аналітичний метод розв’язання гри 2хn
- •6.5. Загальний розв’язок гри m X n методом лінійного програмування
- •6.6. Наближені методи розв’язання матричних ігр
- •6.7. Приклади розв’язання задач теорії ігор
- •VII. Моделювання на пк
- •7.1. Поняття моделі і моделювання
- •7.2. Метод статистичних випробувань
- •7.3. Імітація випадкових впливів на пк
- •7. 4. Методи формування в пк базових впливів
- •7.5. Оцінка точності характеристик, отриманих методом статистичних випробувань. Необхідна кількість реалізацій
- •7.6. Приклади розв’язку задач методом статистичних випробувань
- •VIII. Метод cітьового планування
- •8.1. Поняття про сітьове планування та управління
- •8.2. Основні визначення
- •8.3. Основні елементи сітьового графіка
- •8.4. Правила побудови сітьового графіка
- •8.5. Часові параметри сітьових графіків
- •8.6. Способи розрахунку сітьових графіків
- •8.7. Оптимізація сітьових графіків
- •8.8. Імовірнісні тимчасові оцінки сітьових моделей
- •8.9. Укрупнення сітьових моделей
- •8.10. Зшивання сітьових моделей
- •Література
- •Для нотаток
6.5. Загальний розв’язок гри m X n методом лінійного програмування
Нехай
задана гра mn.
Гравець А має m стратегій А1,
А2,…,А3,
гравець В має n стратегій В1,
В2,…,
Вn.
Задана платіжна матриця
.
Необхідно знайти розв’язок гри, тобто дві оптимальні змішані стратегії гравців А і В.
S
(A)
=
,
S
(B)
=
(6.1)
де
=
1,
=
1, а також визначити ціну гри ν.
Наша оптимальна стратегія S (A) повинна забезпечувати нам виграш не менший за ν, при будь-якій поведінці противника; і виграш що дорівнює ν при його оптимальній поведінці — стратегія S (A).
Аналогічно, стратегія S (B) повинна забезпечувати противнику програш не більший ніж ν при будь-якій нашій поведінці; і програш, що дорівнює при нашій оптимальній поведінці стратегія S (A).
Величина
ціни гри ν в даному випадку нам не відома.
Будемо вважати, що вона дорівнює деякому
додатньому числу. Для нього достатньо,
що всі елементи матриці
були невід’ємними. Такого результату
завжди можна домогтися додаючи до
елементів
досить велику додатню величину L. При
цьому ціна гри збільшиться на L, а
розв’язок не зміниться.
Нехай ми обрали свою нормальну стратегію SА . Тоді наш середній виграш при стратегії Bj противника буде дорівнювати:
=
+
+…+
Наша
оптимальна стратегія має таку властивість,
що при будь-якій поведінці противника
забезпечує виграш, не менший за ν. Отже
для будь-якої стратегії
(j=1, 2…, n) числа
(j= 1, 2,…, n) не можуть бути меншими за ν.
Отримуємо ряд умов:
(6.2)
Крім того, р
+ р
+…+ р
= 1. (6.3)
Невідомими
є р
,
р
,…,р
і ν.
Поділимо нерівності на додатню величину ν і позначимо:
,
….
(6.4)
Тоді умови запишуться у вигляді співвідношень:
(6.5)
де
,
,…,
— невід’ємні числа
Поділивши
нерівності на
і використавши позначення, маємо:
(6.6)
Ми хочемо
зробити свій гарантований виграш
максимально можливим:
max.
Очевидно при цьому права частина рівності
(6.6) прийме мінімальне значення, тобто:
L= x1 + x2 + … + xm min (6.7)
Таким чином, задача знаходження розв’язку гри зводиться до задачі лінійного програмування: визначити невід’ємної величини, x1, x2…, xm, що задовольняють (6. 5) і мінімізують лінійну форму (6.7).
Як результат розв’язку сформульованої задачі лінійного програмування знаходимо ціну гри v і значення імовірностей p1, p2.... pm,, тобто оптимальну змішану стратегію SA* гравця А. Аналогічно знаходиться оптимальна змішана стратегія гравця В.
6.6. Наближені методи розв’язання матричних ігр
Часто в практичних задачах немає необхідності знаходити точний розв’язок гри. Достатньо знайти наближений розв’язок, який дає середній виграш, близький до ціни гри. Прийнятий для практики розв’язок можна отримати за допомогою методу ітерації.
Суть методу полягає в тому, що моделюється процес гри і підраховується середній виграш.
Починається з того, що гравець А обирає навмання одну з своїх стратегій, наприклад А1. Противник на це відповідає тією своєю стратегією Вj, яка найменш вигідна для гравця А, тобто обертає виграш при стратегії Аi на мінімум. На цей хід гравець А відповідає тією своєю стратегією Аk, яка дає максимальний середній виграш при використанні противником стратегії Вj. Далі знову черга противника. Він відповідає на пару ходів Аі і Аk тією своєю стратегією Вl, яка дає найменш середній виграш при цих двох стратегіях і так далі.
На кожному кроці ітераціонного процесу кожний гравець відповідає на будь-який хід іншого гравця тією самою стратегією, яка є оптимальною відносно всіх його ходів, що розглядаються як деяка змішана стратегія, в якій чисті стратегії представлені в пропорціях, що відповідають чистоті їх застосування.
Якщо таку імітацію процесу гри продовжувати досить довго, то середній виграш, що проводиться на одну пару ходів (елементарну гру), буде прямувати до ціни гри, а частоти p1, p2, …, pm, q1, q2,..., qn, з якими зустрічаються стратегії гравців в цьому розиграші, будуть наближатися до частот, що визначають оптимальні стратегії. Розрахунки показують, що збіжність методу дуже повільна, однак застосування ЕОМ усуває цю перешкоду.
Проілюструємо застосування ітераціонного методу на прикладі гри 3 x 3 (табл. 6.14)
Таблиця 6.14
В А |
В1 |
В2 |
В3 |
В4 |
А1 |
8 |
2 |
4 |
2 |
А2 |
4 |
5 |
6 |
4* |
А3 |
1 |
7 |
3 |
1 |
ßj |
8 |
7 |
6* |
≠ß |
Проведемо невеликий аналіз матриці гри згідно з загальною схемою розв’язку.
Нижня ціна гри = 4, ß = 6, тобто ≠ß.
Отже сідлової точки немає, домінуючих і дублюючих стратегій також немає.
Перші 14 кроків ітераціонного процесу наведені табл. 6.15. В першому стовпці подано номер елементарної гри (пари ходів n); в другому-номер і обраної стратегії гравця А; в в наступних трьох-накопичений виграш за перші n ігр при стратегіях противника В1, В2, В3. Мінімальне з цих значень підкреслене.
Далі йде номер j стратегії, яку обрав противник, і відповідно, накопичений виграш за n ігр при стратегіях А1, А2, А3.
Підкреслені значення визначають вибір відповідної стратегії іншого гравця. В наступних графах послідовно наведені мінімальний середній виграш ν, що дорівнює мінімальному накопиченому виграшу, поділеному на кількість ігор n; максимальний середній виграш υ, що дорівнює максимальному виграшу, поділеному на n, і їх середнє арифметичне:
ν* =
.
При збільшенні n всі три величини ν, ν, ν*, будуть наближатися до ціни гри ν, але величина ν, очевидно, буде наближатися до неї порівняно швидше.
Таблиця 6.15
N партії |
N стратегії гравця А |
Накопичений виграш гравця В за партію |
N стратегії гравця В |
Накопиче- ний виграш гравця А за партію |
Нижня ціна |
Верхня ціна |
Середній Виграш |
||||
n |
i |
B1 |
В2 |
В2 |
j |
A1 |
A2 |
A3 |
ν |
ν |
ν* |
1 |
3 |
B2 |
66 |
3 |
1 |
8 |
4 |
1 |
1 |
8 |
4. 50 |
2 |
1 |
B3 |
7 |
7 |
3 |
12 |
10 |
4 |
3. 50 |
6 |
4. 75 |
3 |
1 |
1 |
9 |
11 |
2 |
14 |
15 |
11 |
3. 67 |
5. 0 |
4. 33 |
4 |
2 |
9 |
11 |
17 |
2 |
16 |
20 |
18 |
4 |
5. 0 |
4. 5 |
5 |
2 |
17 |
16 |
23 |
2 |
18 |
25 |
25 |
4. 2 |
5. 0 |
4. 6 |
6 |
2 |
21 |
21 |
29 |
2 |
20 |
30 |
32 |
4. 33 |
5. 33 |
4. 82 |
7 |
3 |
25 |
26 |
32 |
1 |
28 |
34 |
33 |
4. 29 |
4. 86 |
4. 57 |
8 |
2 |
29 |
33 |
38 |
1 |
36 |
38 |
34 |
4. 25 |
4. 75 |
4. 50 |
9 |
2 |
30 |
38 |
44 |
1 |
44 |
42 |
35 |
4. 23 |
4. 89 |
4. 56 |
10 |
1 |
34 |
43 |
43 |
2 |
46 |
47 |
42 |
4. 5 |
4. 70 |
4. 60 |
11 |
2 |
38 |
45 |
54 |
1 |
54 |
51 |
43 |
4. 55 |
4. 91 |
4. 72 |
12 |
1 |
46 |
50 |
58 |
2 |
56 |
56 |
50 |
4. 33 |
4. 66 |
4. 49 |
13 |
2 |
50 |
52 |
64 |
2 |
58 |
61 |
57 |
4. 38 |
4. 70 |
4. 54 |
14 |
2 |
58 |
57 |
70 |
2 |
60 |
66 |
64 |
4. 43 |
4. 71 |
4. 56 |
Після закінчення гри необхідно підрахувати, скільки разів гравцем А застосовувалася кожна стратегія. Тоді оптимальна змішана стратегія гравця А буде задаватися набором відношень:
….
де ri — число, що показує, скільки разів застосовують стратегія А.
Аналогічно знаходиться змішана стратегія SB* гравця В.
Збіжність ітерацій тут досить повільна, але все-таки навіть такий невеликий розрахунок дає можливість знайти орієнтоване значення ціни гри і виявити перевагу корисних стратегій.
При використанні ЕОМ цінність методу значно збільшується.
Перевага ітераціонного методу розв’язку ігр полягає в тому, що об’єм і складність обчислень порівняно слабо зростають по мірі збільшення числа стратегій m і n.
