- •Міністерство освіти і науки україни національний транспортний університет Дослідження операцій в моделюванні управлінських рішень
- •Isbn 978-966-632-185-8
- •I. Предмет і завдання дослідження операцій
- •1.1. Що таке дослідження операцій
- •1.2. Основні поняття та принципи дослідження операцій
- •1. 3. Математичні моделі операцій
- •1.4. Багатокритеріальні задачі дослідження операцій
- •1.5. Системний підхід до задач дослідження операцій
- •1.6. Типові класи задач дослідження операцій
- •1. Задачі управління запасами
- •2. Задачі розподілу ресурсів
- •3. Задачі ремонту і заміни обладнання
- •4. Задачі масового обслуговування
- •5. Задачі впорядкування
- •6. Задачі сітьового планування і управління (спу)
- •7. Задачі вибору маршруту (сітьові задачі на транспорті)
- •8. Комбіновані задачі
- •II. Класифікація методів оптимізації
- •2.1. Математичне формулювання загальної задачі оптимізації
- •2.2. Геометрична інтерпретація задач оптимізації
- •2.3. Класифікація методів оптимізації по виду цільової функції
- •2.4. Характеристика градієнтних методів пошуку екстремуму
- •III. Лінійне програмування
- •3.1. Задачі лінійного програмування
- •3.2. Основна задача лінійного програмування
- •3.3. Транспортна задача лінійного програмування
- •IV. Динамічне програмування
- •4.1. Метод динамічного програмування
- •4.2. Приклади розв’язання задач динамічного програмування
- •4.3. Завдання динамічного програмування в загальному вигляді. Принцип оптимальності
- •V. Елементи теорії масового обслуговування
- •5.1. Основні поняття теорії масового обслуговування
- •5.2. Класифікація систем масового обслуговування
- •5.3. Основні елементи систем масового обслуговування
- •5.4. Параметри смо і загальна методика дослідження
- •5.5. Системи масового обслуговування з відмовами
- •5.6. Кількісні показники смо з відмовами
- •5.7. Короткий опис основних типів пуассонівських смо
- •5.7.1. Смо з відмовами:
- •5.7.2. Смо з очікуванням і обмеженим потоком заявок
- •5.7.3. Смо змішаного типу з обмеженням по довжині черги
- •5.7.4. Смо змішаного типу з обмеженням за часом перебування заявки в черзі і на обслуговуванні
- •5.7.5. Приклади розв’язку задач тмо
- •VI. Теорія ігор
- •6.1. Ігрові моделі прийняття рішень
- •6.2. Прямокутні матричні ігри
- •6.3. Аналіз матричних ігр
- •6.4. Елементарні методи розв’язку ігор
- •6.4.1. Загальна схема розв’язання
- •6.4.2. Методи розв’язку гри 2 X 2
- •6.4.3. Методи розв’язання ігор 2хn
- •Ордината точки n дорівнює ціні гри ν, а абсциса дорівнює частоті застосування стратегії а1.
- •Аналітичний метод розв’язання гри 2хn
- •6.5. Загальний розв’язок гри m X n методом лінійного програмування
- •6.6. Наближені методи розв’язання матричних ігр
- •6.7. Приклади розв’язання задач теорії ігор
- •VII. Моделювання на пк
- •7.1. Поняття моделі і моделювання
- •7.2. Метод статистичних випробувань
- •7.3. Імітація випадкових впливів на пк
- •7. 4. Методи формування в пк базових впливів
- •7.5. Оцінка точності характеристик, отриманих методом статистичних випробувань. Необхідна кількість реалізацій
- •7.6. Приклади розв’язку задач методом статистичних випробувань
- •VIII. Метод cітьового планування
- •8.1. Поняття про сітьове планування та управління
- •8.2. Основні визначення
- •8.3. Основні елементи сітьового графіка
- •8.4. Правила побудови сітьового графіка
- •8.5. Часові параметри сітьових графіків
- •8.6. Способи розрахунку сітьових графіків
- •8.7. Оптимізація сітьових графіків
- •8.8. Імовірнісні тимчасові оцінки сітьових моделей
- •8.9. Укрупнення сітьових моделей
- •8.10. Зшивання сітьових моделей
- •Література
- •Для нотаток
6.3. Аналіз матричних ігр
Нижня і верхня ціни гри. Принцип мінімаксу
Розглянемо скінчену гру гравців А і В. Гравець А має m стратегій, гравець В-n стратегій. Стратегії першого гравця: А1, А2, ..., Аm, стратегії другого гравця: В1, В2, ..., Вn. Нехай відомі виграші для кожної пари стратегій. Складемо матрицю гри або платіжну матрицю (табл. 6.2). Поставимо собі задачу: визначити свою оптимальну стратегію.
Обираючи стратегію Аі, ми завжди повинні розраховувати на те, що противник відповість на її тією з стратегій Вj, для якої ваш виграш мінімальний.
Таблиця 6.2
Гравець А |
Гравець В |
||||
В1 |
…. |
Вj |
…. |
Bn |
|
А1 |
а11 |
…. |
a1j |
…. |
a1n |
…. |
…. |
…. |
…. |
…. |
…. |
Аі |
аі1 |
…. |
aij |
…. |
ain |
…. |
…. |
…. |
…. |
…. |
…. |
Аm |
аmі |
…. |
amj |
…. |
amn |
Визначимо
це значення виграшу, тобто мінімальне
з чисел в і-тому рядку. Позначивши його
через
,
отримаємо:
Випишемо
числа
поруч з матрицею праворуч у вигляді
додаткового стовпця (табл. 6.3)
Таблиця 6.3
B A |
B1 |
B2 |
….. |
Bn |
|
A1 |
A11 |
a12 |
….. |
a1n |
1 |
A2 |
A21 |
a22 |
….. |
a2n |
2 |
….. |
….. |
….. |
….. |
….. |
….. |
Am |
am1 |
am2 |
….. |
amn |
m |
|
|
2 |
….. |
n |
|
Очевидно,
першому гравцю найкраще вибрати таку
стратегію, яка дає найбільшу величину
.
Позначимо
Отримана величина називається нижньою ціною гри або максиміном. Стратегія, що відповідає цій величині, називається максимінною стратегією.
Нижня ціна гри означає той максимальний виграш, який ми можемо гарантувати в грі проти розумного противника, обираючи одну з своїх стратегій.
Очевидно,
аналогічне міркування можна провести
і за противника (гравця В). Він зацікавлений
в тому, щоб обернути виграш в мінімум.
Якщо гравець В обере якусь j-ту стратегію,
то гравець А відповість такою і-ю
стратегією, яка зробить виграш
максимальним. Позначимо виграш
0
—
це
максимальне значення, яке відповідає
j-тій стратегії. Знизу матриці визначимо
максимальні значення аіj
по кожному стовпцю:
Ясно, що сторона В обере таку стратегію, яка веде цей програш до мінімуму. Позначимо:
Величина
називається верхньою
ціною гри
або мінімаксом,
а відповідна їй стратегія — мінімаксною.
Верхня ціна гри — це мінімальний програш, на який може розраховувати «противник», який вибравши одну а своїх стратегій, розраховуючи на найгіршу для себе нашу поведінку.
Додержуючись своєї найбільш обережної мінімаксної стратегії, противник гарантує собі слідуюче: щоб ми не здійснили проти нього, він у всякому разі програє суму, яка не перебільшує .
Принцип, який потребує від обох гравців вибору відповідно максимінної і мінімаксної стратегій, називається принципом мінімакса.
Якщо = , то гра має так звану сідлову точку. Сідловій точці відповідає пара стратегій, які називаються оптимальним, а їх сукупність — розв’язком гри.
Чиста
ціна гри:
=
=
.
Приклад: Організується захист малорозмірного об’єкту: можливі 4 варіанти оборони А1, А2, А3, А4. Супротивник може застосовувати 4 варіанти нападу В1, В2, В3,В4. Відома платіжна матриця, в якій вказується відсоток знешкодженних засобів супротивника із загального числа при будь-якій стратегії. Необхідно вибрати такий варіант оборони, щоб забезпечити максимальне число знешкоджених засобів супротивника. Платіжна матриця задана табл. 6.4.
Таблиця 6.4
Варіанти захисту |
Варіанти нападу |
i |
|||
В1 |
В2 |
В3 |
В4 |
|
|
А1 |
50 |
60 |
90 |
40 |
40 |
А2 |
90 |
50 |
40 |
80 |
40 |
А3 |
80 |
70 |
90 |
90 |
70* |
А4 |
80 |
30 |
50 |
70 |
30 |
j |
90 |
70* |
90 |
90 |
= |
Тут
.
Оптимальними («чистими») стратегіями
є стратегії А3
і В2.
Розв’язок гри має наступну чудову властивість: у грі з сідловкою точкою відхилення від оптимальної стратегії не вигідне ні одному а гравців. Тому така гра стійка.
Якщо який-небудь гравець буде намагатися відхилися від своєї оптимальної лінії поведінки, то він цього лише програє. Якщо сідлова точка у грі відсутня,то розв’язок гри лежить в області замішаних стратегій.
Основна теорема теорії гри була доведена в 1928 р. Фон Нейманом. Вона стверджує, що кожна кінцева гра має, у крайньому разі, один вариант розв’язку (хоча б у класі змішаних стратегій).
Причому
ціна гри завжди лежить між нижньою і
верхньою ціною гри:
.
Розглянемо
гру 2
2,в
якій відома платіжна матриця (табл.
6.5):
Таблиця 6.5
В А |
q |
1-q |
i |
Р |
3 |
6 |
3 |
1-р |
5 |
4 |
4* |
i |
5* |
6 |
≠ |
Аналізуючи матрицю, знаходимо нижню і верхню ціну гри:
=4, =5.
Тут ≠ , отже сідлової точки немає. Отже, шукаємо розв’язок в області змішаних стратегій. Гравець А повинен прийняти свою змішану стратегію SA,гравець В-стратегію SB:
,
.
Знайдемо середній виграш:
M[а]=3pq + 6p(1 – q) + 5(1 – p)q + 4(1 – p) (1 – q).
Розв’язати гру з позиції гравця А — це означає знайти таке значення імовірності Р, яке забезпечить максимальне значення М[а] при будь-яких значеннях q, тобто при будь-яких діях гравця В, який намагається зменшити це значення. Формально це можна записати та
{max
min М [а]} max
p q
Після деяких алгебраїчних перетворень у виразі для М[а], отримаємо:
M[а]= −4(p – 1/4) (q – 1/2) + 4,5.
Аналізуючи цей вираз, приходимо до висновку, що якщо Р=1/4, то при будь-яких q значення середнього виграшу лишається рівним 4,5. Тому оптимальними стратегіями гравців А і В є стратегії:
,
S*B =
.
ЗАГАЛЬНЕ ОЗНАЧЕННЯ: в грі m x n змішана стратегія гравця А
,
Є ОПТИМАЛЬНОЮ, якщо вона забезпечує максимальне значення середнього виграшу при будь-яких діях гравця В, який намагається зменшити цей виграш, тобто це та стратегія, яка відповідає:
aij
pi qj.
Для гравця В оптимальною стратегією буде та, яка відповідає:
aij
pi qj.
В теорії гри доведено, що
Це значення називають ЦІНОЮ ГРИ:
.
Введемо поняття корисної стратегії. КОРИСНА СТРАТЕГІЯ — це стратегія, імовірність якої в оптимальній змішаній стратегії не дорівнює нулю.
