- •Лекціі по дисципліні «дослідження операції»
- •1. Динамічне програмування
- •1.1. Поняття динамічного програмування
- •1.2 Принцип поетапної побудови оптимального керування.
- •1.3 Задача про мінімізацію витрат пального літаком при наборі висоти і швидкості.
- •1.4 Метод функціональних рівнянь.
- •1.5 Задача розподілу ресурсів
- •1.5 Задача заміни устаткування
- •1.3.3. Задача планування виробництва з урахуванням попиту, виробничих потужностей підприємства й обсягу його складських приміщень
- •1.4. Детерміновані процеси
- •1.5. Стохастичні задачі динамічного програмування
- •1.5.1. Задача розподілу ресурсів у стохастичному варіанті
- •1.5.2. Задача видобутку корисної копалини
- •Випадкові процеси. Марковські випадкові процеси
- •2.1. Марковські ланцюги, матриця переходів
- •2.2. Властивості стохастичних матриць
- •2.2.1. Властивості стохастичних матриць і деякі їх різновиди.
- •2.3. Ергодична властивість ланцюгів Маркова. Перехідний режим
- •2.4. Марковський процес із дискретними станами і безупинним часом. Рівняння Колмогорова для ймовірностей станів системи
- •2.4.1. Граничні ймовірності станів для н.М.Л. Теорема Маркова
- •3. Теорія масового обслуговування (т.М.О.) Задача і предмет т.М.О.
- •3.1. Класифікація систем масового обслуговування і їх основні характеристики.
- •3.2. С.М.О. Із відмовами. Рівняння Ерланга
- •3.2.1. Сталий режим обслуговування. Формули Ерланга
- •3.3. Система м.О. З очікуванням
- •3.4. Багатоканальні с.М.О. Із необмеженою чергою
- •4.Теорія ігор
- •4.1. Визначення гри, види моделей
- •4.2. Антагоністична гра у нормальній формі. Принцип гарантованого результату
- •4.3. Проблема рівноваги в грі, чисті і змішані стратегії
- •4.4. Теорія про мінімакс. Усталеність одержуваних рішень
- •4.5. Засоби пошуку оптимальних стратегій. Загальні підходи
- •4.6. Рішення ігор 22, 2n, m2. Графоаналітичний метод
- •4.7. Розв’язання ігор mn
- •5. Елементи теорії статистичних ігор. Поняття про статистичні ігри
- •5.1. Вибір оптимальної стратегії статиста
- •Список літератури
4.6. Рішення ігор 22, 2n, m2. Графоаналітичний метод
Припустимо, що гра 22, задана матрицею А не має сідлової точки і потрібно знайти її рішення S*A={P*1a,P*2a}; S*B={P*1b,P*2b}.
|
S1b |
S2b |
Відповідно до теореми про активні стратегії, сторона А, дотримуючись оптимальної стратегії S*A забезпечить собі виграш γ навіть, якщо В буде використовувати не оптимальну стратегію S*B, а окремі S1b, S2b. |
S1a |
а11 |
а12 |
|
S2a |
а21 |
а22 |
Тоді а11
P*1a+
а21
P*2a=γ
(в B - стратегія S1b)
і а12 P*1a+ а22P*2a=γ (в B - стратегія S2b) (А)
Аналогічно для оптимальної стратегії B - S*B
а11
P*1b+
а21
P*2b=
γ (в А - стратегія S1а)
і а12 P*1b+ а22 P*2b= γ (в А - стратегія S2а) (В)
Невідомими в цих формулах є P*1a, P*2a, P*1b, P*2b та γ, що обчислюються по формулах (рішення системи трьох рівнянь з трьома невідомими).
Для системи (А)
;
;
(4.2)
Для системи (В)
;
;
(4.3)
Для (2 - 3)
або
тоді
та
. (4.4)
Виконання (2.4) означає відсутність сідлової точки у матриці А (немає елемента мінімального в рядку і максимального в стовпчику).
Звернемося до геометричної інтерпретації результатів. Нехай SA={P1a,P2a} - довільна змішана стратегія А проти чистої S1b - В і середньоочікуваний виграш γ1=а11P1b+а21P2b=(а11-а21)P1а+а21. Те ж саме відноситься до чистої стратегії В - S2b: γ2=а12P1а+а22P2b=(а12-а22)P1а+а22.
Але ні S1b,
ні S2b
не оптимальні для В. Сторона
А повинна розраховувати на виграш
.
При заданих аij
γ1 і
γ1 -
функції від P1а,
отже й
і її
значення збігаються або з γ1
(γ1<γ2),
або з γ2
(γ1>γ2).
Отже, можна побудувати графік
і знайти SA,
γ . Для А у залежності від (2.4)
буде мати місце або мал.2, або мал.3.
або
Мал.2. Мал.3.
Сторону
А цікавить те P1a,
при якому
-
максимальне. Прямі будуються по точках
(0,а21);
(1,а11);
(0,а22);
(1,а12).
P*1a
одержуємо, прирівнюючи γ1
і γ2
(а11-а21)P1а+а21=(а12-а22)P1а+а22,
відкіля й одержуємо формулу (2) для P*1a:
.
Величини
P*1b
і P*2b
визначаються в залежності від (4)
аналогічно, мал.4, мал.5, але в побудовах
беруть участь точка
(0,а12)
і (1,а11)
для γ1
і (0,а22)
і (1,а21)
для γ11
і замість
розглядається
,
де γ1=а11P1b+а12P2b,
γ11=а21P1а+а22P2b
і відшукується
.
або
Мал.4. Мал.5.
Приклад 5. Дана гра
-
2
-1
-3
4
Знайти оптимальні стратегії сторін. а11=2; а21=-3; а12=-1; а22=4
Переконаємося, що немає сідлових точок.
Обчислимо
α =max{-1;-3}=-1, β =min{2;4}=2, α β
. По точках
(0; -3) і (1;2) будуємо пряму
,
мал.6, по (0;4) і (1;-1) - пряму
,
мал.6. По точках
(0;-1) і (1;2) будуємо пряму
,
мал.7, по (0;4) і (1;-3) - пряму
,
мал.7.
Мал.6. Мал.7.
Max
досягається при P*1а=0,7
і дорівнює 0,5;
- при P*1b=0,5
і дорівнює 0,5. Слушність
можна перевірити по формулах (2 і 3).
Тоді S*A=(0,7;0,3); S*B=(0,5;0,5).
Нехай задана
гра 2n,
що не має сідлових
точок.
Знайдемо
її рішення:
S*A={P*1a,P*2a};
S*B={P*1b,P*2b,…,P*nb}...
Застосовуючи проти кожної із окремих
стратегій Sjb
S*A,
одержимо γ=а11P*1a+а21P*2a;…;γ=
=а1nP*1a+а2nP*2a.
Точно також, застосовуючи проти кожної
Sia
S*B,
одержимо γ=а11P*1b+а12P*2b+…+
а1nP*1a;
γ =а21P*1b+а22P*2b+…+
а2nP*nb;
.
Аналітичне рішення цих систем більш складне, чим 22. Тому вирішимо графічно. |
|
S1b |
S2b |
… |
Snb |
S1a |
а11 |
а12 |
… |
а1n |
|
S2a |
а21 |
а22 |
… |
а2n |
Загальна схема пошуку S*A, S*B:
за даними матриці будуємо n прямих γ1=(а11-а21)P1а+а21, γ2=(а12-а22)P1а+а22,…,γn=(а1n-а2n)P1а+а2n, і креслимо графік
,
на ньому
знаходиться екстремальна точка
(P*1a;γ);вибираються дві будь-які прямі з протилежним нахилом із тих, що перетинаються у цій точці;
прямим стратегії, що відповідають цим Srb Skb включаються в гру 22 проти S1а S2а.
отримана гра 22 вирішується аналітично за допомогою формул або графічно.
Аналогічно для рішення
гри m2.
Єдина відмінність
буде полягати в тому, що будують прямі
γi=(аi1-аi2)P1b+аi2,
i=1,2,…,m і знаходимо
,
мінімум
досягається в P*1b
і точка
(P*1b,γ)
використовується для переходу до гри
22.
Приклад 6. Дана гра 42. Вона не має сідлових точок α =1< β =3.
γ1=(а11-а12)P1b+а12=(3-1) P1b+1= 2P1b+1, γ2=(а21-а22)P1b+а22= -5P1b+3, γ3=(а31-а32)P1b+а32=8P1b-3, γ4=(а41-а42)P1b+а42= -1,5P1b+2. |
|
S1b |
S2b |
S1a |
3 |
1 |
|
S2a |
-2 |
3 |
|
S3a |
5 |
-3 |
|
S4a |
0,5 |
2 |
|
|
|
|
Знаходимо P*1b=0,29, γ =1,56. Через цю точку проходять прямі γ1, γ2, γ4. Тому сторона А має три активні стратегії S1a, S2a, S4a.
вибираємо з цих трьох прямих дві з протилежними нахилами, наприклад, γ1 та γ2.
|
|
Одержали те ж саме, що і графічно. У такий спосіб S*A=(2/7,5/7,0,0), S*B=(2/7,5/7), γ =11/7.
Якщо вибрати γ1 та γ4, то одержимо гру
-
3
1
½
2
та її рішення S*A=(3/7,0,0,4/7), S*B=(2/7,5/7), γ =11/7.
