- •Лекціі по дисципліні «дослідження операції»
- •1. Динамічне програмування
- •1.1. Поняття динамічного програмування
- •1.2 Принцип поетапної побудови оптимального керування.
- •1.3 Задача про мінімізацію витрат пального літаком при наборі висоти і швидкості.
- •1.4 Метод функціональних рівнянь.
- •1.5 Задача розподілу ресурсів
- •1.5 Задача заміни устаткування
- •1.3.3. Задача планування виробництва з урахуванням попиту, виробничих потужностей підприємства й обсягу його складських приміщень
- •1.4. Детерміновані процеси
- •1.5. Стохастичні задачі динамічного програмування
- •1.5.1. Задача розподілу ресурсів у стохастичному варіанті
- •1.5.2. Задача видобутку корисної копалини
- •Випадкові процеси. Марковські випадкові процеси
- •2.1. Марковські ланцюги, матриця переходів
- •2.2. Властивості стохастичних матриць
- •2.2.1. Властивості стохастичних матриць і деякі їх різновиди.
- •2.3. Ергодична властивість ланцюгів Маркова. Перехідний режим
- •2.4. Марковський процес із дискретними станами і безупинним часом. Рівняння Колмогорова для ймовірностей станів системи
- •2.4.1. Граничні ймовірності станів для н.М.Л. Теорема Маркова
- •3. Теорія масового обслуговування (т.М.О.) Задача і предмет т.М.О.
- •3.1. Класифікація систем масового обслуговування і їх основні характеристики.
- •3.2. С.М.О. Із відмовами. Рівняння Ерланга
- •3.2.1. Сталий режим обслуговування. Формули Ерланга
- •3.3. Система м.О. З очікуванням
- •3.4. Багатоканальні с.М.О. Із необмеженою чергою
- •4.Теорія ігор
- •4.1. Визначення гри, види моделей
- •4.2. Антагоністична гра у нормальній формі. Принцип гарантованого результату
- •4.3. Проблема рівноваги в грі, чисті і змішані стратегії
- •4.4. Теорія про мінімакс. Усталеність одержуваних рішень
- •4.5. Засоби пошуку оптимальних стратегій. Загальні підходи
- •4.6. Рішення ігор 22, 2n, m2. Графоаналітичний метод
- •4.7. Розв’язання ігор mn
- •5. Елементи теорії статистичних ігор. Поняття про статистичні ігри
- •5.1. Вибір оптимальної стратегії статиста
- •Список літератури
4.4. Теорія про мінімакс. Усталеність одержуваних рішень
Нехай дана ігрова матриця
А={аij}
та
,
.
Причому аке=α
і аgh=β
.
Тоді аке≤ аkh , а аgh≥аkh => аке=α≤аkh≤аgh=β.
Якщо немає сідлової точки (α β), то α <β.
Якщо α <β, то застосування змішаних стратегій S*А, S*B повинно призвести до поліпшення в середньому, положення учасників гри, тобто αА≥ α, αВ≤β, чим при чистих стратегіях.
Як пов'язані αА и αВ? Відповідь дає теорема про мінімакс.
Теорема У випадку кінцевої антагоністичної гри з повною інформацією αА=αВ при α .
Ця теорема вказує на існування ситуації рівноваги для випадку α а отже, оптимальних стратегій S*А, S*B, тобто рішення гри, що дозволяє домагатися середньоочікуваного виграшу γ=αА=αВ, називаного ціною гри. Причому α≤γ≤β.
Визначення. Ті з стратегій Sia, Sjb, що входять до S*А, S*B (тобто Pia>0, Pjb>0) називаються активними стратегіями в складі S*А, S*B.
Теорема (про активні стратегії). Якщо один з учасників гри притримується своєї оптимальної змішаної стратегії, то очікуваний виграш залишиться незмінним і рівним γ незалежно від дій іншого учасника в межах його активних стратегій.
Доказ.Нехай JА, JB - множина i, j, таких, що P*ia>0, P*jb>0, тобто Sia, Sjb - активні стратегії, γ - ціна гри, при оптимальних S*А та S*B, а γi - середній виграш А при стратегії S*А проти Sjb. Очевидно, що γ i≥ γ (перехід до неоптимальної стратегії Sjb тільки збільшує програш В).
Тоді при
,
де
,
одержимо, що усі γi=γ,
тобто програш В не залежить від чистої
стратегії Sjb
при S*А.
Аналогічний доказ при змішаній стратегії
Sb.
Тут очікуваний виграш А складе
,
тому що Sb
не оптимальний, то
,
але
,
тому що тоді S*А
не оптимальна. Тому
.
Аналогічно для В.
Зауваження 1. S*А и S*B - оптимальні для {аij}, оптимальні і для {аij+c}.
Висновок. Кожна кінцева (матрична) гра з повною інформацією має хоча б одне рішення або в чистих стратегіях (α=β), або в змішаних (α β), тобто будь-яка така ситуація має ситуацію рівноваги.
4.5. Засоби пошуку оптимальних стратегій. Загальні підходи
Якщо в матриці А={аij} є сідлова точка, то ми маємо аpq= α = β . Нехай α β, тобто немає сідлової точки. Тоді рішення треба шукати в змішаних стратегіях SA={P1a,P2a,…,Pma}; SB={P1b,P2b,…,Pnb}. Так як m і n можуть бути великі, то треба подумати про спрощення гри.
Визначення. Якщо матриця А={аij} має властивості аkj ≥ аrj (k=1,2, …,m; j=1,2,…,n), kr і хоча б одне аkj>аrj, то її k-й рядок домінує над r-м рядком.
При аil≤ аih (i=1,2,…,m) і хоча б одному аil<аih , говорять, що l-й стовпчик домінує над h - м. Очевидно сторона А вибере стратегію Sка, замість Sra, сторона B - стратегію Slb, замість Shb.
Отже при збереженні в матриці А тільки домінуючих рядків і стовпчиків ціна гри не зміниться, але зменшиться її розмірність. Ця властивість гри називається редукцією.
Приклад 3.
|
S1b |
S2b |
S3b |
S4b |
2-ий стовпчик домінує над 4-м |
|
S1b |
S2b |
S3b |
3-ий рядок домінує над 1-м |
S1a |
2 |
0 |
1 |
4 |
S1a |
2 |
0 |
1 |
||
S1a |
1 |
2 |
5 |
3 |
S2a |
1 |
2 |
5 |
||
S1a |
4 |
1 |
3 |
2 |
S3a |
4 |
1 |
3 |
|
S1b |
S2b |
S3b |
2-ий стовпчик домінує над 3-м |
|
S1b |
S2b |
Гра зредуциру-вала з 34 до 22 |
S2a |
1 |
2 |
5 |
S2a |
1 |
2 |
||
S3a |
4 |
1 |
3 |
S3a |
4 |
1 |
||
|
|
|
|
|
|
|
|
|
Іншим розповсюдженим способом спрощення ігор являється штучна заміна вихідних чистих стратегій S1a,…,Sma,S1b,…,Snb очевидними змішаними стратегіями з внесенням відповідний коректив у платіжну матрицю А.
Приклад 4. Нехай у грі припускається змішування стратегій у рівних пропорціях. Так в силу однаковості елементів перших двох стовпчиків стратегій S1b і S2b потрібно змінювати з частотою ½ (без урахування S3b і S4b).
Такою ж властивістю володіє і S3b та S4b.
Нові
|
S1b |
S2b |
S3b |
S4b |
|
|
S’1b |
S2b |
S1a домінує над S2a |
|
S’1b |
S2b |
S1a |
0 |
7 |
7 |
3 |
S1a |
3,5 |
5 |
S1a |
3,5 |
5 |
||
S1a |
-7 |
0 |
3 |
7 |
S2a |
-3,5 |
5 |
S2a |
-3,5 |
5 |
||
S1a |
7 |
-7 |
-1 |
-1 |
S3a |
0 |
-1 |
|
|
|
Тоді а11=3,5 - сідлова точка. Отже оптимальне рішення (S1a, S1b).
Висновок. При дослідженні будь-якої гри (mn)
перевіряємо, чи є в А сідлові точки і пов'язані з ними рішення в чистих стратегіях;
якщо αβ , то намагаються виявити домінуючу стратегію, а також стратегії, що призводять до однакових результатів;
потім переходять до формування змішаних стратегій. У результаті знаходиться спрощена гра без сідлових точок, аналог гри mn.
