- •Лекціі по дисципліні «дослідження операції»
- •1. Динамічне програмування
- •1.1. Поняття динамічного програмування
- •1.2 Принцип поетапної побудови оптимального керування.
- •1.3 Задача про мінімізацію витрат пального літаком при наборі висоти і швидкості.
- •1.4 Метод функціональних рівнянь.
- •1.5 Задача розподілу ресурсів
- •1.5 Задача заміни устаткування
- •1.3.3. Задача планування виробництва з урахуванням попиту, виробничих потужностей підприємства й обсягу його складських приміщень
- •1.4. Детерміновані процеси
- •1.5. Стохастичні задачі динамічного програмування
- •1.5.1. Задача розподілу ресурсів у стохастичному варіанті
- •1.5.2. Задача видобутку корисної копалини
- •Випадкові процеси. Марковські випадкові процеси
- •2.1. Марковські ланцюги, матриця переходів
- •2.2. Властивості стохастичних матриць
- •2.2.1. Властивості стохастичних матриць і деякі їх різновиди.
- •2.3. Ергодична властивість ланцюгів Маркова. Перехідний режим
- •2.4. Марковський процес із дискретними станами і безупинним часом. Рівняння Колмогорова для ймовірностей станів системи
- •2.4.1. Граничні ймовірності станів для н.М.Л. Теорема Маркова
- •3. Теорія масового обслуговування (т.М.О.) Задача і предмет т.М.О.
- •3.1. Класифікація систем масового обслуговування і їх основні характеристики.
- •3.2. С.М.О. Із відмовами. Рівняння Ерланга
- •3.2.1. Сталий режим обслуговування. Формули Ерланга
- •3.3. Система м.О. З очікуванням
- •3.4. Багатоканальні с.М.О. Із необмеженою чергою
- •4.Теорія ігор
- •4.1. Визначення гри, види моделей
- •4.2. Антагоністична гра у нормальній формі. Принцип гарантованого результату
- •4.3. Проблема рівноваги в грі, чисті і змішані стратегії
- •4.4. Теорія про мінімакс. Усталеність одержуваних рішень
- •4.5. Засоби пошуку оптимальних стратегій. Загальні підходи
- •4.6. Рішення ігор 22, 2n, m2. Графоаналітичний метод
- •4.7. Розв’язання ігор mn
- •5. Елементи теорії статистичних ігор. Поняття про статистичні ігри
- •5.1. Вибір оптимальної стратегії статиста
- •Список літератури
4.3. Проблема рівноваги в грі, чисті і змішані стратегії
Якщо =, то в платіжній матриці присутній елемент apq, який мінімальний в р - рядку і max в q- стовпці і apq= = .
Приклад такої матриці
16 |
-22 |
-7 |
14 |
-8 |
|
11 |
10 |
8 |
15 |
21 |
a23=8=apq |
6 |
-9 |
6 |
13 |
-13 |
|
2 |
6 |
-5 |
-3 |
4 |
|
Очевидно, що елемент apq являє собою сідлову точку, що поєднує в собі і властивості т. min (для однієї перспектної) і точку max для іншої.
Такі ігри називаються іграми з сідловою точкою, мал.1.
|
Мал.1. |
Положення, при якому немає сенсу міняти стратегію жодної з сторін, називається ситуацією рівноваги. В іграх з сідловою точкою така ситуація виникає, якщо А та В використають стратегії Spa і Sqb, що називаються чистими. apq== називається чистою ціною гри, а стратегії Spa і Sqb - оптимальними.
Чисті стратегії застосовуються, коли А та В володіють відомостями про дії один іншого і про їх результати. Якщо такої інформації немає, то принцип рівноваги порушується і гра ведеться безсистемно, тобто наосліп. Тому треба розрізняти ігри з повною інформацією, коли будь-який учасник знає всю передісторію ігри та ігри з неповною інформацією, в яких знання передісторії обмежене (наприклад, можливістю приховати від супротивника хід).
Ми будемо розглядати ігри з повною інформацією та з однією сідловою точкою, бо за наявності двох сідлових точок apq і azt, можна показати, що apq=azt.
Хоча на практиці найбільш розповсюджений випадок, коли платіжна матриця взагалі не має сідлової точки та .
Якщо в гру привноситься
елемент випадку,
тобто стратегія Sia
буде обрана
з ймовірністю
Pia,
то можна говорити
про розподіл ймовірності
на множині
стратегій сторони
А, причому
.
А самий розподіл {P1a, P2a,…,Pma}=SA називається змішаною стратегією, якою володіє А в даній грі.
Аналогічно для B вводиться змішана стратегія SB={P1b,P2b,…,Pnb}, тобто деякий розподіл.
Чисті стратегії являються окремим випадком змішаних, наприклад, стратегію SPA можна задати SA={0, …,0,1, …,0}
При виборі змішаних стратегій зберігається принцип min max.
Нехай {SА} - множина змішаних стратегій А, а {SВ} - множина змішаних стратегій В. Тоді середня величина (мат. сподівання) платежу:
(4.1)
Це виграш А, отже програш В.
Сторона
А повинна орієнтуватися на гірше
(принцип гарантованості
результату). Тоді
-
оптимальна стратегія Sa.
Аналогічно
- оптимальна стратегія Sb.
Але такі рішення
тільки в простих випадках.

Для
таких ігор характерно, що відмова від
мінімаксної стратегії будь-якого з
учасників призводить його до програшу.