- •Лекціі по дисципліні «дослідження операції»
- •1. Динамічне програмування
- •1.1. Поняття динамічного програмування
- •1.2 Принцип поетапної побудови оптимального керування.
- •1.3 Задача про мінімізацію витрат пального літаком при наборі висоти і швидкості.
- •1.4 Метод функціональних рівнянь.
- •1.5 Задача розподілу ресурсів
- •1.5 Задача заміни устаткування
- •1.3.3. Задача планування виробництва з урахуванням попиту, виробничих потужностей підприємства й обсягу його складських приміщень
- •1.4. Детерміновані процеси
- •1.5. Стохастичні задачі динамічного програмування
- •1.5.1. Задача розподілу ресурсів у стохастичному варіанті
- •1.5.2. Задача видобутку корисної копалини
- •Випадкові процеси. Марковські випадкові процеси
- •2.1. Марковські ланцюги, матриця переходів
- •2.2. Властивості стохастичних матриць
- •2.2.1. Властивості стохастичних матриць і деякі їх різновиди.
- •2.3. Ергодична властивість ланцюгів Маркова. Перехідний режим
- •2.4. Марковський процес із дискретними станами і безупинним часом. Рівняння Колмогорова для ймовірностей станів системи
- •2.4.1. Граничні ймовірності станів для н.М.Л. Теорема Маркова
- •3. Теорія масового обслуговування (т.М.О.) Задача і предмет т.М.О.
- •3.1. Класифікація систем масового обслуговування і їх основні характеристики.
- •3.2. С.М.О. Із відмовами. Рівняння Ерланга
- •3.2.1. Сталий режим обслуговування. Формули Ерланга
- •3.3. Система м.О. З очікуванням
- •3.4. Багатоканальні с.М.О. Із необмеженою чергою
- •4.Теорія ігор
- •4.1. Визначення гри, види моделей
- •4.2. Антагоністична гра у нормальній формі. Принцип гарантованого результату
- •4.3. Проблема рівноваги в грі, чисті і змішані стратегії
- •4.4. Теорія про мінімакс. Усталеність одержуваних рішень
- •4.5. Засоби пошуку оптимальних стратегій. Загальні підходи
- •4.6. Рішення ігор 22, 2n, m2. Графоаналітичний метод
- •4.7. Розв’язання ігор mn
- •5. Елементи теорії статистичних ігор. Поняття про статистичні ігри
- •5.1. Вибір оптимальної стратегії статиста
- •Список літератури
4.1. Визначення гри, види моделей
Конфліктна ситуація вважається заданою, якщо відомі:
а) сторони, що беруть участь у конфлікті, позначимо {А, В, С,...}=W
б) їх стратегії (лінії поведінки) {SA, SB, SC,...}=S
в) очікувані результати, виходи {JA, JB, JC,...}=J
г) зацікавленість в цих результатах та її вираження. Для вираження зацікавленості у кількісній формі вводять на множині {J} числову функцію виграшу або платіжну функцію ПС (І). Вона визначає величину виграшу (позитивного або негативного) одержуваного стороною С від виходу І J.
Якщо в конфліктній ситуації задані всі означені її компоненти (а-г), то ця система умов (а-г) і називається грою.
Приклад 2. Підприємства А та В можуть випускати однакові види продукції. При виборі виробничих планів (які види і скільки продукції випускати) виникає конфліктна ситуація, що призводить або до перевиробництва одних і нестачі інших видів продукції.
Збалансувати ситуацію допоможе ігрова модель, де а) W={A; B}; б) S={S1a, S2a,..., S1b; S2b,...}, де Sia, Sjb - i стратегія заводу А, j - стратегія заводу В. В результаті споживач отримає тільки ту продукцію, яка передбачена цими планами (вихід Uij) Виграш А - ПА (Uij), виграш В В - ПВ (Uij) . Тут присутні усі елементи гри.
Ігри класифікуються за різними ознаками.
Якщо у грі більше однієї активної сторони, що бере участь, то це стратегічна гра.
Якщо тільки одна діюча і декілька зацікавлених сторін, то це нестратегічна гра.
Якщо число стратегій кінцеве у всіх сторін, то гра кінцева, в противному випадку нескінченна.
Кінцеві ігри зручно представляти у матричній (табличній) формі і їх називають матричними.
Стратегічні ігри називаються безкоаліційними, якщо кожна сторона, що оперує являється й зацікавленою. Тут виключена можливість коаліцій поміж учасниками на основі збігу інтересів і цілей.
Безкоаліційна гра, для якої ПА(Uij)=ПВ(Uij)=aij називається антагоністичною (або грою двох осіб з нульовою сумою) ПА(Uij)+ПВ(Uij)=0.
Якщо ПА (Uij)+ПВ (Uij)0, то це гра двох осіб з ненульовою сумою.
4.2. Антагоністична гра у нормальній формі. Принцип гарантованого результату
Так як антагоністичні ігри володіють тієї властивістю, що виграш одного (А) дорівнює програшу іншого (В), то всі необхідні дані можна помістити в таблицю (матрицю). Елементи матриці, числа aij. Така матриця - це нормальна форма подання ігри і називається вона платіжною (ігровою) матрицею, aij - виграш (програш) гравців. Гру, що представлена матрицею, називають грою mn.
Табл.1.1
В А |
S1b |
S2b |
- - - |
Snb |
S1a |
a11 |
a12 |
- - - |
a1n |
- - - - |
|
|
|
|
Sma |
am1 |
am2 |
- - - |
amn |
Нехай задана антагоністична гра в нормальній формі, тобто матрицею табл.1.1.
Знайдемо оптимальну стратегію гравців.
Очевидно, що для А при використанні стратегії S1а гарантованим виграшем буде найменше з a11, a12,..., a1n, тобто 1. Кращого результату, при правильній стратегії В, очікувати не доводиться.
Таким же чином А може розраховувати при виборі стратегії S2a, на min {a21,..., a2n}=2, тобто у випадку стратегії Ska на min {akj}= k і т. і.
Найкращої з всіх стратегій для А буде та, для якої k - max, тобто виграш А ((гарантований) =max k =max min {akj}
1<k<m 1<k<m 1<j<n
Така стратегія називається максимінною.
Якщо А буде дотримуватись максимінної стратегії, то поза залежністю від стратегії В він виграє не менше .
Тому - це нижня ціна гри або максимінний виграш.
Аналогічне міркування для В, оскільки йдеться про програші сторони А, так як в антагоністичній грі ПВ(Ukj)=-ПА(Ukj)=-akj. Тоді при стратегії Skb це найкращий показник. Вj=max{akj} =>В=minВj= min max akj
1<k<m 1<j<m 1<j<n 1<k<m
- де В - min програш з усіх max. Така стратегія B називається мінімаксною, а В - верхньою ціною гри або мінімаксним програшем. Це результат, що не залежить від поведінки А.
В проведеному аналізі кожна із сторін була орієнтована на гіршу, з її точки зору ситуацію, а після цього з всіх гірших вибиралася найкраща. Цей принцип - принцип гарантованого результату (або принцип мінімаксу). Він припускає відсутність ризику.
