- •Розділ 1. Методологічні основи дослідження операцій
- •1.1 Етапи дослідження операцій
- •1.2 Математичне моделювання. Загальна структура
- •1.3 Етапи математичного моделювання. Приклади
- •1.4 Розділи і класи задач дослідження операцій
- •1.5 Основні вимоги до математичних моделей і їх властивості
- •1.6 Формалізація принципів оптимального поводження в моделях прийняття рішення.
- •Розділ 2. Задачі лінійного програмування
- •2.1 Попередні відомості теорії лінійного програмування.
- •2.2 Графічна інтерпретація розв’язання задач лп
- •2.3 Змістовний опис симплекс-методу розв’язання задач лп
- •2.4 Знаходження початкового опорного плану
- •2.5 Знаходження оптимального плану
- •2.6 Застосування симплекс-таблиць
- •2.7 Метод штучної бази
- •2.8 Двоїсті (спряжені) задачі лінійного програмування
- •З другої групи умов доповняльної нежорсткості маємо
- •Розділ 3. Транспортні задачі (т-задачі)
- •3.1 Математична структура т-задач
- •3.2. Визначення початкового опорного плану т-задачі
- •3.3 Властивості опорних планів т-задач
- •3.4 Розв’язання т-задач методом потенціалів
- •3.6 Задача про оптимальні призначення
- •3.7 Задача про максимальний потік. Метод Форда-Фалкерсона
- •3.8 Задача про найкоротший шлях на мережi. Метод Мiнтi
- •Розділ 4. Дискретне програмування
- •4.1 Задача дискретного лп. Метод Гоморi-1)
- •4.2 Задача частково дискретного лп. Метод Гоморi-2
- •4.3 Задача дискретного лп. Метод Гоморi-3
- •4.4 Задача частково дискретного лп. Метод Дальтона-Ллевелiна
- •4.5 Задача дискретного лп. Метод гілок I границь
- •Розділ 5. Нелінійне програмування. Безумовна однопараметрична оптимізація
- •5.1 Загальні відомості
- •5.2 Методи виключення інтервалів
- •Зауваження
- •5.3 Поліноміальна апроксимація
- •5.4 Методи оптимізації з використанням похідних
- •Розділ 6. Нелінійне програмування. Методи умовної оптимізації
- •6.1 Класична задача математичного програмування
- •6.2 Задача опуклого квадратичного програмування.
- •6.3. Метод Франка – Вулфа розв’язання задач квадратичного програмування (зкп)
- •Розділ 7. Теорія прийняття рішень
- •7.1. Теорія корисності і прийняття рішень
- •7.1.1. Прийняття рішень в умовах ризику
- •7.1.2. Критерій “очікуване значення – дисперсія”
- •7.1.3. Критерій граничного рівня.
- •7.2. Прийняття рішень в умовах невизначеності
- •7.2.1. Класичні критерії прийняття рішень
- •7.2.2. Похідні критерії
- •Розділ 8. Прийняття рішень в ігрових ситуаціях
- •8.1 Класифікація ігор
- •8.2 Розв’язання матричних ігор у чистих стратегіях
- •8.3 Змішане розширення матричної гри
- •8.4 Властивості розв’язку матричних ігор
- •8.5. Алгебраїчний метод розв’язання матричних ігор
- •8.6 Графічний метод розв’язання ігор 2nіm 2.
- •8.7 Матричний метод розв’язання ігор
- •8.8. Ітеративні методи розв’язання ігор
- •8.9. Метод послідовного наближення до ціни гри
- •Розділ 9. Нескінченні антагоністичні ігри
- •9.1. Визначення нескінченної антагоністичної гри
- •9.2 Ігри з опуклими функціями виграшів
- •Розділ 10. Безкоаліційні ігри
- •Розділ 11. Кооперативні ігри
- •11.1 Характеристика кооперативних ігор
- •11.2. Характеристичні функції ігор з малим числом гравців
- •Розділ 12. Вправи для самостійної роботи та для практичних і лабораторних занять
- •12.1. Побудова математичних моделей задач
- •12.2. Розв’язання задач лінійного програмування
- •12.3 Розв’язання транспортних задач
- •12.4 Розв’язання задач цілочислового програмування
- •12.5 Розв’язання задач нелінійного програмування
- •12.6 Розв’язання матричних ігор
- •12.7 Лабораторний практикум
- •Розділ 13. Контрольна робота для студентів заочної форми навчання
- •13.1 Правила вибору задач контрольної роботи
- •13.2 Варіанти завдань контрольної роботи
- •Література
- •1.1 Етапи дослідження операцій 5
Розділ 9. Нескінченні антагоністичні ігри
9.1. Визначення нескінченної антагоністичної гри
Природним узагальненням матричних ігор є нескінченні антагоністичні ігри (НАІ), у яких хоча б один із гравців має нескінченну кількість можливих стратегій. Ми будемо розглядати ігри двох гравців, що роблять по одному ходу, і після цього відбувається розподіл виграшів. При формалізації реальної ситуації з нескінченним числом виборів можна кожну стратегію співставити визначеному числу з одиничного інтервалу, оскільки завжди можна простим перетворенням будь-який інтервал перевести в одиничний і навпаки.
Нагадування. Нехай Е – деяка множина дійсних чисел. Якщо існує число y, таке, що x £ y для всіх хÎЕ (при цьому y не обов'язково належить Е), то множина Е називається обмеженою зверху, а число y називається верхньою границею множини Е. Аналогічно визначається обмеженість знизу і нижня границя множини Е. Позначаються верхня і нижня границі відповідно через sup Е и inf Е відповідно.
Приклад 9.1. Нехай множина Е складається з усіх чисел вигляду 1/n, n= 1,2, ... . Тоді множина Е обмежена і її верхня грань дорівнює 1, а нижня 0, причому 0ÏЕ , а 1ÎЕ.
Для подальшого викладення теорії ігор цього класу введемо визначення і позначення: [0; 1] – одиничний проміжок, з якого гравець може зробити вибір; х – число (стратегія), що обирається гравцем 1; y – число (стратегія), що обирається гравцем 2; Мi(x, y) – виграш i-го гравця; G (X,Y,M1,M2) – гра двох гравців, з ненульовою сумою, у якій гравець 1 вибирає число х з множини Х, гравець 2 вибирає число y з множинаі Y, і після цього гравці 1 і 2 одержують відповідно виграші M1(x, y) і M2(x, y).
Нехай, далі, G (X,Y,M) – гра двох гравців з нульовою сумою, у якій гравець 1 вибирає число х, гравець 2 – число y, після чого гравець 1 одержує виграш М(x, y) за рахунок другого гравця.
Велике значення в теорії НАІ має вигляд функції виграшів M(x, y). Так, на відміну від матричних ігор, не для будь-якої функції M(x, y) існує розв’язок. Будемо вважати, що вибір визначеного числа гравцем означає застосування його чистої стратегії, що відповідає цьому числу. За аналогією з матричними іграми назвемо чистою нижньою ціною гри величину
V1 = M(x, y) або V1 = M(x, y) ,
а чистою верхньою ціною гри величину
V2 = M(x, y) або V2 = M(x, y).
Для матричних ігор величини V1 і V2 завжди існують, а в нескінченних іграх вони можуть не існувати.
Природно вважати, що, якщо для будь-якої нескінченної гри величини V1 і V2 існують і рівні між собою (V1 = V2 = V), то така гра має розв’язок в чистих стратегіях, тобто оптимальною стратегією гравця 1 є вибір числа xoÎX і гравця 2 – числа yoÎY, для яких M(xo, yo) = V. У цьому випадку V називається ціною гри, а (xo, yo) – сідловою точкою в чистих стратегіях.
Приклад 9.2. Гравець 1 вибирає число х з множини Х = [0; 1], гравець 2 вибирає число y з множина Y = [0; 1]. Після цього гравець 2 платить гравцеві 1 суму
M(x, y) = 2х2 - y9.
Оскільки гравець 2 хоче мінімізувати виграш гравця 1, то він визначає
(2x2 - y2) = 2х2 - 1,
тобто при цьому y = 1. Гравець 1 бажає максимізувати свій виграш, і тому визначає
(M(x, y)) = (2х2 - 1) = 2-1 = 1,
що досягається при х = 1.
Отже, нижня ціна гри дорівнює V1 = 1. Верхня ціна гри
V2 = ((2х2 - y2)) = (2 - y2) = 2-1 = 1,
тобто в цій грі V1 = V2 = 1. Тому ціна гри V = 1, а сідлова точка (1;1).
Приклад 9.3. Гравець 1 вибирає хÎX = (0; 1), гравець 2 вибирає yÎY = (0; 1). Після цього гравець 1 отримує суму
M(x, y) = x + y
за рахунок гравця 9. Оскільки Х и Y - відкриті інтервали, то на них V1 і V2 не існують. Якби Х та Y були замкненими інтервалами, то, мабуть, було б таке:
V1 = V2 = 1 при xo = 1, yo = 0.
З іншого боку, ясно, що, вибираючи х досить близьке до 1, гравець 1 буде упевнений, що він отримає виграш не менше, ніж число, близьке до ціни гри V = 1; вибираючи y близьке до нуля, гравець 2 не допустить, щоб виграш гравця 1 значно відрізнявся від ціни гри V = 1.
Степінь близькості до ціни гри може характеризуватися числом e > 0. Тому в описуваній грі можна говорити про оптимальність чистих стратегій хo = 1, yo = 0 відповідно гравців 1 і 2 з точністю до довільного числа e > 0. У зв'язку з цим введемо такі визначення.
Точка (,), деÎX, ÎY, в антагоністичній нескінченній грі G називається точкою e - рівноваги, якщо для будь-яких стратегій xÎX гравця 1, yÎY гравця 2 має місце нерівність
М(х,) - e £ M(,)£ М(, y) + e.
Точка e-рівноваги (,) називається такожe - сідловою точкою функції М(x, y), а стратегії іназиваютьсяe-оптимальними стратегіями. Ці стратегії є оптимальними з точністю до e у тому сенсі, що, якщо відхилення від оптимальної стратегії ніякої користі гравцеві принести не може, то його відхилення від e-оптимальної стратегії може збільшити його виграш не більш, ніж на e.
Можна довести, що для того, щоб функція М мала e-сідлову точку для кожного e > 0 необхідно і досить щоб
M(x, y) = M(x, y).
Якщо гра G не має сідлової точки (e-сідлової точки) у чистих стратегіях, то оптимальні стратегії можна шукати серед змішаних стратегій. Однак, у якості ймовірносної міри тут уводяться функції розподілу ймовірностей застосування гравцями чистих стратегій.
Нехай F(х) – функція розподілу імовірностей застосування чистих стратегій гравцем 1. Якщо число x - чиста стратегія гравця 1, то
F(х) = P(x £ х),
де P(x £ х) означає ймовірність того, що випадково обрана чиста стратегія x не буде перевершувати числа х. Аналогічно розглядається функція розподілу ймовірностей застосування чистих стратегій h гравцем 2
Q(y) = P(h £ y).
Функції F(х) і Q(y) називаються змішаними стратегіями відповідно гравців 1 і 9. Якщо F(х) і Q(y) дифференцюємі, то існують їх похідні, що позначаються відповідно через f(x) і q(y) (функції щільності розподілу).
У загальному випадку диференціал функції розподілу d(х) описує ймовірність того, що стратегія x знаходиться в проміжку
х £ x £ х + dх.
Аналогічно для гравця 2: d(y) означає імовірність того, що його стратегія h знаходиться в інтервалі
y £ h £ y + dy.
Тоді виграш гравця 1 складе
М(х, y) d(х),
а виграш гравця 2 дорівнює
М(х, y) d(y).
Середній виграш гравця 1 за умови, що гравець 2 застосовує свою чисту стратегію y, отримаємо, якщо проінтегруємо виграш по всіх можливих значеннях х, тобто
E(F, y) =
Нагадаємо, що множина Y для y є замкненим інтервалом [0; 1].
Якщо гравець 1 застосовує свою чисту стратегію х, а гравець 2 - y, то виграш гравця 1 складе
М(х, y) d(Х) d(y).
Середній виграш гравця 1 за умови, що обидва гравця застосовують свої змішані стратегії F(х) і Q(y), буде дорівнює
E(F, Q) = .
За аналогією з матричними іграми визначаються оптимальні змішані стратегії гравців і ціна ігри: в антагоністичній нескінченній грі G(Х,Y,М) пари змішаних стратегій F*(х) і Q*(y) відповідно для гравців 1 і 2 утворить сідлову точку в змішаних стратегіях, якщо для будь-яких змішаних стратегій F(х) і Q(y) справедливі співвідношення
Е(F,Q*) £ Е(F*,Q*) £ Е (F*,Q).
З лівої частини останньої нерівності випливає, що якщо гравець 1 відступає від своєї стратегії F*(х), то його середній виграш не може збільшитися, але може зменшитися за рахунок кращих дій гравця 2, тому F*(х) називається оптимальною змішаною стратегією гравця 1.
З правої частини останньої нерівності випливає, що якщо гравець 2 відступить від своєї змішаної стратегії Q*(y), то середній виграш гравця 1 може збільшитися, а не зменшитися, за рахунок розумніших дій гравця 1, тому Q*(y) називається оптимальною змішаною стратегією гравця 9. Середній виграш Е(F*,Q*), отримуваний гравцем 1 при застосуванні гравцями оптимальних змішаних стратегій, називається ціною гри.
За аналогією з матричними іграми розглядається нижня ціна нескінченної гри в змішаних стратегіях
V1 = E(F,Q)
і верхня ціна гри
V2 = E(F,Q).
Якщо існують такі змішані стратегії F*(х) і Q*(y) відповідно для гравців 1 і 2, при яких нижня і верхня ціни нескінченної гри збігаються, то F*(х) і Q*(y) природно назвати оптимальними змішаними стратегіями відповідних гравців, а V1 = V2 = V – ціною гри.
Можна довести, що існування сідлової точки в змішаних стратегіях гри G(Х,Y,М) рівносильно існуванню верхньої V2 і нижньої V1 цін гри в змішаних стратегіях і їх рівності V1 = V2 = V.
Таким чином, розв’язати гру G(Х,Y,М) – означає знайти сідлову точку або такі змішані стратегії, при яких нижня і верхня ціни гри збігаються.
Теорема 9.1. (Існування). Всяка антагоністична нескінченна гра двох гравців G з нескінченною функцією виграшів М(х,y) на одиничному квадраті має рішення (гравці мають оптимальні змішані стратегії).
Теорема 9.2. Нехай – нескінченна антагоністична гра з нескінченною функцією виграшів М(х, y) на одиничному квадраті і ціною гри V. Тоді, якщо Q(y) – оптимальна стратегія гравця 2 і для деякого xo
,
то xo не може входити в точки спектра оптимальної стратегії гравця 1; якщо F(х) – оптимальна стратегія гравця 1 і для деякого yo
,
то yo не може бути точкою спектра оптимальної стратегії гравця 9.
З теореми 2 випливає, що якщо один із гравців застосовує оптимальну стратегію, а інший – чисту, притому, що середній виграш гравця 1 відрізняється від ціни гри, то ця чиста стратегія не може ввійти в його оптимальну стратегію (або вона входить у неї з нульовою ймовірністю).
Теорема 9.3. Нехай у нескінченній антагоністичній грі функція виграшів М(х,y) безперервна для хÎ[0; 1], yÎ[0; 1] і
М(х, y) = -М(y, х),
тоді ціна гри дорівнює нулю і будь-яка оптимальна стратегія одного гравця буде також оптимальною стратегією іншого.
Сформульовані властивості оптимальних змішаних стратегій і ціни гри допомагають знаходити або перевіряти рішення, але вони ще не дають у загальному виді прийнятних методів рішення гри. Більш того, не існує загальних методів для точного перебування рішення НАІ, і в тому числі безперервних ігор на одиничному квадраті. Тому розглядаються приватні види антагоністичних нескінченних ігор.