- •Розділ 1. Методологічні основи дослідження операцій
- •1.1 Етапи дослідження операцій
- •1.2 Математичне моделювання. Загальна структура
- •1.3 Етапи математичного моделювання. Приклади
- •1.4 Розділи і класи задач дослідження операцій
- •1.5 Основні вимоги до математичних моделей і їх властивості
- •1.6 Формалізація принципів оптимального поводження в моделях прийняття рішення.
- •Розділ 2. Задачі лінійного програмування
- •2.1 Попередні відомості теорії лінійного програмування.
- •2.2 Графічна інтерпретація розв’язання задач лп
- •2.3 Змістовний опис симплекс-методу розв’язання задач лп
- •2.4 Знаходження початкового опорного плану
- •2.5 Знаходження оптимального плану
- •2.6 Застосування симплекс-таблиць
- •2.7 Метод штучної бази
- •2.8 Двоїсті (спряжені) задачі лінійного програмування
- •З другої групи умов доповняльної нежорсткості маємо
- •Розділ 3. Транспортні задачі (т-задачі)
- •3.1 Математична структура т-задач
- •3.2. Визначення початкового опорного плану т-задачі
- •3.3 Властивості опорних планів т-задач
- •3.4 Розв’язання т-задач методом потенціалів
- •3.6 Задача про оптимальні призначення
- •3.7 Задача про максимальний потік. Метод Форда-Фалкерсона
- •3.8 Задача про найкоротший шлях на мережi. Метод Мiнтi
- •Розділ 4. Дискретне програмування
- •4.1 Задача дискретного лп. Метод Гоморi-1)
- •4.2 Задача частково дискретного лп. Метод Гоморi-2
- •4.3 Задача дискретного лп. Метод Гоморi-3
- •4.4 Задача частково дискретного лп. Метод Дальтона-Ллевелiна
- •4.5 Задача дискретного лп. Метод гілок I границь
- •Розділ 5. Нелінійне програмування. Безумовна однопараметрична оптимізація
- •5.1 Загальні відомості
- •5.2 Методи виключення інтервалів
- •Зауваження
- •5.3 Поліноміальна апроксимація
- •5.4 Методи оптимізації з використанням похідних
- •Розділ 6. Нелінійне програмування. Методи умовної оптимізації
- •6.1 Класична задача математичного програмування
- •6.2 Задача опуклого квадратичного програмування.
- •6.3. Метод Франка – Вулфа розв’язання задач квадратичного програмування (зкп)
- •Розділ 7. Теорія прийняття рішень
- •7.1. Теорія корисності і прийняття рішень
- •7.1.1. Прийняття рішень в умовах ризику
- •7.1.2. Критерій “очікуване значення – дисперсія”
- •7.1.3. Критерій граничного рівня.
- •7.2. Прийняття рішень в умовах невизначеності
- •7.2.1. Класичні критерії прийняття рішень
- •7.2.2. Похідні критерії
- •Розділ 8. Прийняття рішень в ігрових ситуаціях
- •8.1 Класифікація ігор
- •8.2 Розв’язання матричних ігор у чистих стратегіях
- •8.3 Змішане розширення матричної гри
- •8.4 Властивості розв’язку матричних ігор
- •8.5. Алгебраїчний метод розв’язання матричних ігор
- •8.6 Графічний метод розв’язання ігор 2nіm 2.
- •8.7 Матричний метод розв’язання ігор
- •8.8. Ітеративні методи розв’язання ігор
- •8.9. Метод послідовного наближення до ціни гри
- •Розділ 9. Нескінченні антагоністичні ігри
- •9.1. Визначення нескінченної антагоністичної гри
- •9.2 Ігри з опуклими функціями виграшів
- •Розділ 10. Безкоаліційні ігри
- •Розділ 11. Кооперативні ігри
- •11.1 Характеристика кооперативних ігор
- •11.2. Характеристичні функції ігор з малим числом гравців
- •Розділ 12. Вправи для самостійної роботи та для практичних і лабораторних занять
- •12.1. Побудова математичних моделей задач
- •12.2. Розв’язання задач лінійного програмування
- •12.3 Розв’язання транспортних задач
- •12.4 Розв’язання задач цілочислового програмування
- •12.5 Розв’язання задач нелінійного програмування
- •12.6 Розв’язання матричних ігор
- •12.7 Лабораторний практикум
- •Розділ 13. Контрольна робота для студентів заочної форми навчання
- •13.1 Правила вибору задач контрольної роботи
- •13.2 Варіанти завдань контрольної роботи
- •Література
- •1.1 Етапи дослідження операцій 5
9.2 Ігри з опуклими функціями виграшів
Ігри з опуклими безперервними функціями виграшів, що називають часто ядром, називаються опуклими.
Нагадаємо, що опуклою функцією f дійсної змінної х на інтервалі (а,b) називається така функція, для якої виконується нерівність
f(a1 х1 + a2 х2) £ a1 f(х1) + a2 f(х2),
де х1 і х2 – будь-які дві точки з інтервалу (а,b); a1, a2 ³ 0, причому
a1+a2 = 1.
Якщо для a1 ¹ 0, a2 ¹ 0 завжди має місце строга нерівність
f(a1 х1 + a2 х2) < a1 f(х1) + a2 f(х2),
то функція f називається строго опуклої на (а;b).
Геометрично опукла функція зображує дугу, графік якої наведено нижче стягуючої її хорди (див. на рисунку нижче).
Нагадаємо, також, що безперервна і строго опукла функція f на замкненому інтервалі приймає мінімальне значення тільки в одній точці інтервалу.
Для пошуку розв’язку опуклої гри можна скористатися наступною теоремою.
Теорема 9.4. Нехай М(х, y) – безперервна функція виграшів гравця 1, на одиничному квадраті і строго опукла по y для будь-якого х. Тоді є єдина оптимальна чиста стратегія y = yo Î[0;1] для гравця 2, ціна гри, при цьому, визначається по формулі
V = M(x, y), (9.1)
значення yo визначається як рішення наступного рівняння
M(x, yo) = V. (9.2)
Зауваження. Якщо в теоремі 4 не припускати строгу опуклість функції М(х, y) по y, а просто опуклість, то теорема залишається в силі з тією відмінністю, що в гравця 2 оптимальна чиста стратегія не буде єдиною.
Зауваження. Опуклі ігри називають часто опукло-вгнутими, оскількии в них має сідлообразне ядро, а оскільки ядро сідлообразне, то гра має сідлову точку в чистих стратегіях.
Таким чином, якщо М(х, y) безперервна й опукла по y, то ціна гри визначається за формулою (9.1), і гравець 2 має оптимальну чисту стратегію, обумовлену рівнянням (9.2).
Аналогічно і для гравця 1: якщо функція виграшів М(х, y) безперервна по обох аргументах і строго увігнута по х для будь-якого y, то в цьому випадку гравець 1 має єдину оптимальну стратегію.
Ціна гри визначається за виразом
V = M(x,y), (9.3)
а чиста оптимальна стратегія хo гравця 1 визначається з рівняння
M(xo, y) = V. (9.4)
Приклад 9.4. Нехай на квадраті [0;1] задана функція
М(х, y) = . (9.5)
Оскільки дляx Î[0; 1], y Î(0;1), то М(х, y) строго увігнута по х для будь-якого y Î(0;1). Отже, ціна гри знаходиться за виразом (9.3)
V = .
Відзначимо, що при 0 £ х £справедлива рівність
= ,
а при 0,5 < х £ 1
= .
Оскільки
V = max [;] =
= max [;] =max [;] =.
При цьому значення х виходить рівним хo = . Це ж значення виходить з розв’язку рівняння
= ,
оскільки мінімум досягається при y = 0, і це рівняння перетворюється як
= ,
звідки випливає, що х = .
Помітимо, що якщо у функції виграшів (5) поміняти місцями х и y, те вона не зміниться, а отже, ця функція опукла і по y при всіх х Î[0;1]. Тому до неї застосовна та ж теорія, тобто в гравця 2 існує оптимальна чиста стратегія yo, обумовлена з рівняння (4)
=
Очевидно, максимум по х досягається при х = 1/2, і останнє рівняння прийме вид
= .
Рішенням останнього рівняння буде yo = 0. Отже, гравець 2 має оптимальну чисту стратегію yo = 0.
Зауваження. У наведеному вище прикладі ми могли визначити оптимальну стратегію гравця 1, а гравця 2 - тільки випадково, у силу “удалого” виду М(х, y).
Розглянемо тепер метод визначення оптимальних стратегій того гравця, для якого функція виграшів не обов'язково опукла. Нехай безперервна функція М(х, y), задана на одиничному квадраті, опукла по y. Ми буде цікавити питання перебування оптимальних стратегій 1 гравця. Припустимо також, що для х Î[0; 1], y Î[0; 1] існує частинна похідна функції М(х, y) по y, причому в точках y = 0 і y = 1 (х, y) = розглядається як права і ліва похідна відповідно. Позначимо черезyo одну з оптимальних чистих стратегій гравця 2 (ця стратегія існує відповідно до теореми 9. 4).
Відповідно до теореми 9.2 чисті стратегії х гравця 1 можуть входити в його оптимальну стратегію з позитивною імовірністю, якщо для них виконується рівність М(х, yo) = V. Такі чисті стратегії х називаються істотними.
Теорема 9.5. Нехай дана нескінченна антагоністична гра з нескінченною і дифференціюємою по y на одиничному квадраті при будь-якому х функцією виграшів М(х, y), з оптимальною чистою стратегією yo гравця 2 і ціною гри V, тоді :
1) якщо yo = 1, то серед оптимальних стратегій гравця 1 мається істотна чиста стратегія х1, для якої
(х1, 1) £ 1;
2) якщо yo = 0, то серед оптимальних стратегій гравця 1 є істотна чиста стратегія х2, для якої
(х2, 0) ³ 0;
3) якщо 0 £ yo £ 1, то серед оптимальних стратегій гравця 1 знайдеться така, що є сумішшю двох істотних стратегій х1 і х9. Для цих стратегій
(х1, yo) £ 0, (х2, yo) ³ 0,
стратегія х1 сумісна з ймовірністю a, стратегія х2 – з ймовірністю (1 - a), де a знаходиться з рівняння
a(х1, yo) + (1 - a)(х2, yo) = 0. (9.6)
Приклад 9.5. Нехай функція виграшів у нескінченній антагоністичній грі задана на одиничному квадраті і дорівнює
М(х, y) = (х - y)2 = х2 - 2хy + y9.
Ця функція безперервна по х и y, і тому ця гра має рішення. Крім того
= 2 > 0.
Отже, М(х, y) опукла по y, і тому відповідно теореми 9.4 ціна гри визначається за формулою (9.1), гравець 2 має чисту оптимальну стратегію yo, обумовлену виразом (9.2). Таким чином, маємо
V = (x - y)2;
Для визначення (x2 - 2xy + y2) послідовно знайдемо
= 2x - 2y := 0 Þ x = y,
= 2 > 0 Þ при x = y функція M має мінімум для будь-якого y, максимум досягається в одній із крайніх точок x = 0 і (або) x = 1.
M(0; y) = y2, M(1; y) = 1 - 2y + y2 = (y - 1)2 , V=max {y2; (1 - y)2}.
Даний max {...} досягається в тому випадку, якщо y2 = (1 - y)2, тобто y = 1/9. Отже V = 1/4 при yo = 1/9.
Визначимо тепер оптимальні стратегії для гравця 1. Оскільки yo = 1/2, то 0 < yo < 1. Відповідно до теореми 9.5 розглянемо третій випадок.
Визначимо х з рівняння М(х, yo) = V, тобто (х -1/2 )2 = 1/4.
Розв’язуючи останнє рівняння, отримаємо х1 = 0, х2 = 1.
Тепер необхідно визначити величину a – ймовірність застосування чистої стратегії х1 = 0. Для цього використовуємо рівняння (9.6)
a(0,) + (1- a)(1,) = 0.
Неважко знайти
Тоді рівняння для a прийме вигляд: a - (1 - a) = 0, звідки a = 1/2 . Отже, стратегія гравця 1: F(х) = 1/2Jo(х) + 1/2J1(х), а гравця 2: Q(y) = (y).
Тут через (x) позначена східчаста функція (x) = .