Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ММДО.DO_ukr_new.doc
Скачиваний:
164
Добавлен:
16.05.2015
Размер:
5.09 Mб
Скачать

9.2 Ігри з опуклими функціями виграшів

Ігри з опуклими безперервними функціями виграшів, що називають часто ядром, називаються опуклими.

Нагадаємо, що опуклою функцією f дійсної змінної х на інтервалі (а,b) називається така функція, для якої виконується нерівність

f(a1 х1 + a2 х2) £ a1 f(х1) + a2 f(х2),

де х1 і х2 – будь-які дві точки з інтервалу (а,b); a1, a2 ³ 0, причому

a1+a2 = 1.

Якщо для a1 ¹ 0, a2 ¹ 0 завжди має місце строга нерівність

f(a1 х1 + a2 х2) < a1 f(х1) + a2 f(х2),

то функція f називається строго опуклої на (а;b).

Геометрично опукла функція зображує дугу, графік якої наведено нижче стягуючої її хорди (див. на рисунку нижче).

Нагадаємо, також, що безперервна і строго опукла функція f на замкненому інтервалі приймає мінімальне значення тільки в одній точці інтервалу.

Для пошуку розв’язку опуклої гри можна скористатися наступною теоремою.

Теорема 9.4. Нехай М(х, y) – безперервна функція виграшів гравця 1, на одиничному квадраті і строго опукла по y для будь-якого х. Тоді є єдина оптимальна чиста стратегія y = yo Î[0;1] для гравця 2, ціна гри, при цьому, визначається по формулі

V = M(x, y), (9.1)

значення yo визначається як рішення наступного рівняння

M(x, yo) = V. (9.2)

Зауваження. Якщо в теоремі 4 не припускати строгу опуклість функції М(х, y) по y, а просто опуклість, то теорема залишається в силі з тією відмінністю, що в гравця 2 оптимальна чиста стратегія не буде єдиною.

Зауваження. Опуклі ігри називають часто опукло-вгнутими, оскількии в них має сідлообразне ядро, а оскільки ядро сідлообразне, то гра має сідлову точку в чистих стратегіях.

Таким чином, якщо М(х, y) безперервна й опукла по y, то ціна гри визначається за формулою (9.1), і гравець 2 має оптимальну чисту стратегію, обумовлену рівнянням (9.2).

Аналогічно і для гравця 1: якщо функція виграшів М(х, y) безперервна по обох аргументах і строго увігнута по х для будь-якого y, то в цьому випадку гравець 1 має єдину оптимальну стратегію.

Ціна гри визначається за виразом

V = M(x,y), (9.3)

а чиста оптимальна стратегія хo гравця 1 визначається з рівняння

M(xo, y) = V. (9.4)

Приклад 9.4. Нехай на квадраті [0;1] задана функція

М(х, y) = . (9.5)

Оскільки дляx Î[0; 1], y Î(0;1), то М(х, y) строго увігнута по х для будь-якого y Î(0;1). Отже, ціна гри знаходиться за виразом (9.3)

V = .

Відзначимо, що при 0 £ х £справедлива рівність

= ,

а при 0,5 < х £ 1

= .

Оскільки

V = max [;] =

= max [;] =max [;] =.

При цьому значення х виходить рівним хo = . Це ж значення виходить з розв’язку рівняння

= ,

оскільки мінімум досягається при y = 0, і це рівняння перетворюється як

= ,

звідки випливає, що х = .

Помітимо, що якщо у функції виграшів (5) поміняти місцями х и y, те вона не зміниться, а отже, ця функція опукла і по y при всіх х Î[0;1]. Тому до неї застосовна та ж теорія, тобто в гравця 2 існує оптимальна чиста стратегія yo, обумовлена з рівняння (4)

=

Очевидно, максимум по х досягається при х = 1/2, і останнє рівняння прийме вид

= .

Рішенням останнього рівняння буде yo = 0. Отже, гравець 2 має оптимальну чисту стратегію yo = 0.

Зауваження. У наведеному вище прикладі ми могли визначити оптимальну стратегію гравця 1, а гравця 2 - тільки випадково, у силу “удалого” виду М(х, y).

Розглянемо тепер метод визначення оптимальних стратегій того гравця, для якого функція виграшів не обов'язково опукла. Нехай безперервна функція М(х, y), задана на одиничному квадраті, опукла по y. Ми буде цікавити питання перебування оптимальних стратегій 1 гравця. Припустимо також, що для х Î[0; 1], y Î[0; 1] існує частинна похідна функції М(х, y) по y, причому в точках y = 0 і y = 1 (х, y) = розглядається як права і ліва похідна відповідно. Позначимо черезyo одну з оптимальних чистих стратегій гравця 2 (ця стратегія існує відповідно до теореми 9. 4).

Відповідно до теореми 9.2 чисті стратегії х гравця 1 можуть входити в його оптимальну стратегію з позитивною імовірністю, якщо для них виконується рівність М(х, yo) = V. Такі чисті стратегії х називаються істотними.

Теорема 9.5. Нехай дана нескінченна антагоністична гра з нескінченною і дифференціюємою по y на одиничному квадраті при будь-якому х функцією виграшів М(х, y), з оптимальною чистою стратегією yo гравця 2 і ціною гри V, тоді :

1) якщо yo = 1, то серед оптимальних стратегій гравця 1 мається істотна чиста стратегія х1, для якої

(х1, 1) £ 1;

2) якщо yo = 0, то серед оптимальних стратегій гравця 1 є істотна чиста стратегія х2, для якої

(х2, 0) ³ 0;

3) якщо 0 £ yo £ 1, то серед оптимальних стратегій гравця 1 знайдеться така, що є сумішшю двох істотних стратегій х1 і х9. Для цих стратегій

(х1, yo) £ 0, (х2, yo) ³ 0,

стратегія х1 сумісна з ймовірністю a, стратегія х2 – з ймовірністю (1 - a), де a знаходиться з рівняння

a1, yo) + (1 - a)2, yo) = 0. (9.6)

Приклад 9.5. Нехай функція виграшів у нескінченній антагоністичній грі задана на одиничному квадраті і дорівнює

М(х, y) = (х - y)2 = х2 - 2хy + y9.

Ця функція безперервна по х и y, і тому ця гра має рішення. Крім того

= 2 > 0.

Отже, М(х, y) опукла по y, і тому відповідно теореми 9.4 ціна гри визначається за формулою (9.1), гравець 2 має чисту оптимальну стратегію yo, обумовлену виразом (9.2). Таким чином, маємо

V = (x - y)2;

Для визначення (x2 - 2xy + y2) послідовно знайдемо

= 2x - 2y := 0 Þ x = y,

= 2 > 0 Þ при x = y функція M має мінімум для будь-якого y, максимум досягається в одній із крайніх точок x = 0 і (або) x = 1.

M(0; y) = y2, M(1; y) = 1 - 2y + y2 = (y - 1)2 , V=max {y2; (1 - y)2}.

Даний max {...} досягається в тому випадку, якщо y2 = (1 - y)2, тобто y = 1/9. Отже V = 1/4 при yo = 1/9.

Визначимо тепер оптимальні стратегії для гравця 1. Оскільки yo = 1/2, то 0 < yo < 1. Відповідно до теореми 9.5 розглянемо третій випадок.

Визначимо х з рівняння М(х, yo) = V, тобто (х -1/2 )2 = 1/4.

Розв’язуючи останнє рівняння, отримаємо х1 = 0, х2 = 1.

Тепер необхідно визначити величину a – ймовірність застосування чистої стратегії х1 = 0. Для цього використовуємо рівняння (9.6)

a(0,) + (1- a)(1,) = 0.

Неважко знайти

Тоді рівняння для a прийме вигляд: a - (1 - a) = 0, звідки a = 1/2 . Отже, стратегія гравця 1: F(х) = 1/2Jo(х) + 1/2J1(х), а гравця 2: Q(y) = (y).

Тут через (x) позначена східчаста функція (x) = .