Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ММДО.DO_ukr_new.doc
Скачиваний:
164
Добавлен:
16.05.2015
Размер:
5.09 Mб
Скачать

Розділ 9. Нескінченні антагоністичні ігри

9.1. Визначення нескінченної антагоністичної гри

Природним узагальненням матричних ігор є нескінченні антагоністичні ігри (НАІ), у яких хоча б один із гравців має нескінченну кількість мож­ливих стратегій. Ми будемо розглядати ігри двох гравців, що роблять по одному ходу, і після цього відбувається розподіл виграшів. При формалізації реальної ситуації з нескінченним числом виборів можна кожну стратегію співставити визначеному числу з одиничного інтервалу, оскільки завжди можна простим перетворенням будь-який інтервал перевести в одиничний і навпаки.

Нагадування. Нехай Е – деяка множина дійсних чисел. Якщо існує число y, таке, що x £ y для всіх хÎЕ (при цьому y не обов'язково належить Е), то множина Е називається обмеженою зверху, а число y називається верхньою границею множини Е. Аналогічно визначається обмеженість знизу і нижня границя множини Е. Позначаються верхня і нижня границі відповідно через sup Е и inf Е відповідно.

Приклад 9.1. Нехай множина Е складається з усіх чисел вигляду 1/n, n= 1,2, ... . Тоді множина Е обмежена і її верхня грань дорівнює 1, а нижня 0, причому 0ÏЕ , а 1ÎЕ.

Для подальшого викладення теорії ігор цього класу введемо визначення і позначення: [0; 1] – одиничний проміжок, з якого гравець може зробити вибір; х – число (стратегія), що обирається гравцем 1; y – число (стратегія), що обирається гравцем 2; Мi(x, y) – виграш i-го гравця; G (X,Y,M1,M2) – гра двох гравців, з ненульовою сумою, у якій гравець 1 вибирає число х з множини Х, гравець 2 вибирає число y з множинаі Y, і після цього гравці 1 і 2 одержують відповідно виграші M1(x, y) і M2(x, y).

Нехай, далі, G (X,Y,M) – гра двох гравців з нульовою сумою, у якій гравець 1 вибирає число х, гравець 2 – число y, після чого гравець 1 одержує виграш М(x, y) за рахунок другого гравця.

Велике значення в теорії НАІ має вигляд функції виграшів M(x, y). Так, на відміну від матричних ігор, не для будь-якої функції M(x, y) існує розв’язок. Будемо вважати, що вибір визначеного числа гравцем означає застосування його чистої стратегії, що відповідає цьому числу. За аналогією з матричними іграми назвемо чистою нижньою ціною гри величину

V1 = M(x, y) або V1 = M(x, y) ,

а чистою верхньою ціною гри величину

V2 = M(x, y) або V2 = M(x, y).

Для матричних ігор величини V1 і V2 завжди існують, а в нескінченних іграх вони можуть не існувати.

Природно вважати, що, якщо для будь-якої нескінченної гри величини V1 і V2 існують і рівні між собою (V1 = V2 = V), то така гра має розв’язок в чистих стратегіях, тобто оптимальною стратегією гравця 1 є вибір числа xoÎX і гравця 2 – числа yoÎY, для яких M(xo, yo) = V. У цьому випадку V називається ціною гри, а (xo, yo) – сідловою точкою в чистих стратегіях.

Приклад 9.2. Гравець 1 вибирає число х з множини Х = [0; 1], гравець 2 вибирає число y з множина Y = [0; 1]. Після цього гравець 2 платить гравцеві 1 суму

M(x, y) = 2х2 - y9.

Оскільки гравець 2 хоче мінімізувати виграш гравця 1, то він визначає

(2x2 - y2) = 2 - 1,

тобто при цьому y = 1. Гравець 1 бажає максимізувати свій виграш, і тому визначає

(M(x, y)) = (2 - 1) = 2-1 = 1,

що досягається при х = 1.

Отже, нижня ціна гри дорівнює V1 = 1. Верхня ціна гри

V2 = ((2 - y2)) = (2 - y2) = 2-1 = 1,

тобто в цій грі V1 = V2 = 1. Тому ціна гри V = 1, а сідлова точка (1;1).

Приклад 9.3. Гравець 1 вибирає хÎX = (0; 1), гравець 2 вибирає yÎY = (0; 1). Після цього гравець 1 отримує суму

M(x, y) = x + y

за рахунок гравця 9. Оскільки Х и Y - відкриті інтервали, то на них V1 і V2 не існують. Якби Х та Y були замкненими інтервалами, то, мабуть, було б таке:

V1 = V2 = 1 при xo = 1, yo = 0.

З іншого боку, ясно, що, вибираючи х досить близьке до 1, гравець 1 буде упевнений, що він отримає виграш не менше, ніж число, близьке до ціни гри V = 1; вибираючи y близьке до нуля, гравець 2 не допустить, щоб виграш гравця 1 значно відрізнявся від ціни гри V = 1.

Степінь близькості до ціни гри може характеризуватися числом e > 0. Тому в описуваній грі можна говорити про оптимальність чистих стратегій хo = 1, yo = 0 відповідно гравців 1 і 2 з точністю до довільного числа e > 0. У зв'язку з цим введемо такі визначення.

Точка (,), деÎX, ÎY, в антагоністичній нескінченній грі G називається точкою e - рівноваги, якщо для будь-яких стратегій xÎX гравця 1, yÎY гравця 2 має місце нерівність

М(х,) - e £ M(,)£ М(, y) + e.

Точка e-рівноваги (,) називається такожe - сідловою точкою функції М(x, y), а стратегії іназиваютьсяe-оптимальними стратегіями. Ці стратегії є оптимальними з точністю до e у тому сенсі, що, якщо відхилення від оптимальної стратегії ніякої користі гравцеві принести не може, то його відхилення від e-оптимальної стратегії може збільшити його виграш не більш, ніж на e.

Можна довести, що для того, щоб функція М мала e-сідлову точку для кожного e > 0 необхідно і досить щоб

M(x, y) = M(x, y).

Якщо гра G не має сідлової точки (e-сідлової точки) у чистих стратегіях, то оптимальні стратегії можна шукати серед змішаних стратегій. Однак, у якості ймовірносної міри тут уводяться функції розподілу ймовірностей застосування гравцями чистих стратегій.

Нехай F(х) – функція розподілу імовірностей застосування чистих стратегій гравцем 1. Якщо число x - чиста стратегія гравця 1, то

F(х) = P(x £ х),

де P(x £ х) означає ймовірність того, що випадково обрана чиста стратегія x не буде перевершувати числа х. Аналогічно розглядається функція розподілу ймовірностей застосування чистих стратегій h гравцем 2

Q(y) = P(h £ y).

Функції F(х) і Q(y) називаються змішаними стратегіями відповідно гравців 1 і 9. Якщо F(х) і Q(y) дифференцюємі, то існують їх похідні, що позначаються відповідно через f(x) і q(y) (функції щільності розподілу).

У загальному випадку диференціал функції розподілу d(х) описує ймовірність того, що стратегія x знаходиться в проміжку

х £ x £ х + dх.

Аналогічно для гравця 2: d(y) означає імовірність того, що його стратегія h знаходиться в інтервалі

y £ h £ y + dy.

Тоді виграш гравця 1 складе

М(х, y) d(х),

а виграш гравця 2 дорівнює

М(х, y) d(y).

Середній виграш гравця 1 за умови, що гравець 2 застосовує свою чисту стратегію y, отримаємо, якщо проінтегруємо виграш по всіх можливих значеннях х, тобто

E(F, y) =

Нагадаємо, що множина Y для y є замкненим інтервалом [0; 1].

Якщо гравець 1 застосовує свою чисту стратегію х, а гравець 2 - y, то виграш гравця 1 складе

М(х, y) d(Х) d(y).

Середній виграш гравця 1 за умови, що обидва гравця застосовують свої змішані стратегії F(х) і Q(y), буде дорівнює

E(F, Q) = .

За аналогією з матричними іграми визначаються оптимальні змішані стратегії гравців і ціна ігри: в антагоністичній нескінченній грі G(Х,Y,М) пари змішаних стратегій F*(х) і Q*(y) відповідно для гравців 1 і 2 утворить сідлову точку в змішаних стратегіях, якщо для будь-яких змішаних стратегій F(х) і Q(y) справедливі співвідношення

Е(F,Q*) £ Е(F*,Q*) £ Е (F*,Q).

З лівої частини останньої нерівності випливає, що якщо гравець 1 відступає від своєї стратегії F*(х), то його середній виграш не може збільшитися, але може зменшитися за рахунок кращих дій гравця 2, тому F*(х) називається оптимальною змішаною стратегією гравця 1.

З правої частини останньої нерівності випливає, що якщо гравець 2 відступить від своєї змішаної стратегії Q*(y), то середній виграш гравця 1 може збільшитися, а не зменшитися, за рахунок розумніших дій гравця 1, тому Q*(y) називається оптимальною змішаною стратегією гравця 9. Середній виграш Е(F*,Q*), отримуваний гравцем 1 при застосуванні гравцями оптимальних змішаних стратегій, називається ціною гри.

За аналогією з матричними іграми розглядається нижня ціна нескінченної гри в змішаних стратегіях

V1 = E(F,Q)

і верхня ціна гри

V2 = E(F,Q).

Якщо існують такі змішані стратегії F*(х) і Q*(y) відповідно для гравців 1 і 2, при яких нижня і верхня ціни нескінченної гри збігаються, то F*(х) і Q*(y) природно назвати оптимальними змішаними стратегіями відповідних гравців, а V1 = V2 = V – ціною гри.

Можна довести, що існування сідлової точки в змішаних стратегіях гри G(Х,Y,М) рівносильно існуванню верхньої V2 і нижньої V1 цін гри в змішаних стратегіях і їх рівності V1 = V2 = V.

Таким чином, розв’язати гру G(Х,Y,М) – означає знайти сідлову точку або такі змішані стратегії, при яких нижня і верхня ціни гри збігаються.

Теорема 9.1. (Існування). Всяка антагоністична нескінченна гра двох гравців G з нескінченною функцією виграшів М(х,y) на одиничному квадраті має рішення (гравці мають оптимальні змішані стратегії).

Теорема 9.2. Нехай – нескінченна антагоністична гра з нескінченною функцією виграшів М(х, y) на одиничному квадраті і ціною гри V. Тоді, якщо Q(y) – оптимальна стратегія гравця 2 і для деякого xo

,

то xo не може входити в точки спектра оптимальної стратегії гравця 1; якщо F(х) – оптимальна стратегія гравця 1 і для деякого yo

,

то yo не може бути точкою спектра оптимальної стратегії гравця 9.

З теореми 2 випливає, що якщо один із гравців застосовує оптимальну стратегію, а інший – чисту, притому, що середній виграш гравця 1 відрізняється від ціни гри, то ця чиста стратегія не може ввійти в його оптимальну стратегію (або вона входить у неї з нульовою ймовірністю).

Теорема 9.3. Нехай у нескінченній антагоністичній грі функція виграшів М(х,y) безперервна для хÎ[0; 1], yÎ[0; 1] і

М(х, y) = -М(y, х),

тоді ціна гри дорівнює нулю і будь-яка оптимальна стратегія одного гравця буде також оптимальною стратегією іншого.

Сформульовані властивості оптимальних змішаних стратегій і ціни гри допомагають знаходити або перевіряти рішення, але вони ще не дають у загальному виді прийнятних методів рішення гри. Більш того, не існує загальних методів для точного перебування рішення НАІ, і в тому числі безперервних ігор на одиничному квадраті. Тому розглядаються приватні види антагоністичних нескінченних ігор.