Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Теория игр / Петросян_Теория_игр

.pdf
Скачиваний:
54
Добавлен:
13.02.2015
Размер:
6.14 Mб
Скачать

игру в случае, когда множество S совпадает с отрезком [—1, 1]. Теорема. Оптимальная смешанная стратегия v* игрока 2 за­

ключается в равновероятном выборе двух наборов из т точек:

1 +

4/

 

4/

 

, 1=0, 1, ..., т-\>,

1_ — 1=о, 1, .., т-\

2/И-1

 

Ъп-\

Оптимальная стратегия ц* игрока 1 состоит в выборе точек

Ъп-\ -, /=0, 1, ...,2т-1

с вероятностями 1/(2/и). Значение игры равно 1/(2/и— 1). Доказательство. Пусть р* и v* — смешанные стратегии иг­

роков 1 и 2 соответственно, оптимальность которых нужно до­ казать. Введем следующие обозначения:

, Г2т-2.-1

2m-2i+l"|

.

,

 

 

 

li=\———,———

,

i=l, 2, ..., 2m-1.

 

Покажем вначале, что К{х, v*)<l/(2m—1) для

всех

хе[— 1, 1].

Действительно, при xel,

 

имеем

 

 

 

 

 

 

 

К(х, v*)=- min

2m—4J—l

 

1

 

- 2m+4i+l

 

 

 

2m-l

 

+-mm

2m - l

 

 

1 /

2m-2j-l\

 

1 / 2 m - 2 / + l

\

1

.

(6.8)

=-[x

 

 

+-

2 w - l

x =

2/w-l

2 \

2m-\

/

2 \

/

 

 

Пусть теперь игрок 1 выбирает смешанную стратегию ц*, а иг­

рок 2 — произвольную чистую стратегию у={у1,

.., ут).

Обозначим

 

 

 

 

 

 

 

 

 

 

 

 

2т—2/—1

У=0, 1,

 

...,Ьп-\.

 

 

 

х,=- 2т-1

 

 

 

 

 

Тогда

 

 

2 т - 1

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

К{ц*, 3>)= Е

min p(x/ ,yj )~ =

 

 

 

= Г" S

т 1 П

Р (*»->' ^ ) + m i Q

P(*V-2. У|) >

 

 

 

 

1

 

2

 

1

 

 

 

(6.9)

 

>— • т

=

 

.

 

 

 

 

 

 

 

 

 

 

 

2 т - 1

2т-1

 

 

 

Из неравенств (6.8), (6.9) вытекает утверждение теоремы.

100

§ 7. ОДИН КЛАСС ИГР С РАЗРЫВНОЙ ФУНКЦИЕЙ ВЫИГРЫША

Для игр, у которых функции выигрыша разрывны, нельзя гаран­ тировать существование значения игры в смешанных стратегиях (см. пример п. 4.12). Однако часто именно разрывность функции выигрыша позволяет найти оптимальные стратегии и значение иг­ ры. Нахождению решения помогают также эмпирические предполо­ жения о виде оптимальных стратегий игроков.

7.1. В данном параграфе будут исследованы игры с выбором момента времени или игры типа дуэли (см. примеры 4.5 п. 1.2). Основной особенностью этого класса игр на квадрате является разрывность функции выигрыша Н(х, у) вдоль диагонали х=у.

Рассмотрим игру на единичном квадрате с функцией выигрыша

{ср(х), если х=у, в(х, у), если х>у,х<у,\1/(х, у), если

где ф(х, у) — определена и непрерывна на множестве 0<х<^<1, функция непрерывна на [0, 1], а в(х, у) определена и непрерывна на множестве 0<j><;c< 1. Предположим, что игра Г=(Х, Y, Н), где Аг=У=[0, 1], Н—задана (7.1), имеет оптимальные смешанные стратегии ц*, v* игроков 1 и 2 соответственно. Более того, пред­ положим, что оптимальные смешанные стратегии /х*, v* являются распределениями вероятностей, которые имеют непрерывные плот­ ности /* (х) и g* (x) соответственно.

Далее в этом параграфе будем обозначать искомую стратегию / (соответственно g), понимая под этим плотность распределения. Выясним свойства оптимальных стратегий.

Пусть/— стратегия игрока 1. Для уе[0, 1] имеем

K(f, у) = ] Ф (х, УУ(х)сЬс+\в(х, yV(x)dx.

(7.2)

О

У

 

Предположим, что /

и g — оптимальные стратегии

игроков

1т 2. Тогда для любой точки у0, в которой

 

 

g(yo)>0

(7.3)

(точки спектра стратегии g), выполняется

 

 

Ktf, y0)=v,

(7.4)

где v — значение игры. Но равенство (7.3) строгое, поэтому суще­ ствует <5>0 такое, что для всех у: \у—у0\<5, неравенство (7.3) сохраняется. Таким образом, для этих у сохраняется и неравенство (7.4), т. е. выполняется равенство K(f, y)=v. Это означает, что

dK(f, у)/ду=0.

(7.5)

101

в(у,у)-ф(у,у)=-2у2

Уравнение (7.5) перепишем в виде

 

[в(У, У)-Ф(У, У)¥(у) = ] ФЛ*> y¥(*)dx+

 

о

 

+ R ( * , y)f(x)dx, yeS(y0, 8).

(7.6)

У

Следовательно, получено интегральное уравнение (7.6) относите­ льно искомой стратегии/

7.2. Пример 16. Рассмотрим бесшумную дуэль, сформулирован­ ную в примере 5 п. 1.2. Функция выигрыша Н(х, у) в игре имеет вид (7.1), где

ij/(x,y)=x-y+xy;

(7.7)

в(х,у)=х-у-ху;

(7.8)

р(х) = 0.

(7.9)

Заметим, что данная игра является симметричной, поскольку Н (х, у)=—Н(у,х) (кососимметричная функция выигрыша). Поэто­ му анализ, аналогичный проведенному в п. 9.2 гл. 1, показывает, что значение v игры, если оно существует, равно нулю, а оптимальные стратегии игроков (если они также существуют) должны быть оди­ наковыми.

Имеем: ф,(зс,у)= - 1 +х; ву(х, у)= - 1 -х;

и интегральное уравнение (7.6) принимает вид

-2у2№ = ] (х-l)f(x)dx-\

(x+ l)f(x)dx.

(7.10)

О

у

 

Будем искать стратегию / в классе дифференцируемых плотностей

распределения, принимающих положительные значения в интервале

(а, /?) с: [0, 1] (интервал (а, /?) — спектр стратегии J). Тогда (7.10)

можно записать следующим образом:

 

 

у

Д

(7.11)

-2угт = [ (x-\)f(x)dx-l

(x+ l)f(x)dx.

«

У

 

Дифференцируя обе части (7.11)

по у, получим дифференциальное

уравнение вида

 

 

-4yf-2y2f =

(y-l)f+(y+l)f

 

или

 

 

J*r=-3/Xy*0).

(7.12)

Интегрируя уравнение (7.12), имеем

 

f<y) = yy-\

(7.13)

где у — некоторая константа.

102

Теперь осталось найти а, /? и у. Напомним, что оптимальные стратегии игроков в рассматриваемой игре одинаковы. Из нашего предположения о спектре стратегии/следует, что

Wy) = Q

(7.14)

для всех у е (a, /?).

Пусть /?< 1. Поскольку функция K(f, у) непрерывна по у, из (7.14)

имеем K(f, /0=0. Следовательно,

 

а

(7.15)

J (x-p+Px)f(x)dx=0.

а

Однако в случае /?< 1 из (7.15) следует

K(f, 1) = J (х-1 +x)f(x)dx<0,

а

что противоречит оптимальности стратегии/ Таким образом, fi= 1 и K(f, 1)=0. Тогда, подставляя (7.13) в (7.15) при /?=1, получаем

1

 

f2x-l ,

 

j — <ь=о, 7^0.

 

Откуда вытекает

 

За2 -4а+1=0.

(7.16)

Решая уравнение (7.16), найдем два корня а=1 и а =1/3, первый из которых посторонний. Следовательно, а= 1/3. Коэффициент у нахо­ дится из условия нормировки/(у)

\ f(y)dy=y J r3efy=l,

1/3 1/3

откуда у = 1/4.

Таким образом, получено решение игры примера 5 п. 1.2: значе­ ние игры равно v = 0, оптимальные стратегии/и g обоих игроков (как плотности распределения) равны между собой и имеют вид

П } = 50, е с л и х < 1 / 3 '

ПХ)

(1/(4х3), если

х>•1/3.

7.3. Пример 17. Найдем решение игры «шумная дуэль» (см.

пример 4 п. 1.2) для функций меткости pY

(х)=х и р2 (у)=у. Функция

выигрыша Н(х, у) в игре имеет вид (7.1), где

 

ф(х,у)=2х-1;

(7.17)

 

9(х,у) = 1~2у;

(7.18)

 

<р(х) = 0.

(7.19)

юз

Игра является симметричной, поэтому v = 0, а оптимальные стратегии игроков совпадают. Здесь оба игрока имеют чистую оптимальную стратегию ;с*=>>* = 1/2. Действительно,

#(1/2, у)=6 (1/2, у) = 1 -2у> О, если у < 1/2, Я(1/2, у)=ср (1/2) = 0, если у= 1/2, Я(1/2, у)=ф(112, у)=0, если у>1/2.

С точки зрения интерпретации игры решение предписывает дуэлян­ там стрелять одновременно, когда каждый пройдет половину диста­ нции до барьера.

В заключение следует отметить, что класс игр с выбором момен­ та времени хорошо изучен (см. [6, 3, 23]).

§ 8. РЕШЕНИЕ БЕСКОНЕЧНЫХ ОДНОВРЕМЕННЫХ ИГР ПОИСКА

В этом параграфе будет приведено решение игр поиска с бес­ конечным числом стратегий, сформулированных в п. 1.2. Первая из рассматриваемых игр интересна тем, что в ней оба игрока имеют оптимальные смешанные стратегии с конечным спектром.

8.1. Пример 18. (Поиск на отрезке). Рассмотрим задачу поиска на отрезке (см. пример 2 п. 1.1), которая моделируется игрой на единичном квадрате с функцией выигрыша Н(х, у) вида

я (

jl, если |* - ,|</, /е(0, 1),

 

(О в противном случае.

Заметим, что при /> 1/2 у игрока 1 имеется чистая оптимальная: стратегия х* = 1/2 и значение игры равно единице, поскольку в этом случае Н(х*, у)=Н(1/2, у)=1, так как \у-1/2|^ 1/2^/_для всех уе[0, 1]. Предположим, что /< 1/2. Заметим, что стратегия х=1 доминиру­ ет все чистые стратегии х<1, а стратегия x=l — I — все стратегии х> 1—1. Действительно,

Щх,у)=Н(1,у)=\1пПрЯуе[°>Ц>

(О в противном случае,

и если х<1, то

Щх,у)=\1пПрЯуе[°>1+Х]'

(О в противном случае.

Таким образом, при х<1: Н(х, у)^Н(1, у) для всех уе[0, 1]. Анало­ гично имеем

)=Н(\-1,у)=!}

при уе[\-21, 1],

Н(х,у)-. ч . .,„

[О в противном случае,

104

и если хе[1 —I, 1], то

H(x,y)=Sn \\ при уе[х—1, 1],

О в противном случае.

Таким образом, при хе[1 — /, 1] Н(х, у)^Н(1 —/, у) для всех>>е[0, 1]. Рассмотрим следующую смешанную стратегию ц* игрока ).

Пусть l=xl<x2<...<xm=l — I — точки, для которых расстояние

между любой парой соседних точек не превосходит 21. Стратегия ц* выбирает каждую из этих точек с равными вероятностями \\т. Очевидно, что при этом любая точка уе[0, 1] попадает в /-окре­ стность хотя бы одной точки хк. Следовательно,

К(ц*,у)>11т. (8.2) Пусть теперь v* — стратегия игрока 2, которая состоит в равнове­

роятном выборе точек 0=у12<-.<уя=1,

причем расстояние

между парой соседних точек больше 21. Тогда, очевидно, существует не более одной точки ук, в /-окрестности которой содержится точка

х. Следовательно,

К(х, v*)<l/«.

(8.3)

Если бы удалось построить стратегии ц*, v* так, чтобы т=п, то величина 1/и была бы значением игры, а стратегии ц*, v* — оп­ тимальными стратегиями игроков.

Оказывается, такие стратегии действительно можно построить. Для этого достаточно взять

J1/(2/), если 1/(2/) — целое,

(Jl/(2/)]+l в противном случае.

 

Здесь [а] — целая часть числа а. Точки

 

xt=l+~

(i-1), i=\, 2, ..., и,

(8.5)

 

л—1

 

отстоят друг от друга не более чем на 21, а расстояние между

соседними точками

 

yj=—:» 7=1,2, ...,R,

(8.6)

п— 1

 

строго больше 21. Таким образом, 1/и — значение игры, а опти­ мальные стратегии ц*, v* являются равновероятными смесями чис­ тых стратегий, определяемых формулами (8.5), (8.6).

8.2. Пример 19. Рассмотрим обобщение предыдущей задачи в том случае, когда игрок 1 (ищущий) выбирает систему из s точек *!, .., xs, х,е[0, 1], i=l, ..., s, а игрок 2 (прячущийся) выбирает

105

независимо и одновременно с игроком /

точку уеГО,

1]. Игрок

2 считается обнаруженным, если находится такое je{\,

..., s), что

\у — Xj\^l, />0. В соответствии с этим функция выигрыша (выигрыш

игрока 1) определяется следующим образом:

 

1, если min

\у—х^1,

(8.7)

{О в противном случае.

 

Предположим, что игрок 1 располагает точки х..., х„ в точках Xi=l+{\—2l)(i—\)l{n — \), 1</^и, являющихся точками спектра

стратегии fi* из предыдущего примера. Очевидно, что располагать две точки хЛ, хв одной точке отрезка [0, 1] (т. е. выбирать

совпадающие точки) невыгодно. Пусть ц, — стратегия игрока 1,

выбирающая равновероятно любые 5-наборы не равных друг другу точек {3CJ}. Если s^n, то, расположив в каждой из точек х\ по точке

Xj, игрок 1 полностью покроет отрезок [0, 1] интервалами длины 2/ с центрами в точках Зс, и тем самым обеспечит, что для любой точки

уе[0,1] будет иметь место min \xj—j>|</, т. е. в этом случае значение

игры равно единице. Поэтому будем считать, что s<n. Число всевозможных различных выборов ^-наборов точек из множества {х,} равно Q. Имеем

К(ц*, y)=-LH(xh, ...,~Xi-у) (±\>Щ

=

*-.

Действительно, точка у обнаруживается, если

она

попадает_ в

/-окрестность хотя бы одной из выбранных стратегией (if точек {Зс,}.

Для того чтобы это произошло, необходимо игроку 1 выбрать точку xt из /-окрестности точки у. Число наборов, удовлетворяющих

этому требованию, не менее C„Z\.

Предположим теперь, что игрок 2 использует стратегию v* из предыдущего примера, а игрок ] — произвольную чистую страте­ гию x=(xv ..., xs). Тогда

"

1 s

K(xv ..., xs; v*)= £ H(xu ..., xs;

yj)~^-.

Таким образом, значение игры равно sin и ц*, v* — оптимальные стратегии игроков. Значение игры линейно зависит от количества выбираемых ищущим игроком точек.

106

8.3. Пример 20. (Поиск на сфере). Рассмотрим игру поиска на сфере (см. пример 3 п. 1.2). Функция выигрыша Н(х, у) имеет вид

{1, если уеМх,

(8.8)

О в противном случае,

S

где х={х..., х, — набор s точек на сфере С и Ms= \J S(xj, г); S(XJ, r) г-

сферическая окрестность точки Xj. Множество смешанных стратегий игрока 1 пред­ ставляет собой семейство вероятностных мер {М}, определенных на декартовом произведении s сфер Сх Сх... х C—Q, т. е. на fl=C.

Множество смешанных стратегий игрока 2 определим как семейство вероятност­ ных мер {v}, определенных на сфере С.

Рассмотрим конкретную пару стратегий (p.*, v*). В качестве стратегии v* выберем равномерную меру на сфере С, т. е. потребуем, чтобы

I

L(a)

(8.9)

 

Л * = — - ,

 

4nR2

 

где L(a) — лебегова мера (площадь) множества А.

 

Будем предполагать, что параметры игры 5, г и Л таковы, что можно выбрать

систему точек х=(хи

х2,..., ха), удовлетворяющих условию

 

 

я

 

 

L{Mx)=Y.L(S{xj,r)),

(8.10)

 

J-i

 

(сферические сегменты S(xp r) не пересекаются).

 

Зафиксируем фигуру М, на некоторой сфере С. Тогда смешанная стратегия ц*

порождается случайным бросанием этой фигуры Мх на сферу С. Для этого в фигуре Мх фиксируется некоторая внутренняя точка z, с которой жестко связываются два

неколлинеарвых вектора а, Ъ (с углом tp>0 между ними), расположенных в касатель­ ной плоскости к Мх в точке z.

Точка z «бросается» на сферу С в соответствии с равномерным распределением, т. е. плотностью 1/(4яА2). Пусть в результате реализуется точка / е С . Фигура Мх с фиксированными на ней векторами параллельно переносится на сферу С так,

чтобы точки z и z7 совпали. Таким образом, векторы а, Ъ будут лежать в касательной плоскости к сфере С в точке т!.

Затем на промежутке [0, 2п] выбирают в соответствии с равномерным рас­ пределением угол <р\ и вектор b в касательной плоскости поворачивают вместе со связанной с ним фигурой Мх на угол ц> по часовой стрелке. В результате фигура

Мх и вектор Ъ переходят в новое положение на сфере С. Случайное размещение множества Мх на сфере в соответствии с описанной двухэтапнои процедурой и поро­ ждает случайный выбор точек x!v x!2, ..., x"s, соответствующих смешанной стратегии ц*, а именно: игрок / выбирает точки У,,..., У еС, в которых оказались центры хи ..., х~, сферических окрестностей S(xj, г), составляющих множество Мх.

Мера ц*, построенная таким образом, оказывается инвариантной, т. е. вероят­ ность покрытия множеством Мх любой точки уе С не зависит от у*. Действительно,

107

найдем вероятность этого события. Пусть П={со} —пространство всевозможных размещений Мх на сфере С. Тогда средняя площадь, покрываемая на сфере С при

бросании на нее множества Мх (математическое ожидание площади), равна L (Мх), в то же время

 

L{Mx)=HJ(y,io)dydy*,

(8.11)

 

ас

 

где J (у, со) — характеристическая функция множества на сфере

С, покрываемого

областью Мх. По теореме Фубини имеем

 

f J J(y, co)dydii*= J J J(y, co)dy*dy.

(8.12)

а с

с а

 

Однако в силу инвариантности меры ц* интеграл \ J [у, о>)ф*, совпадающий с веро­ ятностью покрытия точки у множеством Мх, от у не зависит и равен р . Тогда из (8.11), (8.12) имеем

L{MX)

Е

*•№(*>'))

 

Р= —J-

°J~'

. D2

(8.13)

4nR2

 

4nR2

 

 

Обозначим через K(ji, v) математическое ожидание выигрыша при использовании игроками смешанных стратегий Л6{д} и ve{v}. Если один из игроков использует чистую стратегию, то

К(х, v)=J Н(х, y)<h= J Л=Рг(у6 Л/х ),

СИх

KQi, у)= J Н(х, у№=[ ЦХ, У№'Ъ(уеМх),

ао

ив этом случае математические ожидания соответственно имеют смысл вероят­ ностей попадания случайной точки в фиксированную область и накрытия случайной областью фиксированной точки. Для всех у и х=(хи ..., х,) в силу условий (8.9)

и (8.13) имеем

 

L(MX)

 

lL(S(xj,r))

 

К{х, v*)

4яЛ2

<*=*

4яЛ2

| 1 - / 1 - ( - )

),

 

 

2 \ V W

)

 

S

 

 

2- и-ш

 

 

£

L(S(xj, r))

 

KQi*,y) = i~l

AnR2

 

так как L{S{xj, г))=2яЛ(Л - ^Л 2 - г 2 ) .

Из определения седловой точки и полученного неравенства K(ji*, у)~^К{х, v*)

•См., например: Саитало Л. А. Интегральная геометрия и геометрические вероятности. М., 1983.

108

к^'\{Ч1-$)

значение рассмотренной игры поиска.

8.4.Рассмотрим вариант предыдущей игры, полагая, что игрок 2 выбирает некоторое односвязное множество Ус С и целью игрока 1 является максимизация площади пересечения

М Г О ^ ^ ^ П U S(X/,r)\

j-i

Цель игрока 2 противоположна. В остальном игра совпадает с игрой, рассмотренной в начале параграфа. Стратегия ц* игрока 1 совпадает с таковой в предыдущей игре. Смешанная стратегия v* игрока 2 строится аналогично стратегии р* и заключается в случайном бросании множества У на сферу (в предыдущем случае игрок 2 случайно выбирал точки yeQ. Таким образом, v* строится как инвариантная мера, которая состоит из случайного (в соответствии с равномерным распределением на С) выбора одной из фиксированных точек множества У на С и далее поворота У вокруг этой точки на случайный угол (в соответствии с равномерным распределением на [0, 2л]). Пусть К(х, v), К(ц,у) соответствуют математическим ожиданиям площади пересече­ ния L(Y\)MX). Тогда

КОЛ у)=К{х, v*)=K0i», v*)

L{Y)L{MJ

— г — .

 

 

2яЛ2

Если У— г-окрестность точки у, то значение игры равно

K(fl*, V*) =*5

(R-y/tf-t3).

Упражнения • задачи

1. Игра нападения защиты. Игрок 1 силами А единиц намерен атаковать один

из объектов Ci

С„, ценность которых определяется числами tx>О, х2>О,.... т„>0,

причем т12>...>тя. Чистой стратегией х игрока 1 является вектор Jc=(ft

(п),

л

 

 

£ ii=A, где £i — часть сил, выделенных для атаки объекта Q. Суммарные силы

обороняющейся стороны (игрок 2) равны В. Чистой стратегией у игрока 2 является выбор набора неотрицательных чисел y=(Vi, —> >ы)> удовлетворяющих условию

л

£ t\i=B, где щ — часть сил, предназначенных для защиты объекта Cj. Результат £таки на объект С, пропорционален разности £/ — щ, если силы атакующих превос­ ходят силы защищающихся, а в остальных случаях он равен нулю. Построить функцию выигрыша.

2. Игра на единичном квадрате имеет функцию выигрыша

Н(х,у)=ху-1/Зх-\12у.

Показать, что (1/2, 1/3) — ситуация равновесия в этой игре.

3. Показать, что игра на единичном квадрате с функцией выигрыша

H(x,y)=siga(x-y)

имеет седловую точку.

4 Показать, что игра на единичном квадрате типа дуэли с функцией выигрыша 109

Соседние файлы в папке Теория игр