Теория игр / Петросян_Теория_игр
.pdfигру в случае, когда множество S совпадает с отрезком [—1, 1]. Теорема. Оптимальная смешанная стратегия v* игрока 2 за
ключается в равновероятном выборе двух наборов из т точек:
1 + |
4/ |
|
4/ |
|
, 1=0, 1, ..., т-\>, |
1_ — 1=о, 1, .., т-\ |
|
2/И-1 |
|
Ъп-\ |
Оптимальная стратегия ц* игрока 1 состоит в выборе точек
Ъп-\ -, /=0, 1, ...,2т-1
с вероятностями 1/(2/и). Значение игры равно 1/(2/и— 1). Доказательство. Пусть р* и v* — смешанные стратегии иг
роков 1 и 2 соответственно, оптимальность которых нужно до казать. Введем следующие обозначения:
, Г2т-2.-1 |
2m-2i+l"| |
. |
, |
„ |
|
|
|
||||
li=\———,——— |
, |
i=l, 2, ..., 2m-1. |
|
||||||||
Покажем вначале, что К{х, v*)<l/(2m—1) для |
всех |
хе[— 1, 1]. |
|||||||||
Действительно, при xel, |
|
имеем |
|
|
|
|
|
|
|
||
К(х, v*)=- min |
2m—4J—l |
|
1 |
|
- 2m+4i+l |
|
|
||||
|
2m-l |
|
+-mm |
2m - l |
|
|
|||||
1 / |
2m-2j-l\ |
|
1 / 2 m - 2 / + l |
\ |
1 |
. |
(6.8) |
||||
=-[x |
|
|
— |
+- |
2 w - l |
x = |
2/w-l |
||||
2 \ |
2m-\ |
/ |
2 \ |
/ |
|
|
|||||
Пусть теперь игрок 1 выбирает смешанную стратегию ц*, а иг |
|||||||||||
рок 2 — произвольную чистую стратегию у={у1, |
.., ут). |
||||||||||
Обозначим |
|
|
|
|
|
|
|
|
|
|
|
|
2т—2/—1 |
У=0, 1, |
|
...,Ьп-\. |
|
|
|
||||
х,=- 2т-1 |
|
|
|
|
|
||||||
Тогда |
|
|
2 т - 1 |
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
К{ц*, 3>)= Е |
min p(x/ ,yj )~ = |
|
|
|
|||||||
= Г" S |
т 1 П |
Р (*»->' ^ ) + m i Q |
P(*V-2. У|) > |
|
|||||||
|
|
|
1 |
|
2 |
|
1 |
|
|
|
(6.9) |
|
>— • т |
• |
= |
|
. |
|
|
||||
|
|
|
|
|
|||||||
|
|
|
2т |
|
2 т - 1 |
2т-1 |
|
|
|
Из неравенств (6.8), (6.9) вытекает утверждение теоремы.
100
§ 7. ОДИН КЛАСС ИГР С РАЗРЫВНОЙ ФУНКЦИЕЙ ВЫИГРЫША
Для игр, у которых функции выигрыша разрывны, нельзя гаран тировать существование значения игры в смешанных стратегиях (см. пример п. 4.12). Однако часто именно разрывность функции выигрыша позволяет найти оптимальные стратегии и значение иг ры. Нахождению решения помогают также эмпирические предполо жения о виде оптимальных стратегий игроков.
7.1. В данном параграфе будут исследованы игры с выбором момента времени или игры типа дуэли (см. примеры 4.5 п. 1.2). Основной особенностью этого класса игр на квадрате является разрывность функции выигрыша Н(х, у) вдоль диагонали х=у.
Рассмотрим игру на единичном квадрате с функцией выигрыша
{ср(х), если х=у, в(х, у), если х>у,х<у,\1/(х, у), если
где ф(х, у) — определена и непрерывна на множестве 0<х<^<1, функция (р непрерывна на [0, 1], а в(х, у) определена и непрерывна на множестве 0<j><;c< 1. Предположим, что игра Г=(Х, Y, Н), где Аг=У=[0, 1], Н—задана (7.1), имеет оптимальные смешанные стратегии ц*, v* игроков 1 и 2 соответственно. Более того, пред положим, что оптимальные смешанные стратегии /х*, v* являются распределениями вероятностей, которые имеют непрерывные плот ности /* (х) и g* (x) соответственно.
Далее в этом параграфе будем обозначать искомую стратегию / (соответственно g), понимая под этим плотность распределения. Выясним свойства оптимальных стратегий.
Пусть/— стратегия игрока 1. Для уе[0, 1] имеем
K(f, у) = ] Ф (х, УУ(х)сЬс+\в(х, yV(x)dx. |
(7.2) |
|
О |
У |
|
Предположим, что / |
и g — оптимальные стратегии |
игроков |
1т 2. Тогда для любой точки у0, в которой |
|
|
|
g(yo)>0 |
(7.3) |
(точки спектра стратегии g), выполняется |
|
|
|
Ktf, y0)=v, |
(7.4) |
где v — значение игры. Но равенство (7.3) строгое, поэтому суще ствует <5>0 такое, что для всех у: \у—у0\<5, неравенство (7.3) сохраняется. Таким образом, для этих у сохраняется и неравенство (7.4), т. е. выполняется равенство K(f, y)=v. Это означает, что
dK(f, у)/ду=0. |
(7.5) |
101
Уравнение (7.5) перепишем в виде |
|
[в(У, У)-Ф(У, У)¥(у) = ] ФЛ*> y¥(*)dx+ |
|
о |
|
+ R ( * , y)f(x)dx, yeS(y0, 8). |
(7.6) |
У
Следовательно, получено интегральное уравнение (7.6) относите льно искомой стратегии/
7.2. Пример 16. Рассмотрим бесшумную дуэль, сформулирован ную в примере 5 п. 1.2. Функция выигрыша Н(х, у) в игре имеет вид (7.1), где
ij/(x,y)=x-y+xy; |
(7.7) |
в(х,у)=х-у-ху; |
(7.8) |
р(х) = 0. |
(7.9) |
Заметим, что данная игра является симметричной, поскольку Н (х, у)=—Н(у,х) (кососимметричная функция выигрыша). Поэто му анализ, аналогичный проведенному в п. 9.2 гл. 1, показывает, что значение v игры, если оно существует, равно нулю, а оптимальные стратегии игроков (если они также существуют) должны быть оди наковыми.
Имеем: ф,(зс,у)= - 1 +х; ву(х, у)= - 1 -х;
и интегральное уравнение (7.6) принимает вид
-2у2№ = ] (х-l)f(x)dx-\ |
(x+ l)f(x)dx. |
(7.10) |
О |
у |
|
Будем искать стратегию / в классе дифференцируемых плотностей |
||
распределения, принимающих положительные значения в интервале |
||
(а, /?) с: [0, 1] (интервал (а, /?) — спектр стратегии J). Тогда (7.10) |
||
можно записать следующим образом: |
|
|
у |
Д |
(7.11) |
-2угт = [ (x-\)f(x)dx-l |
(x+ l)f(x)dx. |
|
« |
У |
|
Дифференцируя обе части (7.11) |
по у, получим дифференциальное |
|
уравнение вида |
|
|
-4yf-2y2f = |
(y-l)f+(y+l)f |
|
или |
|
|
J*r=-3/Xy*0). |
(7.12) |
|
Интегрируя уравнение (7.12), имеем |
|
|
f<y) = yy-\ |
(7.13) |
где у — некоторая константа.
102
Теперь осталось найти а, /? и у. Напомним, что оптимальные стратегии игроков в рассматриваемой игре одинаковы. Из нашего предположения о спектре стратегии/следует, что
Wy) = Q |
(7.14) |
для всех у е (a, /?).
Пусть /?< 1. Поскольку функция K(f, у) непрерывна по у, из (7.14)
имеем K(f, /0=0. Следовательно, |
|
а |
(7.15) |
J (x-p+Px)f(x)dx=0. |
а
Однако в случае /?< 1 из (7.15) следует
K(f, 1) = J (х-1 +x)f(x)dx<0,
а
что противоречит оптимальности стратегии/ Таким образом, fi= 1 и K(f, 1)=0. Тогда, подставляя (7.13) в (7.15) при /?=1, получаем
1 |
|
f2x-l , |
|
j — <ь=о, 7^0. |
|
Откуда вытекает |
|
За2 -4а+1=0. |
(7.16) |
Решая уравнение (7.16), найдем два корня а=1 и а =1/3, первый из которых посторонний. Следовательно, а= 1/3. Коэффициент у нахо дится из условия нормировки/(у)
\ f(y)dy=y J r3efy=l,
1/3 1/3
откуда у = 1/4.
Таким образом, получено решение игры примера 5 п. 1.2: значе ние игры равно v = 0, оптимальные стратегии/и g обоих игроков (как плотности распределения) равны между собой и имеют вид
П } = 50, е с л и х < 1 / 3 ' |
||
ПХ) |
(1/(4х3), если |
х>•1/3. |
7.3. Пример 17. Найдем решение игры «шумная дуэль» (см. |
||
пример 4 п. 1.2) для функций меткости pY |
(х)=х и р2 (у)=у. Функция |
|
выигрыша Н(х, у) в игре имеет вид (7.1), где |
||
|
ф(х,у)=2х-1; |
(7.17) |
|
9(х,у) = 1~2у; |
(7.18) |
|
<р(х) = 0. |
(7.19) |
юз
Игра является симметричной, поэтому v = 0, а оптимальные стратегии игроков совпадают. Здесь оба игрока имеют чистую оптимальную стратегию ;с*=>>* = 1/2. Действительно,
#(1/2, у)=6 (1/2, у) = 1 -2у> О, если у < 1/2, Я(1/2, у)=ср (1/2) = 0, если у= 1/2, Я(1/2, у)=ф(112, у)=0, если у>1/2.
С точки зрения интерпретации игры решение предписывает дуэлян там стрелять одновременно, когда каждый пройдет половину диста нции до барьера.
В заключение следует отметить, что класс игр с выбором момен та времени хорошо изучен (см. [6, 3, 23]).
§ 8. РЕШЕНИЕ БЕСКОНЕЧНЫХ ОДНОВРЕМЕННЫХ ИГР ПОИСКА
В этом параграфе будет приведено решение игр поиска с бес конечным числом стратегий, сформулированных в п. 1.2. Первая из рассматриваемых игр интересна тем, что в ней оба игрока имеют оптимальные смешанные стратегии с конечным спектром.
8.1. Пример 18. (Поиск на отрезке). Рассмотрим задачу поиска на отрезке (см. пример 2 п. 1.1), которая моделируется игрой на единичном квадрате с функцией выигрыша Н(х, у) вида
я ( |
jl, если |* - ,|</, /е(0, 1), |
|
(О в противном случае. |
Заметим, что при /> 1/2 у игрока 1 имеется чистая оптимальная: стратегия х* = 1/2 и значение игры равно единице, поскольку в этом случае Н(х*, у)=Н(1/2, у)=1, так как \у-1/2|^ 1/2^/_для всех уе[0, 1]. Предположим, что /< 1/2. Заметим, что стратегия х=1 доминиру ет все чистые стратегии х<1, а стратегия x=l — I — все стратегии х> 1—1. Действительно,
Щх,у)=Н(1,у)=\1пПрЯуе[°>Ц>
(О в противном случае,
и если х<1, то
Щх,у)=\1пПрЯуе[°>1+Х]'
(О в противном случае.
Таким образом, при х<1: Н(х, у)^Н(1, у) для всех уе[0, 1]. Анало гично имеем
)=Н(\-1,у)=!} |
при уе[\-21, 1], |
|
Н(х,у)-. „ ч . .,„ |
1П |
[О в противном случае,
104
и если хе[1 —I, 1], то
H(x,y)=Sn \\ при уе[х—1, 1],
О в противном случае.
Таким образом, при хе[1 — /, 1] Н(х, у)^Н(1 —/, у) для всех>>е[0, 1]. Рассмотрим следующую смешанную стратегию ц* игрока ).
Пусть l=xl<x2<...<xm=l — I — точки, для которых расстояние
между любой парой соседних точек не превосходит 21. Стратегия ц* выбирает каждую из этих точек с равными вероятностями \\т. Очевидно, что при этом любая точка уе[0, 1] попадает в /-окре стность хотя бы одной точки хк. Следовательно,
К(ц*,у)>11т. (8.2) Пусть теперь v* — стратегия игрока 2, которая состоит в равнове
роятном выборе точек 0=у1<у2<-.<уя=1, |
причем расстояние |
между парой соседних точек больше 21. Тогда, очевидно, существует не более одной точки ук, в /-окрестности которой содержится точка
х. Следовательно,
К(х, v*)<l/«. |
(8.3) |
Если бы удалось построить стратегии ц*, v* так, чтобы т=п, то величина 1/и была бы значением игры, а стратегии ц*, v* — оп тимальными стратегиями игроков.
Оказывается, такие стратегии действительно можно построить. Для этого достаточно взять
J1/(2/), если 1/(2/) — целое,
(Jl/(2/)]+l в противном случае. |
|
|
Здесь [а] — целая часть числа а. Точки |
|
|
xt=l+~ |
(i-1), i=\, 2, ..., и, |
(8.5) |
|
л—1 |
|
отстоят друг от друга не более чем на 21, а расстояние между |
|
соседними точками |
|
yj=—:» 7=1,2, ...,R, |
(8.6) |
п— 1 |
|
строго больше 21. Таким образом, 1/и — значение игры, а опти мальные стратегии ц*, v* являются равновероятными смесями чис тых стратегий, определяемых формулами (8.5), (8.6).
8.2. Пример 19. Рассмотрим обобщение предыдущей задачи в том случае, когда игрок 1 (ищущий) выбирает систему из s точек *!, .., xs, х,е[0, 1], i=l, ..., s, а игрок 2 (прячущийся) выбирает
105
независимо и одновременно с игроком / |
точку уеГО, |
1]. Игрок |
|
2 считается обнаруженным, если находится такое je{\, |
..., s), что |
||
\у — Xj\^l, />0. В соответствии с этим функция выигрыша (выигрыш |
|||
игрока 1) определяется следующим образом: |
|
||
1, если min |
\у—х^1, |
(8.7) |
|
{О в противном случае. |
|||
|
Предположим, что игрок 1 располагает точки х1г ..., х„ в точках Xi=l+{\—2l)(i—\)l{n — \), 1</^и, являющихся точками спектра
стратегии fi* из предыдущего примера. Очевидно, что располагать две точки хЛ, х]г в одной точке отрезка [0, 1] (т. е. выбирать
совпадающие точки) невыгодно. Пусть ц, — стратегия игрока 1,
выбирающая равновероятно любые 5-наборы не равных друг другу точек {3CJ}. Если s^n, то, расположив в каждой из точек х\ по точке
Xj, игрок 1 полностью покроет отрезок [0, 1] интервалами длины 2/ с центрами в точках Зс, и тем самым обеспечит, что для любой точки
уе[0,1] будет иметь место min \xj—j>|</, т. е. в этом случае значение
игры равно единице. Поэтому будем считать, что s<n. Число всевозможных различных выборов ^-наборов точек из множества {х,} равно Q. Имеем
К(ц*, y)=-LH(xh, ...,~Xi-у) (±\>Щ |
= |
*-. |
Действительно, точка у обнаруживается, если |
она |
попадает_ в |
/-окрестность хотя бы одной из выбранных стратегией (if точек {Зс,}.
Для того чтобы это произошло, необходимо игроку 1 выбрать точку xt из /-окрестности точки у. Число наборов, удовлетворяющих
этому требованию, не менее C„Z\.
Предположим теперь, что игрок 2 использует стратегию v* из предыдущего примера, а игрок ] — произвольную чистую страте гию x=(xv ..., xs). Тогда
" |
1 s |
K(xv ..., xs; v*)= £ H(xu ..., xs; |
yj)~^-. |
Таким образом, значение игры равно sin и ц*, v* — оптимальные стратегии игроков. Значение игры линейно зависит от количества выбираемых ищущим игроком точек.
106
8.3. Пример 20. (Поиск на сфере). Рассмотрим игру поиска на сфере (см. пример 3 п. 1.2). Функция выигрыша Н(х, у) имеет вид
{1, если уеМх,
(8.8)
О в противном случае,
S
где х={х1У ..., х, — набор s точек на сфере С и Ms= \J S(xj, г); S(XJ, r) — г-
сферическая окрестность точки Xj. Множество смешанных стратегий игрока 1 пред ставляет собой семейство вероятностных мер {М}, определенных на декартовом произведении s сфер Сх Сх... х C—Q, т. е. на fl=C.
Множество смешанных стратегий игрока 2 определим как семейство вероятност ных мер {v}, определенных на сфере С.
Рассмотрим конкретную пару стратегий (p.*, v*). В качестве стратегии v* выберем равномерную меру на сфере С, т. е. потребуем, чтобы
I |
L(a) |
(8.9) |
|
Л * = — - , |
|
|
4nR2 |
|
где L(a) — лебегова мера (площадь) множества А. |
|
|
Будем предполагать, что параметры игры 5, г и Л таковы, что можно выбрать |
||
систему точек х=(хи |
х2,..., ха), удовлетворяющих условию |
|
|
я |
|
|
L{Mx)=Y.L(S{xj,r)), |
(8.10) |
|
J-i |
|
(сферические сегменты S(xp r) не пересекаются). |
|
|
Зафиксируем фигуру М, на некоторой сфере С. Тогда смешанная стратегия ц* |
порождается случайным бросанием этой фигуры Мх на сферу С. Для этого в фигуре Мх фиксируется некоторая внутренняя точка z, с которой жестко связываются два
неколлинеарвых вектора а, Ъ (с углом tp>0 между ними), расположенных в касатель ной плоскости к Мх в точке z.
Точка z «бросается» на сферу С в соответствии с равномерным распределением, т. е. плотностью 1/(4яА2). Пусть в результате реализуется точка / е С . Фигура Мх с фиксированными на ней векторами параллельно переносится на сферу С так,
чтобы точки z и z7 совпали. Таким образом, векторы а, Ъ будут лежать в касательной плоскости к сфере С в точке т!.
Затем на промежутке [0, 2п] выбирают в соответствии с равномерным рас пределением угол <р\ и вектор b в касательной плоскости поворачивают вместе со связанной с ним фигурой Мх на угол ц> по часовой стрелке. В результате фигура
Мх и вектор Ъ переходят в новое положение на сфере С. Случайное размещение множества Мх на сфере в соответствии с описанной двухэтапнои процедурой и поро ждает случайный выбор точек x!v x!2, ..., x"s, соответствующих смешанной стратегии ц*, а именно: игрок / выбирает точки У,,..., У еС, в которых оказались центры хи ..., х~, сферических окрестностей S(xj, г), составляющих множество Мх.
Мера ц*, построенная таким образом, оказывается инвариантной, т. е. вероят ность покрытия множеством Мх любой точки уе С не зависит от у*. Действительно,
107
найдем вероятность этого события. Пусть П={со} —пространство всевозможных размещений Мх на сфере С. Тогда средняя площадь, покрываемая на сфере С при
бросании на нее множества Мх (математическое ожидание площади), равна L (Мх), в то же время
|
L{Mx)=HJ(y,io)dydy*, |
(8.11) |
|
ас |
|
где J (у, со) — характеристическая функция множества на сфере |
С, покрываемого |
|
областью Мх. По теореме Фубини имеем |
|
|
f J J(y, co)dydii*= J J J(y, co)dy*dy. |
(8.12) |
|
а с |
с а |
|
Однако в силу инвариантности меры ц* интеграл \ J [у, о>)ф*, совпадающий с веро ятностью покрытия точки у множеством Мх, от у не зависит и равен р . Тогда из (8.11), (8.12) имеем
L{MX) |
Е |
*•№(*>')) |
|
|
Р= —J- |
°J~' |
. D2 |
• |
(8.13) |
4nR2 |
|
4nR2 |
|
|
Обозначим через K(ji, v) математическое ожидание выигрыша при использовании игроками смешанных стратегий Л6{д} и ve{v}. Если один из игроков использует чистую стратегию, то
К(х, v)=J Н(х, y)<h= J Л=Рг(у6 Л/х ),
СИх
KQi, у)= J Н(х, у№=[ ЦХ, У№'Ъ(уеМх),
ао
ив этом случае математические ожидания соответственно имеют смысл вероят ностей попадания случайной точки в фиксированную область и накрытия случайной областью фиксированной точки. Для всех у и х=(хи ..., х,) в силу условий (8.9)
и (8.13) имеем
|
L(MX) |
|
lL(S(xj,r)) |
|
|
К{х, v*) |
4яЛ2 |
<*=* |
4яЛ2 |
| 1 - / 1 - ( - ) |
), |
|
|
2 \ V W |
) |
||
|
S |
|
|
2- и-ш |
|
|
£ |
L(S(xj, r)) |
|
||
KQi*,y) = i~l |
AnR2 |
|
так как L{S{xj, г))=2яЛ(Л - ^Л 2 - г 2 ) .
Из определения седловой точки и полученного неравенства K(ji*, у)~^К{х, v*)
•См., например: Саитало Л. А. Интегральная геометрия и геометрические вероятности. М., 1983.
108
к^'\{Ч1-$)
—значение рассмотренной игры поиска.
8.4.Рассмотрим вариант предыдущей игры, полагая, что игрок 2 выбирает некоторое односвязное множество Ус С и целью игрока 1 является максимизация площади пересечения
М Г О ^ ^ ^ П U S(X/,r)\
j-i
Цель игрока 2 противоположна. В остальном игра совпадает с игрой, рассмотренной в начале параграфа. Стратегия ц* игрока 1 совпадает с таковой в предыдущей игре. Смешанная стратегия v* игрока 2 строится аналогично стратегии р* и заключается в случайном бросании множества У на сферу (в предыдущем случае игрок 2 случайно выбирал точки yeQ. Таким образом, v* строится как инвариантная мера, которая состоит из случайного (в соответствии с равномерным распределением на С) выбора одной из фиксированных точек множества У на С и далее поворота У вокруг этой точки на случайный угол (в соответствии с равномерным распределением на [0, 2л]). Пусть К(х, v), К(ц,у) соответствуют математическим ожиданиям площади пересече ния L(Y\)MX). Тогда
КОЛ у)=К{х, v*)=K0i», v*) |
L{Y)L{MJ |
|
— г — . |
||
|
|
2яЛ2 |
Если У— г-окрестность точки у, то значение игры равно |
||
K(fl*, V*) =*5 |
(R-y/tf-t3). |
|
Упражнения • задачи |
1. Игра нападения — защиты. Игрок 1 силами А единиц намерен атаковать один |
||
из объектов Ci |
С„, ценность которых определяется числами tx>О, х2>О,.... т„>0, |
|
причем т1>т2>...>тя. Чистой стратегией х игрока 1 является вектор Jc=(ft |
(п), |
|
л |
|
|
£ ii=A, где £i — часть сил, выделенных для атаки объекта Q. Суммарные силы
обороняющейся стороны (игрок 2) равны В. Чистой стратегией у игрока 2 является выбор набора неотрицательных чисел y=(Vi, —> >ы)> удовлетворяющих условию
л
£ t\i=B, где щ — часть сил, предназначенных для защиты объекта Cj. Результат £таки на объект С, пропорционален разности £/ — щ, если силы атакующих превос ходят силы защищающихся, а в остальных случаях он равен нулю. Построить функцию выигрыша.
2. Игра на единичном квадрате имеет функцию выигрыша
Н(х,у)=ху-1/Зх-\12у.
Показать, что (1/2, 1/3) — ситуация равновесия в этой игре.
3. Показать, что игра на единичном квадрате с функцией выигрыша
H(x,y)=siga(x-y)
имеет седловую точку.
4 Показать, что игра на единичном квадрате типа дуэли с функцией выигрыша 109