Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Семестровая 1 (Методы оптимальных решений) / Методы оптимальных решений учебное пособие

.pdf
Скачиваний:
1246
Добавлен:
19.04.2015
Размер:
6.01 Mб
Скачать

ПРИМЕР 10.5.2 (ПОЗИЦИОННАЯ ИГРА «УГАДЫВАНИЕ МОНЕТЫ» С ПОЛНОЙ ИН-

ФОРМАЦИЕЙ). Требуется проанализировать игру, описанную в примере 6.1.2, в ситуации, когда второй игрок имеет возможность п о д г л я д е т ь, какую монету спрятал первый.

Решение. Дерево игры изображено на рис. 10.5.1. Серым цветом на рис. 10.5.1 выделены информационные множества игроков.

Стратегии первого игрока таковы:

x1

= «спрятать1 руб.»,

x2

= «спрятать 5 руб.» ,

1

 

1

 

а стратегию второго игрока удобно задавать в виде пары альтернатив

[y1, y2], где

y1, y2 { x12 = «назвать1 руб.», x22 = «назвать 5 руб.»} ,

первая из этих альтернатив y1 соответствует выбору второго игрока в случае выбора первым его первой альтернативы, а вторая альтернатива y2 соответствует выбору второго игрока в случае выбора первым игроком его второй альтернативы.

Очевидно, у второго игрока есть четыре чистых стратегии:

[x1

, x1

],

[x1

, x2

],

[x2

, x1 ],

[x2

, x2

] .

2

2

 

2

2

 

 

2

 

2

2

2

 

Выигрыши игроков удобно свести в матрицу

 

 

 

 

 

−1

−1

3

 

3

 

 

 

(10.5.1)

 

 

 

 

 

−5

 

−5

.

 

 

 

 

 

3

3

 

 

 

 

 

 

Строки этой матрицы соответствуют выбору первым игроком своих

стратегий x1

 

и x2

, а столбцы —

выбору вторым игроком своих стратегий

 

 

1

 

1

 

 

 

 

[x1

, x1

], [x1 , x

2

], [x2

, x1 ]

и [ x2

, x2

] . Элементы матрицы равны соответствую-

2

2

2

2

2

2

2

2

 

щим выигрышам первого игрока (в данной игре выигрыш второго игрока противоположен выигрышу первого).

 

 

I

 

спрятать 1 руб.

спрятать 5 руб.

 

 

II

II

 

назвать 1 руб.

назвать 5 руб.

 

 

 

назвать 1 руб.

назвать 5 руб.

–1, 1

3, –3

3, –3

–5, 5

Рис. 10.5.1. Дерево позиционной игры «Угадывание монеты» с полной информацией

301

Например, в левой верхней клетке матрицы стоит выигрыш первого игрока, если он выбрал стратегию x11 = «спрятать1 руб.» , а второй игрок выбрал стратегию [x12 , x12 ] (т. е. независимо от того, какую альтернативу выбрал первый игрок, второй называет 1 руб.). Итак, первый игрок спрятал 1 руб., а второй игрок навал 1 руб., значит, выигрыш первого игрока равен –1 руб. Выигрыши в остальных ситуациях определяются точно таким же образом.

Данная матричная игра имеет седловую точку (–1), которая соответствует первой строке и второму столбцу платежной матрицы (10.5.1), т. е. выбору первым игроком своей стратегии x11 = «спрятать1 руб.» , а вто-

рым игроком — стратегии [ x12 , x22 ] (т. е. назвать 1 руб., если первый игрок спрятал 1 руб., и 5 руб., если первый игрок спрятал 5 руб.).

Подобная ситуация для позиционных игр с полной информацией типична — в только что рассмотренном примере содержится идея доказательства следующей теоремы.

ТЕОРЕМА. Любая позиционная игра с полной информацией эквива- лентна некоторой матричной игре, в которой существует седловая точ- ка в чистых стратегиях.

Эта теорема означает, в частности, существование оптимальных чистых стратегий в играх типа шахмат и шашек; такие оптимальные стратегии пока не известны, но лишь потому, что платежная матрица, к которой сводится, например, шахматная игра, очень велика по размеру, и ее анализ современным компьютерам пока не под силу, однако развитие технологии распределенных вычислений в интернете, по-видимому, в ближайшие десятилетия приведет к отысканию оптимальных шахматных стратегий.

Иное дело обстоит с позиционными играми с неполной информацией (к таким играм относятся, например, домино и большинство карточных игр). Рассмотрим конкретный пример.

ПРИМЕР 10.5.2 (ПОЗИЦИОННАЯ ИГРА «УГАДЫВАНИЕ МОНЕТЫ» С НЕПОЛНОЙ

ИНФОРМАЦИЕЙ). Требуется проанализировать игру «Угадывание монеты» как позиционную игру с неполной информацией.

Решение. Информационные множества игроков в таком случае закрашены серым на рис. 10.5.2.

Теперь мы получили позиционную игру с неполной информацией: второму игроку в момент его хода известно информационное множество, но неизвестна конкретная позиция из информационного множества, в которой он находится (левая или правая на рис. 10.5.2).

В этом случае первый игрок имеет две стратегии:

x11 = «спрятать1 руб.», x12 = «спрятать 5 руб.» ,

и поскольку второму игроку выбор первого неизвестен, у второго игрока есть две стратегии:

x12 = «назвать1 руб.»,

x22 = «назвать 5 руб.» .

302

 

 

I

 

спрятать 1 руб.

спрятать 5 руб.

 

 

II

II

 

назвать 1 руб.

назвать 5 руб.

 

 

 

назвать 1 руб.

назвать 5 руб.

–1, 1

3, –3

3, –3

–5, 5

Рис. 10.5.2. Дерево позиционной игры «Угадывание монеты» с неполной информацией

Матрица

 

−1

3

 

 

3

−5

выигрышей первого игрока в зависимости от выбора игроками своих стратегий была нами подробно исследована в параграфе 6.1: эта матрица не имеет седловой точки в чистых стратегиях, а оптимальные смешанные стратегии игроков таковы: p = (2 / 3, 1/ 3) , q = (2 / 3, 1/ 3) , при этом цена игры равна ν = 1/ 3 .

Применим теперь аппарат теории игр к исследованию конкуренции производителя коммерческого программного обеспечения с пиратами.

ПРИМЕР 10.5.3 (ИГРА «ПРОВЕРКА ЛЕГАЛЬНОСТИ ПРОГРАММНОГО ОБЕСПЕЧЕ-

НИЯ»). Производитель программного обеспечения продает лицензии на использование своей продукции. Пользователь имеет возможность приобрести лицензионную копию программного продукта (по цене c ден. ед.) или пиратскую (по цене d ден. ед.). При этом полезность, которую приносит использование нелицензионного программного обеспечения, в точности равна полезности от использования легальной копии, а себестоимость изготовления одной копии (и легальной, и пиратской) пренебрежимо мала по сравнению со всеми остальными величинами. Поскольку значительная часть пользователей пользуются нелицензионными копиями, производитель может предпринимать определенные меры по изобличению пользователей пиратских копий и привлечению их к ответственности. При этом он понесет определенные издержки по организации проверки легальности использования программного обеспечения (в размере l ден. ед. на проверку каждого пользователя), но если будет обнаружено незаконное использование программного продукта, пользователь заплатит в пользу производителя штраф (в размере f ден. ед.). Требуется проанализировать данную конфликтную ситуацию.

Решение. Очевидно, выполняются следующие соотношения:

f > l > c d > 0; f > c + l.

303

Будем считать также, что

l > 2c

(последнее неравенство эквивалентно тому, что c l < – c).

Данная конфликтная ситуация является типичной иллюстрацией а с и м м е т р и и и н ф о р м а ц и и, когда пользователь знает происхождение своего программного обеспечения (легальное оно или пиратское), а производитель (и государство) не может отличить «честного» пользователя от пользователя — пирата.

Рассмотрим позиционную форму игры и построим ее дерево (рис. 10.5.3). Первым игроком является пользователь, он осознанно принимает одно из двух решений: приобрести лицензионное или пиратское программное обеспечение.Производитель является вторым игроком, поскольку он может принять решение по инициации проверки только после того, как пользователь сделает свой ход.

 

 

I

 

использовать лицензионное

использовать нелицензионное

программное обеспечение

программное обеспечение

 

II

 

II

инициировать

не инициировать

 

проверку

проверку

 

 

 

 

инициировать

не инициировать

 

 

проверку

проверку

с, c l

c, c

d l, f l

–d, 0

Рис. 10.5.3. Дерево позиционной игры «Проверка легальности программного обеспечения»

Поскольку производитель в момент принятия решения не знает, в какой из двух точек зоны неопределенности он находится, данная конфликтная ситуация формализуется с помощью биматричной игры с матрицами выигрышей

 

c

c

,

c l

 

f d

 

 

 

d

 

f l

.

0

Строки соответствуют стратегиям первого игрока (пользователя):

использовать лицензионное программное обеспечение;

использовать нелицензионное программное обеспечение.

Столбцы соответствуют стратегиям второго игрока (производителя):

инициировать проверку лицензий на использование пользователем программного обеспечения;

не инициировать такую проверку.

304

Пусть

p = ( p; 1 − p) ,

q = (q; 1 − q)

смешанные стратегии игроков: пользователь с вероятностью p приобретает лицензионное программное обеспечение [и с вероятностью (1 – p) — нелицензионное], производитель с вероятностью q инициирует проверку лицензий [и с вероятностью (1 – q) не инициирует].

Множество возможных исходов игры в зависимости от выбора игроками смешанных стратегий представлено на рис. 10.5.4.

Максиминные выигрыши пользователя и производителя равны соответственно

α = max{−c; − d f } = −c ,

β = max{c l; 0} = 0 .

Множество Парето-оптимальных исходов — это ломаная ABC, а переговорное множество, отсекаемое от множества Парето максиминными выигрышами, — это выделенный жирным на рис. 10.5.4 отрезок

 

 

 

c(π + d )

 

 

 

 

 

 

 

 

 

 

BC =

π1; π2

= −

1

 

π1

[−c; − d ] .

c d

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение Нэша определяется максимумом функции Нэша:

 

max

N 1; π2 ) =

 

max

(1 −α)(π2 −β))=

 

 

 

 

 

1; π2 ) BC

 

 

1 ; π2 ) BC

 

 

 

 

 

 

 

 

 

 

 

 

c(π + d )

 

 

 

 

 

 

 

 

 

c(π + d )(π +c)

 

c(c d )

= max (π1

−(−c))

1

−0

 

 

=

max

1

1

 

=

 

,

c d

 

c d

4

π1 [−c; −d ]

 

 

 

 

 

 

π1 [−c; −d ]

 

 

 

 

который достигается при

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

π = −

c + d

,

π

 

=

c

 

,

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

1

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

что соответствует смешанным стратегиям игроков

 

 

 

 

 

 

pN =(1 / 2; 1 / 2),

qN =(0; 1) .

 

 

 

 

 

Итак, рациональный потребитель в половине случаев предпочтет использование нелицензионного программного обеспечения, а рациональному производителю никогда не выгодно инициировать проверку лицензий.

Если считать функции полезности и пользователя, и производителя строго возрастающими, принципиальных изменений в конфликтной ситуации не произойдет.

Таким образом, вне зависимости от склонности производителей и пользователей программного обеспечения к риску, рациональный пользо-

305

ватель только в половине случаев предпочтет приобрести лицензионное программное обеспечение, а рациональный производитель никогда не будет инициировать проверку легальности использования его продукта пользователями.

Так будет всегда, пока цена лицензии с будет больше цены пиратской копии d. В случае же, когда c = d, очевидно, пользователь предпочтет приобрести легальную копию, но при этом прибыль производителя существенно сократится (если не превратится в убытки).

π2

f

A

f – l

B

c

d

C π1

β = 0

 

–c

–d

0

 

 

 

 

–c

c – l

D

α== c

Рис. 10.5.4. Множество возможных исходов игры «Проверка легальности программного обеспечения»

306

КОНТРОЛЬНЫЕ ВОПРОСЫИ ЗАДАНИЯ

1.Как на практике организовать реализацию смешанных стратегий?

2.Каждый из двух игроков (первый и второй) могут показать «камень» (кулак), «ножницы» (указательный и средний пальцы) или «бумагу» (ладонь). Камень тупит ножницы (и поэтому камень выигрывает у ножниц 1 руб.), ножницы режут бумагу (и поэтому ножницы выигрывают у бумаги 1 руб.), а бумага заворачивает камень (и поэтому бумага выигрывает у камня 1 руб.). Все остальные случаи приводят к ничье. Каковы оптимальные стратегии игроков?

3.Для матричных игр, заданных своими платежными матрицами, найдите нижнюю и верхнюю цену, и сравните выигрыш первого игрока при оптимальной стратегии и при максиминной стратегии:

 

 

 

а) 4

5 0 3 2

;

 

 

 

 

 

 

 

3

1

 

2

−2 7

 

 

 

 

 

 

 

0

−1 0 2

3

 

 

 

1

3

−2

1

 

 

 

 

−1

 

 

 

 

б)

 

−1 2 −1 1

0

 

;

в)

1

1

4

.

 

 

 

 

 

 

 

 

4

1

1

−3

 

 

 

 

−2 −1 −2

 

 

 

 

1

0

 

 

 

 

−2

5

1

 

 

 

 

 

 

 

 

1

 

4.Докажите, что если первый игрок будет играть в соответствии со своей оптимальной смешанной стратегией, а второй игрок выберет свою j-ю чистую стратегию (при условии, что j-я компонента вектора оптимальной смешанной стратегии второго игрока строго больше нуля), то математическое ожидание выигрыша первого игрока будет равным цене игры.

5.Производитель премиальных кондитерских изделий ежедневно изготавливает и продает от одного до трех эксклюзивных тортов. Срок годности торта ограничен: если торт не продан за один день,

его приходится утилизировать (стоимость утилизации — 500 руб.). Если спрос на торты превышает их фактически произведенное количество, недостающие торты обязательно нужно произвести, но это придется делать в сверхурочное время. При нормальном производственном цикле себестоимость одного торта составляет 5000 руб., при сверхурочной работе — 7000 руб. Все торты реализуются по цене в 10 000 руб. Вероятности того, что дневной спрос составит 1, 2 и 3 торта, равны соответственно 0,4, 0,5 и 0,1 Составьте матрицу последствий и матрицу сожалений, определите решения по критериям Вальда, Сэвиджа, максимального ожидаемого дохода и минимальных ожидаемых сожалений.

6.Две фирмы продают конкурирующие товары. Каждая из фирм должна решить, имеет ли смысл устраивать рекламную компанию. Если обе фирмы решат рекламировать свои товары, то первая фир-

307

ма получит чистую прибыль в размере 10 млн. руб., а вторая фирма

в размере 6 млн. руб. Если первая фирма будет рекламировать свой товар, а вторая не будет, то первая фирма получит прибыль 15 млн. руб., а прибыль второй фирмы окажется равной нулю. Если первая фирма не будет проводить рекламную компанию, а вторая

будет, то прибыль первой фирмы будет равна 5 млн. руб., а прибыль второй фирмы — 8 млн. руб. Если же обе фирмы откажутся от проведения рекламной компании, то первая фирма получит при-

быль 10 млн. руб., а вторая — 2 млн. руб. Каковы оптимальные стратегии фирм?

7.Два производителя продают на рынке один товар. Каждый из них может назначить цену товара: 400 руб. или 600 руб. Если оба производителя назначили цену 400 руб., то каждый из них получает чистую прибыль 12 млн. руб. Если оба производителя назначили цену 600 руб., то каждый из них получает чистую прибыль 16 млн. руб. Если же один назначил цену 400 руб., а другой 600 руб., то тот производитель, который назначил меньшую цену, получает прибыль 20 млн. руб., а его конкурент получает прибыль 4 млн. руб. Как должны выбирать свои стратегии игроки в зависимости от того, разрешаются или запрещаются соглашения между ними?

8.Покупатель (второй игрок) приходит на рынок за яблоками. Продавец (первый игрок) использует пружинные весы и имеет две стратегии: честно взвесить 1 кг яблок или подкрутить пружину и обвесить покупателя на 200 г. У покупателя также две стратегии: поверить продавцу или взвесить покупку на контрольных весах и в случае обмана потребовать возмещения ущерба. Предложите свой вариант матриц выигрышей и определите наиболее рациональное поведение игроков. Рассмотрите как ситуацию, в которой покупатель не способен заметить, обвешивает ли его продавец, так и ситуацию, в которой покупатель видит, честно ли ведет себя продавец.

9.В настоящее время некоторый товар на рынке продается единственным монополистом (первым игроком) по цене 100 руб. Емкость рынка составляет 1 млн. единиц товара. На этот рынок с аналогичным товаром хочет войти другая фирма (второй игрок). Для входа в отрасль вторая фирма должна произвести инвестиции в строительство завода в размере 40 млн. руб. Если вторая фирма не будет входить на рынок, то первая фирма может продолжать продавать товар по 100 руб., и тогда ее выручка составит 100 млн. руб. (а прибыль второй фирмы будет нулевой). Если же вторая фирма войдет на рынок, и при этом цена товара останется на прежнем уровне (100 руб.), то каждая из двух фирм получит по 50 млн. руб. выручки, но выигрыш второй фирмы составит 10 млн. руб. (из выручки мы вычли инвестиции в строительство завода). Первая фирма может (для защиты от входа на рынок) понизить цену до 60 руб. Если в этом случае конкурент все-таки выйдет на рынок, то выручка каждой из фирм будет равна 30 млн. руб., при этом вторая фирма проиграет 10 млн. руб. (с учетом инвестиций в строительство заво-

308

да). Если же первая фирма установит низкую цену (60 руб.), а вторая фирма не войдет на рынок, то прибыль первой фирмы будет равна 60 млн. руб. Каковы оптимальные стратегии фирм?

10.Две фирмы выпустили к Дню 8 марта новые конфеты. Каждая из двух фирм позиционирует свои конфеты как самый лучший подарок к женскому празднику, при этом фирмы имеют возможность рекламировать свои товары в дневных или в вечерних телепередачах. Если обе фирмы будут рекламировать свой товар как самый лучший одновременно — в дневной (или вечерней) телепередаче, то покупатели усмотрят в этом противоречие и не станут покупать ни один, ни другой сорт конфет (выигрыши обеих фирм при этом будут равны нулю, как и в том случае, когда фирмы вовсе не будут рекламировать свои товары). Если одна фирма выступит с рекламным объявлением днем (вечером), а другая фирма в это время выступать не будет, то первая фирма привлечет столько покупателей, что ее выигрыш можно будет оценить единицей (соответственно двумя единицами). Каковы оптимальные стратегии игроков?

11.Докажите, что бесшумная дуэль не имеет седловой точки в чистых стратегиях.

12.Хорошенькая девушка Маша может прийти на дискотеку (которая продолжается четыре часа) в момент времени t [0, 4]. Каждый из двух ее воздыхателей — Коля и Миша — приходит на дискотеку только один раз в этот вечер. Если в момент прихода одного из игроков Маша находится на дискотеке одна, то она весь вечер танцует с этим игроком (и этот игрок выигрывает у своего противника единицу). Если же в момент прихода кого-либо из воздыхателей Маши на дискотеке нет, или она уже танцует с «конкурентом», поклонник уходит и больше в этот вечер на дискотеку не возвращается. Если ни один из игроков не танцевал с Машей, то выигрыш каждого из них равен нулю. Каковы оптимальные стратегии игроков?

13.Правила игры таковы. Имеется круглый стол и бесконечно много одинаковых круглых монет. Первый и второй игроки по очереди кладут на стол по одной монете (монета должна целиком лежать на столе и не накладываться на другие монеты). Выигрывает тот, кто положит на стол последнюю монету. Каковы оптимальные стратегии игроков?

14.На аукцион выставляется 1000 руб. Два участника игры по очереди

называют сумму, которую они готовы

отдать

за получение

1000 руб. в обмен на предложенную

цену.

Предложивший

наибольшую заявку получает 1000 руб. в обмен на предложенную цену, а сделавший вторую по величине заявку должен отдать предложенную им сумму и не получить взамен ничего. Каковы оптимальные стратегии игроков?

15.Ведущий телешоу предлагает участнику показать на одну из трех закрытых дверей, за которыми находятся «Мерседес» и два козла. После этого ведущий открывает одну из невыбранных дверей, за которой находится козел, и вторично предлагает участнику открыть

309

одну из оставшихся дверей. Если за этой дверью окажется «Мерседес», то он достается участнику в качестве приза, а если за дверью стоит козел, то участник ничего не получает. Каковы оптимальные стратегии ведущего и участника телешоу?

16.Игра продолжается N периодов. Первый игрок (нарушитель) хочет совершить в одном и этих периодов некоторое запрещенное действие, а второй игрок (инспектор), который желает это действие предотвратить, может провести в одном из N периодов проверку нарушителя. Выигрыш нарушителя в каждом периоде равен 1, если он провел запрещенное действие, а инспектор в этом периоде проверку не проводил, выигрыш равен –1, если инспектор поймал нарушителя, выигрыш равен нулю, если нарушитель не действует вовсе. Каковы оптимальные стратегии игроков?

17.Убедитесь в том, что в игре «Работодатель — работник», рассмотренной в параграфе 10.4, решение Нэша соответствует точке, в которой работодатель и работник делят прибыль поровну — по 500 тыс. руб.

310