Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции мисис-15.doc
Скачиваний:
60
Добавлен:
23.03.2016
Размер:
1.42 Mб
Скачать

1. Наличие двух игроков а и в, с противоположными целями. Поэтому игру и называют антагонистической.

2. Наличие у каждого игрока конечного числа ходов, называемых также чистыми стратегиями. Каждый игрок знает чистые стратегии соперника, но не знает какую чистую стратегию тот применит.

3. Игроки независимо выбирают чистые стратегии (ходы), после чего игра (партия) заканчивается и каждому игроку выплачивается выигрыш, причем сумма выигрышей равна нулю.

4. Все возможные выигрыши аij игрока а сосредоточены в платежной матрице:

Почему нет матрицы игрока В?

Номера строк матрицы отождествляются с чистыми стратегиями игрока А, а номера столбцов – с чистыми стратегиями игрока В.

Как же должны действовать игроки?

Рассмотрим пример платежной матрицы:

Если игрок А выберет 1-й ход, то в наихудшем для него случае игрок В сделает 3-й ход. Если игрок А сделает 2-й ход, то игрок В ответит 1-м ходом и т.д. Предвидя подобное, игрок А будет стремиться максимизировать минимальный выигрыш (получить, хотя бы что-то). Т.е. выбирать чистую стратегию из условия: maxi (minj ai j ) (практически - в каждой строке матрицы ищется минимум и из них выбирается максимум).

Обозначим α = maxi (minj ai j ) и назовем нижней ценой игры. Нижняя цена, очевидно, гарантирует игроку А выигрыш не меньший α.

Встанем на точку зрения игрока В. Рассуждая аналогично, он будет выбирать стратегию из условия

minj (maxi ai j) .

Обозначим β = minj (maxi ai j) и назовем верхней ценой игры.

(практически - в каждом столбце матрицы ищется максимум и из них выбирается минимум).

Верхняя цена гарантирует игроку В, таким образом, проигрыш не больший β .

Заметим, что в нашем примере α = β = 4. Подобную игру называют игрой с седловой точкой (она выделена красным в платежной матрице). Общее значение α и β называется ценой игры v.

Стратегии, соответствующие седловой точке (3-я для А и 2-я для В) и будут оптимальными- они выгодны для обеих сторон. Почему?

В самом деле, если игрок А отклонится от оптимальной стратегии, выбрав, например 4-й ход, игрок В ответит ему 3-м ходом, уменьшив выигрыш А до 2 и т.д.

Пара оптимальных чистых стратегий (3, 2) или, как говорят, ситуация (3,2) является, таким образом, как бы равновесной парой (на языке теории игр - равновесие по Нэшу)- игрокам не выгодно отклоняться от своих оптимальных чистых стратегий, они достигают некоторого компромисса.

Экономический пример [4].

Рассматривается игра двух игроков: А - налоговая инспекция и В - налогоплательщик.

У игрока В три стратегии - честно заявить о своем доходе 180000 руб., приуменьшить истинный доход, заявив 90000 руб., скрыть доход.

У игрока А две стратегии: первая- контролировать налогоплательщика и

- если доход указан честно взимать налог 13%

- если заявленный доход приуменьшен, то

взимать налог 13% со скрытой суммы, а также штраф 10% (с заявленной суммы)

- если доход, вообще, сокрыт, то взимать взимать налог 13% со скрытой суммы и штраф 10% со скрытой суммы).

Вторая стратегия - не контролировать доход налогоплательщика, полагаясь на его честность.

Составим платежную матрицу (таблицу):

В

А

1

2

3

α

1

23400

32400

41400

23400

2

23400

11700

0

0

β

23400

32400

41400

23400

Пояснение:

23400= 180000*0,13

32400= 180000*0,13 + 90000*0,1

41400= 180000*0,13 + (берется штраф 10% с истинного дохода)18000

11700=90000*0,13

α= 23400, β= 23400 – игра с седловой точкой (1,1), цена игры v=23400.

Вывод: налоговая инспекция гарантирует себе доход не меньший 23400, если она будет контролировать налогоплательщика, а налогоплательщик потеряет не больше 23400, если он будет честно декларировать свои доходы.

Экономический пример [4].

Рассматривается игра двух конкурирующих компаний: А и В. У компании В три чистых стратегии: получение инвестиций от одного из трех инвесторов В1, В2, В3. У компании А (ее цель- занять место компании В в инвестировании) две чистых стратегии: предложить инвесторам более выгодные условия по сравнению с компанией В и предоставить материалы, компрометирующие компанию В.

Стратегия 1 компании А приведет к положительному результату (т.е. к нарушению переговоров компании В с возможными инвесторами) с вероятностями 0,7, 0,5, 0,3, соответственно. Для стратегии 2 эти вероятности 0,6, 0,9, 0,4.

Составим платежную матрицу (таблицу):

1

2

3

α

1

0,7

0,5

0,3

0,3

2

0,6

0,9

0,4

0,4

β

0,7

0,9

0,4

α= 0,4, β= 0,4 – игра с седловой точкой (2,3), цена игры v=0,4.

Вывод: оптимальной чистой стратегией игрока А является предоставление компрометирующих материалов и тогда вероятность успеха компании А будет не меньше 0,4. Оптимальная чистая стратегия игрока В - ведение переговоров только с инвестором В3 и тогда вероятность неудачи будет не больше 0,4.

Замечание: наличие в игре седловой точки и, стало быть, цены - далеко не правило, скорее исключение. Многие игры нельзя решить в чистых стратегиях

(α # β)- нет седловой точки! Однако существует метод, который позволяет для всякой матричной игры с нулевой суммой обеспечить наличие оптимальных стратегий в некотором обобщенном смысле. Этот метод был предложен основателями теории игр математиком Джоном фон Нейманом и экономистом Оскаром Моргенштерном еще в 1944 году.

Понятие смешанной стратегии. Графический метод решения игры.

Пусть платежная матрица игры с нулевой суммой, причем α # β.

Рассмотрим игру двух лиц с нулевой суммой:

α = -1, β=1 → седловой точки нет!

Итак, гарантированный выигрыш игрока А составит -1. Можно ли его повысить?

Фон Нейман предложил выбирать ходы (чистые стратегии) случайным образом с определенными вероятностями. Набор этих вероятностей он назвал смешанной стратегией игрока ( разумеется сумма вероятностей равна 1). Нахождение этих вероятностей и является решением игры.

Итак, смешанная стратегия игрока А это вектор

P = (p1,p2,….pm), . Аналогично, смешанная стратегия игрока В это вектор Q = (q1,q2,….qn), .

Очевидно, выигрыш игрока А является случайной величиной, значение которой составит аij .

Основная же вероятностная характеристика случайной величины (как известно из теории вероятностей)– математическое ожидание (среднее).

Итак, средний выигрыш игрока А это математическое ожидание выигрыша при условии, что игроки применяют свои смешанный стратегии Р и Q (вспомним математическое ожидание системы случайных величин в теории вероятностей):

H(P,Q) = .

Назовем H (P,Q) выигрыш - функцией.

Пусть в нашем примере смешанная стратегия игрока А:

Р = (1/2, 1/2). Тогда, если, например, второй игрок В выберет смешанную стратегию Q=(1,0), то платежная матрица примет вид:

Q

1

0

1/2

1

-1

1/2

-1

1

математическое ожидание выигрыша игрока А: H(P,Q) = 1* (1/2) + (-1)*(1/2) = 0 → все же лучше, чем -1 Итак, случайность выбора ходов повышает шансы игрока на успех (увеличивает выигрыш!), хотя бы в среднем.

Смешанные стратегии в теории игр представляют собой модель изменчивой, гибкой тактики, когда ни один из игроков не знает, как поведет себя противник в данной партии. Такая тактика (без всяких математических обоснований), кстати, часто применяется в карточных играх.

Ясно, что каждая чистая стратегия может рассматриваться как смешанная стратегия, у которой одна из координат (вероятность) равна 1, а остальные равны 0.

Рассмотрим еще примеры:

1. Пусть дана платежная матрица и смешанные стратегии Р0=(3/8, 5/8), Q0=(1/4,0,3/4)

Q

1/4

0

3/4

3/8

0

1/2

5/6

5/8

1

3/4

1/2

H (P0,Q0) =