Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Інтел_системи 2 лаба / Лекция 9 / Теория игр_10.05.2013.pptx
Скачиваний:
13
Добавлен:
20.02.2016
Размер:
1.23 Mб
Скачать

Лекция 8. ТЕОРИЯ ИГР

Игры, повторяемые многократно. Смешанные стратегии.

Если партнеры играют только один раз, то игрокам целесообразно

придерживаться принципа минимакса, как в игре с седловой

точкой, так и в игре без седловой точки.

В случае многократного повторения игры с седловой точкой

игрокам

также целесообразно придерживаться принципа минимакса.

Если многократно повторяется игра без седловой точки, то постоянное использование минимаксных стратегий становится

невыгодным.

В игре без седловой точки элемент платежной матрицы

,

соответствующий минимаксной стратегии игрока A, не

зан быть

ми-нимальным в своей строке. Следовательно, игрок B, зная о том, что игрок A в следующей игре будет использовать минимаксную стратегию

, может выбрать стратегию, отвечающую минимальному элементу строки . В результате выигрыш игрока A уменьшится от величины

до величины α .

1

ТЕОРИЯ ИГР

Аналогично может поступить и игрок A, неожиданно применив против

.

игрока B стратегию, соответствующую максимальному элементу столбца

Доказано [Вентцель Е.С. Исследование операций: Задачи, принципы,

 

 

методология.

 

при многократно повторяемой игре

Учебное пособие- М.: Дрофа, 2004. ], что

без седловой точки игроку A, для

среднего выигрыша,

 

большего, чем α , следует чередовать свои стратегии

.

 

Игроку B

результата также целесообразно чередовать свои

 

стратегии

 

 

 

 

Для многократно повторяемых игр без седловой точки вводится следующее определение.

В играх, которые повторяются многократно, каждая из стратегий называется чистой стратегией.

Стратегия игрока A, обозначаемая

и состоящая в том, чтобы применять чистые стратегии

,

чередуя их по случайному закону с

, называется

смешанной

удовлетворяют соотношению

 

стратегией. Частоты

 

2

ТЕОРИЯ ИГР

Чистые и смешанные стратегии игрока B определяются аналогично.

Смешанные стратегии, избранные игроками, называются

оптимальными, если одностороннее отклонение любым игроком от своей оптимальной стратегии может изменить

средний выигрыш только в сторону, невыгодную для этого игрока.

Совокупность, состоящая из оптимальной стратегии

одного игрока

иоптимальной стратегии другого игрока, называется

решением игры.

Средний выигрыш V при применении обоими игроками

оптимальных стратегий называется ценой игры.

Стратегии, входящие с ненулевыми частотами в

оптимальную стратегию игрока, называются полезными. 3

ТЕОРИЯ ИГР

Нейманом была доказана основная теорема теории игр, утверждающая, что каждая игра имеет, по крайней мере,

одно решение, возможно, в области смешанных стратегий.

Поскольку чистые стратегии являются частными случаями смешанных стратегий, то из основной теоремы теории игр

можно получить

Следствие1. Любая игра имеет цену.

Следствие2. Цена игры удовлетворяет неравенству

Следствие3. Средний выигрыш остается равным цене

 

игры, если один

 

из игроков придерживается своей оптимальной

 

стратегии, а другой игрок применяет свои

 

полезные стратегии с любыми частотами.

4

ТЕОРИЯ ИГР

Аналитический метод решения игры типа 2 x 2

Рассмотрим игру без седловой точки типа 2 x 2 с платежной матрицей

и найдем оптимальную стратегию

игрока A.

Согласно следствию 3 из основной теоремы теории игр эта стратегия обеспечивает игроку A выигрыш, равный цене игры V, даже если игрок B не выходит за пределы своих полезных

стратегий.

В данной игре обе чистые стратегии игрока B являются полезными, поскольку в противном случае игра имела бы решение в области чистых стратегий, т.е. была бы игрой с седловой точкой.5

ТЕОРИЯ ИГР

Отсюда вытекает, что неизвестные удовлетворяют следующей

системе из трех линейных

решение которой имеет вид

Аналогичным образом можно найти оптимальную стратегию

игрока B. В этом случае неизвестные

удовлетворяют

системе урав-нений

6

ТЕОРИЯ ИГР

решение которой имеет вид

Теперь наша задача применить полученные формулы к игровым задачам, возникающим с проектированием программного обеспечения.

7

ТЕОРИЯ ИГР

Графический метод решения игр типа 2 n × и 2 m

×

Рассмотрим игру

матрицей

и проведем через точку (1; 0) координатной плоскости Oxy

прямую l, перпендикулярную оси абсцисс.

После этого для проведем прямую

соединяющую точку на оси Оу с точкой

на прямой l. Ось Оу отвечает за стратегию , а прямая l − за стратегию

8

ТЕОРИЯ ИГР

Графический метод решения игр типа 2 n × и 2 m ×

Если игрок А применяет смешанную стратегию

9

ТЕОРИЯ ИГР

то его выигрыш в случае, если противник применяет чистую стратегию равен

и этому выигрышу

с абсциссой

Ломаная

, отмеченная на чертеже жирной линией, позволяет

определить минимальный выигрыш игрока А при любом поведении

игрока В.

Точка N, в которой эта ломаная достигает максимума, определяет

решение и цену игры.

Ордината точки N равна цене игры V, а ее абсцисса

частоте

применения стратегии

в оптимальной смешанной стратегии игрока А.

Далее непосредственно по чертежу можно найти пару «полезных»

стратегий

игрока В, пересекающихся в точке N (если в точке N пересекается

более

любые две из них).

двух стратегий, то

Пусть это будут стратегии

 

10

Соседние файлы в папке Лекция 9