Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория игр / Лекция 5 по теории игр 2 курса исправленная.ppt
Скачиваний:
22
Добавлен:
11.01.2019
Размер:
707.58 Кб
Скачать

Существование равновесий Нэша и смешанные стратегии

Игра «Совпадение монет»

Два игрока одновременно и независимо друг от друга кладут на стол по монете каждый, прикрывая свою монету рукой. По команде судьи они поднимают руки. Игрок 1 выигрывает, если монеты лежат по – разному, а игрок 2 выигрывает, если они лежат одинаково.

О Р

О -1,1 1,-1

Р

1,-1

-1,1

О Р

О

-1,1

1,-1

Р

1,-1

-1,1

Определение. Смешанная стратегия игрока i

– это вероятностная мера μi на множестве его чистых стратегий si. Если все множества стратегий конечны, μi(si) является

вероятностью выбора игроком i стратегии si:

i si 0,

i si 1

si Si

Определение. Смешанным расширением игры в нормальной

форме

 

 

 

 

 

G Si ,ui ,i N

 

называется игра

Gm Mi ,

ui ,i N

 

i | i si 0,

 

 

множество

где Mi

i si 1

 

 

si Si

 

 

 

смешанных стратегий игрока i;

s i si

i N

- вероятность выбора s при независимом выборе si;

ui s ui s

s S

- ожидаемый выигрыш в исходной игре, 1,..., n

i j , j i ,

i , i

Определение. РН в смешанных стратегиях μ* называют РН в смешанном расширении Gm:

ui i*, *i

ui i , *i ;

i Mi ,

i N

 

 

 

O

P

 

 

 

 

O

-1,1

1,-1

 

p

 

 

P

1,-1

-1,1

 

1-p

 

 

 

q

1-q

 

 

1 O p;

1 P 1 p;

2 O q;

2 P 1 q.

u1 O 1 q 1 1 q 1 2q

 

 

 

u1 P 1 q 1 1 q 2q 1

 

1

 

u1 O

u1 P :

p 1

1 2q 2q 1 q

 

 

 

 

 

 

2

 

u1 O

u1 P :

p 0

1 2q 2q 1 q

1

 

 

 

 

 

 

2

 

u1 O

u1 P : p 0,1

1 2q 2q

1 q 1

 

 

 

 

 

 

2

 

Функция отклика (наилучшего ответа) первого игрока на действия второго:

 

1,

q 1/ 2

R1

 

0,

q 1/ 2

q p

 

 

0,1 ,

q 1/ 2

 

 

u2 O 1 p 1 1 p 2 p 1 u2 P 1 p 1 1 p 1 2 p

 

 

 

2 O

 

 

2 P :

q 1

2 p 1 1 2 p p

1

u

u

 

 

 

 

 

 

 

 

 

 

 

2

 

 

2 O

 

2 P :

q 0

2 p 1 1 2 p p

1

u

u

 

 

 

 

 

 

 

 

 

 

 

2

 

 

2 O

 

2 P :

q 0,1

2 p 1 1 2 p p 1

u

u

 

 

 

 

 

 

 

 

 

 

 

2

Функция отклика (наилучшего ответа) второго игрока на действия первого:

 

1,

p 1/ 2

R2

 

0,

 

p 1/ 2

p q

 

 

 

0,1 ,

p 1/ 2

 

 

 

 

 

 

 

 

игрок 1

игрок 2

 

 

 

 

 

 

 

 

 

 

 

 

1

q

 

 

O 1

 

 

P 1 .

 

 

2

;

2

 

 

 

 

2

 

 

2

 

 

 

1

O 1

;

1 P 1 .

1/2

 

 

 

 

 

 

2

 

 

2

 

 

 

 

 

 

 

 

0

1/2

p

 

 

 

 

 

1