Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Прикладная математика. Курсовик. Вариант 10.doc
Скачиваний:
17
Добавлен:
16.12.2013
Размер:
526.34 Кб
Скачать

Матричные игры с нулевой суммой

11.3.Нижняя и верхняя цены игры, седловая точка

Для матрицы найдём нижнюю цену игры l=max{min{a[i,j]:j}:i} и

верхнюю цену игры U=min{max{a[i,j]:i}:j} .

82 73 10 55 46 37 28 19 10 1 │

73 64 9 46 37 28 19 10 1 92│ Седловая точка

57 55 46 52 50 48 47 58 56 55│

55 46 8 28 19 10 1 92 83 74│

46 37 7 19 10 1 92 83 74 65│

37 28 6 10 1 92 83 74 65 56│

28 19 5 1 92 83 74 65 56 47│

19 10 5 92 83 74 65 56 47 38│

10 1 4 83 74 65 56 47 38 29│

1 92 3 74 65 56 47 38 29 20│

Эти величины совпадают если и только если матрица имеет седловую точку. Так называется элемент, являющийся минимальным в своей строке и максимальным в своем столбце. Цена игры лежит между нижней и верхней ценами игры. Игроки имеют оптимальные чистые стратегии если и только если матрица имеет седловую точку - в этом случае оптимальной

стратегией 1-го игрока является неизменный выбор строки с седловой точкой,

для 2-го игрока - неизменный выбор столбца с седловой точкой.

36 38 38 38 38 37 37 37 37 37│ 36

0 72 40 8 76 44 12 80 48 16│ 0 Седловая точка

0 40 8 76 44 12 80 48 16 84│ 0

1 8 76 44 12 80 48 16 84 52│ 1 a[1,1]=36

1 76 44 12 80 48 16 84 52 20│ 1

0 44 12 80 48 16 84 52 20 88│ 0

0 12 80 48 16 84 52 20 88 56│ 0

0 80 48 16 84 52 20 88 56 24│ 0

1 48 16 84 52 20 88 56 24 92│ 1

1 16 84 52 20 88 56 24 92 60│ 1

36 80 84 84 84 88 88 88 92 92

11.4.Аналитическое решение игр 2х2

Решение игр 2х2 можно найти по формулам. Пусть {a[i,j]} - матрица игры 2х2 .

Если седловая точка в матрице есть, то решение игры ясно - в этом случае оп-

тимальной стратегией 1-го игрока является неизменный выбор строки с седловой

точкой, для 2-го игрока - неизменный выбор столбца с седловой точкой. Поэтому

предположим, что седловой точки нет. Обозначим a=a[1,1]-a[1,2]-a[2,1]+a[2,2],

b=a[2,2]-a[1,2]), c=a[2,2]-a[2,1] и d=a[2,2] . Пусть (x,1-x), (y,1-y) -

оптимальные стратегии 1-го и 2-го игроков и v - цена игры, тогда x=c/a,

y=b/a и v=d-cb/a . Зададим матрицу игры 2х2. Элементы матрицы игры - не более чем двузначные целые положительные или отрицательные числа. (Поясним, как выводятся вышеуказанные формулы. Математическое ожидание выигрыша 1-го игрока есть

M[x,y]=x*y*a[1,1]+(1-x)*y*a[2,1]+x*(1-y)*a[1,2]+(1-x)*(1-y)*a[2,2]. После

перемножения и приведения подобных членов это выражение записывают в виде:

M[x,y]=a*(x-c/a)(y-b/a)+(d-cb/a) , где a,b,c,d - указанные выше числа.

Теперь уже ясно, что оптимальные стратегии игроков есть (c/a,1-c/a),

(b/a,1-b/a) и (d-cb/a) -цена игры).

Оптимальные стратегии игроков

I II Цена игры

матрица 2 3 5/6 (2/6;4/6) 2.67

игры +-xx 6 1 1/6

 a = 2-3-6+1= -6    b =1-3= -2    c=1-6= -5      d= 1

11.5.Оптимальное решение - максимин=минимакс

Основная теорема матричных игр утверждает, что для любой матричной игры

max{min M[P,Q]:Q}:P}=min{max{M[P,Q]:P}:Q}, т.е. во множестве смешанных

стратегий есть седловая точка, дающая оптимальное решение игры ( M[P,Q] -

есть средний выигрыш 1-го игрока при игре игроков со стратегиями P,Q соответственно) . Поэтому, если найти стратегию P*, на которой достигается

максимум величины l(P)=min{M[P,Q]:Q} , то P* есть оптимальная стратегия 1-го.

Для игр 2х2 это сделаем так: переберем с малым шагом значения x от 0 до 1,

при каждом x находя l(x)=min{M[x,y]:0<=y<=1} : затем найдем x*, при кото-

ром l(x) максимально; это максимальное значение есть приближенно цена игры,

(x*;1-x*) есть приближенно оптимальная стратегия 1-го игрока; затем можно

найти приближенно оптимальную стратегию 2-го игрока. Максимум l(x) находим в

в два этапа: сначала с крупным шагом 0.1, затем с мелким шагом 0.01 .

Пример: Пусть задана матрица 5 1 4 2  шаг-0.1 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

l(x) 2.0 1.9 1.8 1.7 1.6 1.5 1.4 1.3 1.2 1.1 1.0

шаг-01 0.00 0.05

l(x) 2.00 1.99 1.98 1.97 1.96 1.95

матрица 5 1 0.00;

игры 4 2 1.00 (0.25;0.75) 2.00

I II Цена игры

11.6.Метод Брауна-Робинсона нахождения решения игры

Оптимальные стратегии игроков и цену игры можно найти приближенно методом

Брауна-Робинсона. Предположим, что 1-й играет со стратегией P. Если 2-й

выберет j-й столбец, то его средний проигрыш будет

M[P,j]=a[1,j]*p[1]+...+a[n,j]*p[n], значит 2-й должен выбрать столбец j,

на котором величина M[P,j] минимальна. Аналогично пусть действует 1-й .

Предположим, что они уже сыграли n партий, тогда за их стратегии P,Q

принимают вектора частот выборов строк и столбцов. Очередные ходы должны

быть наилучшими ответами на эти стратегии. Зададим матрицу 3х3, элементами

которой являются числа от -9 до 9 и понаблюдаем за стабилизацией стратегий

и цены игры. Стабилизация происходит весьма медленно: для стабилизации 2-го

знака после запятой может потребоваться десятки тысяч партий, 3-го знака-

сотни тысяч. Этим методом цену игры всегда можно определить, но стабилизации

стратегий может не быть в некоторых специально сконструированных играх.

Число сыгранных партий

матрица -7 -5 -4 0.00 723300

-2 3 6 0.27

игры 5 4 2 0.73 0.36;0.00;0.64 3.092

I II

Стратегии игроков цена игры

11.7.Игра со спичками

Спички разложены в 5 групп. Игроки - Человек и компьютер по очереди берут спички. Можно брать только из одной группы и обязательно любое ненулевое количество спичек. Кто берет спички самый первый раз называется 1-м игроком, другой - 2-м игроком. Кто берет спички последним, тот и победитель.