
Курсовики по прикладной математики / Вар 10 / Математика 3
.3.doc3.3.Матричная игра с нулевой суммой как модель сотрудничества и конкуренции двух участников.
Исходные данные:
1
2 – 4 0
–2 0 2 –3
Задание:
-
Решить матричную игру с данной матрицей графически; в общем случае оптимальные стратегии игроков будут содержать только две отличные от нуля вероятности.
-
Проанализировать данную матричную игру и найти риск игры.
-
Отметить, как в этой игре проявляется конкуренция между игроками и сотрудничество между ними.
Решение:
1. Рассмотрим графическое решение игры 2х4 с матрицей {a[i,j]}. Обозначим искомую оптимальную стратегию первого игрока Р*(х, 1–х) – это вектор-столбец, но для удобства записываем его в виде строки. Обозначим v(x,j) – средний выигрыш первого игрока в расчете на партию, когда первый использует стратегию (х, 1–х), а второй - j-ю чистую стратегию (j= 1,…,4). Возьмем на плоскости систему координат: по горизонтальной оси вправо откладываем х, по вертикальной оси – значения функций v(x,j). Функции v(x,j) линейные, значит, их графики – прямые линии I,II,III,IV.
4
3
2
II
1
I
0
1
-1
-2 M
-3 IV III
-4
Находим нижнюю огибающую семейств этих четырех прямых над отрезком 0,1. Находим самую высшую точку этой ломаной М, которая и дает решение игры. Эта точка есть пересечение v3 = -6х+2 и v4 = 3х –3 прямой. Найдем координаты
4
5
5/9
точки М(х0,):х0 = – — и v = — . Оптимальная стратегия первого игрока есть Р*= ,
3 9 4/9
цена игры есть v = -4/3. Найдем оптимальную стратегию второго игрока Q*. Берем III и IV прямые и обозначаем y, 1-y – вероятность выбора вторым игроком соответствующих столбцов.
0
0 y 1-y
x 1 2 – 4 0
1-x –2 0 2 –3
Получили с.в. ζ (х,у):
ζ (х,у): |
1 |
2 |
-4 |
0 |
-2 |
0 |
2 |
-3 |
х∙0 |
х∙0 |
х∙у |
х∙(1-у) |
(1-х) ∙0 |
(1-х) ∙0 |
(1-х) ∙у |
(1-х)(1-у) |
Найдем математическое ожидание этой с.в.:
M[x,y]= 0 + 0 + (-4)∙xy + 0 + 0 + 0 + 2y∙(1-x) + (-3)∙(1-x)(1-y) = -9xy + 3x + 5y –3 =
= -9(x-5/9)(y-1/3) – 4/3. Т.е. оптимальное решение второго игрока Q*= (0,0,1/3,2/3)
2. Найдем риск игры, который равен среднему квадратическому отклонению с.в. ζ (х,у), т.е. r = √D[ζ (х,у)]. Найдем дисперсию выигрыша первого игрока при оптимальных стратегиях:
D[ζ (х,у)]= 0 + 0 + (-4)2∙5/27 + 0 + 0 + 0 + 22∙4/27 + (-3)2∙8/27= 168/27≈6,2 , т.е. риск равен примерно 2,5.