
Теория игр
Теория игр — это раздел математики, исследующий модели конфликтных ситуаций - игры.
Всякая игра в теории игр обязательно включает в себя 3 элемента:
-Игроки (участники игры)
-Стратегии (Те возможные действия, которые эти игроки могут предпринять в игре)
-Выигрыш, который получат игроки в результате реализации своих стратегий
Выбор каждым из игроков своей стратегии вполне определяет ход и исход игры.
Ситуацией в игре назовем набор выбранных игроками стратегий.
1 — S1
2 — S2
n — Sn
S = (s1,s2,sN)
Для антагонистической игры, в которой интересы игроков строго противоположны, формально противоположность интересов выражается в том, что при переходе от некоторой ситуации s к ситуации s`, игрок 1 приобретает (или теряет) столько, сколько теряет (или приобретает) игрок 2.
H1(s) — H1(s`) = H2(s`) - H2(s)
Иначе это можно выразить, как постоянство суммы выигрышей игроков во всех ситуациях
H1(s) + H2(s) = H1(s`) + H2 (s`)
Постоянная сумма выигрышей игроков в этом классе игр в каждой из ситуаций равна 0.
Выигрыш первого игрока можно трактовать, как проигрыш его противника.
Иначе назовем эти игры — играми с нулевой суммой.
Игра антагонистическая.
Матрица выигрышей в антагонистической игре представлена для первого игрока. Здесь первый игрок «играет» по строкам (стоки матрицы являются стратегиями игрока 1).
Для данного класса игр — принцип оптимальности — принцип МИНИМАКСА.
Первый игрок хочет выиграть как можно больше, т. е. нн хочет максимизировать свою функцию выигрыша. Но второй игрок, т. к. это для него матрица проигрыша, стремиться
уменьшить это значение.
Первый игрок выберет ту строку матрицы, в которой минимальный элемент будет наибольшим. (первая строчка)
Для второго игрока эта игрока является матрицей проигрышей, значит он стремится проиграть как можно меньше. В этом случае он, играя по столбцам, выберет тот столбец, максимальный элемент которого будет самым маленьким) (второй)
В случае, если в матрице минимакс равен максимину, игра имеет решение в чистых стратегиях и эта точка называется СЕДЛОВОЙ точкой).
40 — ЗНАЧЕНИЕ ИГРЫ.
Вывод — первый игрок должен выбирать первую свою стратегию, второй — вторую. В этом случае — первый выиграет 40, и второй проиграет 40(или выиграет 60).
Вероятность может быть меньше 1 (но в сумме 1)
МАТРИЦА(24.09 — 1)
ПРИМЕР 24.09 — 2
Пусть имеется некоторое количество точек, причем некоторые пары точек соединены стрелками (некоторая сеть). Стратегия каждого из игроков состоит в назывании одной из точек. Если при этом называется одна и та же точка, или называются точки, не соединенный стрелками, то выигрыш каждого из игроков в игре равен 0. Если же называются точки, соединенные стрелкой - то 1 выигрывает тот игрок, который назвал точку, расположенную у острия стрелки.
Значение МАКСИМИНА — (4 строка)
Значение МИНИМАКСА — (4 столбец)
Седловая точка — 4,4 — седловая точка = 0.
Вывод: Игроки должны назвать 4ую точку, это позволит им не проиграть в любом случае.
Если матрица большая — ее лучше уменьшить. Например — есть матрица
МАТРИЦА 24.09. - 3.1
Исходя из того, что для первого игрока в матрице выигрышей он выберет ту стратегию, которая гарантирует ему больший выигрыш, то в данной матрице с использованием подхода доминирования стратегий, первая стратегия игрока 1 доминирует его 2ую стратегию.
Если стратегия первого игрока доминирует над его другой стратегией, то все значения в этой строке поэлементно больше значений другой строки
МАТРИЦА 24.09. - 3.2
Для второго игрока при доминирование стратегий значение доминирующего столбца будут поэлементно меньше значений доминируемого (стоки 5,4)
МАТРИЦА 24.09. - 3.3
ГРАФИК 24.09 -4
МАТРИЦА 24.09. - 5
Обозначим за p вероятность выбора первым игроком своей первой чистой стратегии, тогда вероятность выбора второй чистой стратегии 1-p.
Если второй игрок выберет свою первую чистую стратегию, то для него q = 40p+ 70(1-p), если вторую — 90p+20(1-p)
В силу того, что максимин и минимакс должны совпадать
40p+70-70p= 90p+20-20p
70+30p = 70p+20
100p-50
p=50%
В этом случае мы получили вероятность выбора своей первой чистой стратегии игроком 1. Подставив в выражение значение p — мы получим значение игры.
20+35=55
То же самое мы можем записать и для выбора стратегий вторым игроком.
40q+90(1-q) = 70q+20(1-q)
q=0,7
V = 55
Это значение функции выигрыша для первого игра (проигрыша для второго). Выгрыш второго =45
ЗАДАЧА НА ДОМ.
ВЫБРАТЬ КОМПАНИЮ ДЛЯ ИССЛЕДОВАНИЯ
МЕТОДИЧКИ: 1- теория (5 глав). 2 — практика (начало для выбора компании)
ЗАДАЧА -
(1 2 3
2 -2 3
0 1 -5)
Необходимо решить и выбрать (дать рекомендации) . Можно ли сократить, находим минмакс, если не совпадают — в смешенных стратегиях(p).
8.10.12
(1 2 3
2 -2 3)
(1 2
2 -2)
1 — максимин
2 — минимакс
Значение максимина и минимакса не совпадают. Это говорит о том, что в чистых стратегиях седловой точки нет.
Обозначим за P выпор первым игроком своей первой чистой стратегии. 1-P — вероятность выбора второй чистой стратегии.
1p+2(1-p) = 2p+(-2)(1-p)
p+2-2p=2p-2+2p
2-p=4p-2
5p=4
p=4/5=0,8
игроку 1 следует выбрать свою 1 чистую стратегию с вероятностью 80%.
V=4/5+2(1-4/5)
В этом случае выигрыша составит 1,2.
Если мы хотим для второго игрока рассчитать вероятность выбора своей стратегии, то также, но по столбцам.
(В СЛ РАЗ — ПОСТАНОВКА ЗАДАЧИ)
В смешенных стратегиях на своем примере задачу необходимо решить 3мя способами:
1.P и Q.См выше
2.Графическое решение
Графически можно решить матрицу размерности 2*N или N*2.В этом случае можно все изобразить на плоскости
РИС 8.10.1
Если 2ой игрок выбрал свою 1ую чистую стратегию (1 столбец). Если 1 -1 то значение игры = -5, если 2ую = 5
Если 2=2, 1,4
3.Прямое решение
Прямое решение применимо только для матриц размерностью 2*2.(стр 67). Значения на 71 стр. Расчет (p) ФОРМУЛЫ В МЕТОДЕ!!!!!!!!!!!!!
(-5 1
5 4)
p = 4-5/-5-1-5+4= -(1/7)
q = |-(3/7)|
V = 3(4/7)
ЗАДАЧА
(2 1
1 -2)
1 — maxmin
1 — minmax
ЗАДАЧА
(3 2 5
1 0 4
2 5 7)
(3 2 5
2 5 7)
(3 2
2 5)
maxmin — 2
minmax — 3
p =
3p + 2(1-p) = 2p + 5(1-p)
3p + 2 — 2p = 2p+ 5- 5p
p+2=-3p+5
4p=3
p=3/4
v=2,75
q = 3p+ 2(1-p) = 2p + 5(1-p)
q=3/4
V=2,75
ЗАДАЧА
(
22/10/12
Антагонистические игры. (в методичке — параграф 3)
Постановка задачи
Рассматриваем 2 компании, разрабатывающие и внедряющие програмные продукты. Компания Чайка внедряет бух-ие системы 2х конф-ия. Компания сокол — логистические системы в 2х конфигурациях.
Гр |
Предпочтение |
10% 1 |
СПО2,БПО2,СПО1,БПО1 |
20% 2 |
БПО2,СПО1,БПО1,СПО2 |
30% 3 |
СПО1,БПО1,СПО2,БПО2 |
40% 4 |
БПО1,СПО2,БПО2,СПО1 |
Иные порядки предпочтения для простоты задачи отсутствуют
\ |
БПО1 |
СПО1 |
БПО2 |
СПО2 |
БПО1 |
х |
40% |
70% |
90% |
СПО1 |
60% |
х |
30% |
50% |
БПО2 |
30% |
70% |
х |
20% |
СПО2 |
10% |
50% |
80% |
х |