
- •Задача о наилучшем использовании ресурсов
- •Варианты решений
- •Двойственность для задач в канонической форме.
- •Постановка тз по критерию стоимости в матричной форме.
- •Правило 2.
- •Алгоритм решения тз методом потенциалов
- •Матричные игры (ми) с нулевой суммой
- •Пример «Игра в 3 пальца».
- •Чистые и смешанные стратегии и их свойства.
Пример «Игра в 3 пальца».
|
B1 |
B2 |
… |
Bj |
… |
Bm |
A1 |
a11 |
a12 |
… |
a1j |
… |
a1m |
A2 |
a21 |
a22 |
… |
a2j |
… |
a2m |
… |
… |
… |
… |
… |
… |
… |
Ai |
ai1 |
ai2 |
… |
aij |
… |
aim |
… |
… |
… |
… |
… |
… |
… |
An |
an1 |
an2 |
… |
anj |
… |
anm |
i
– количество пальцев игрока Р1,
j – количество пальцев игрока Р2.
Матрица построена для игрока Р1.
Элемент а23 = -5 означает проигрыш игрока Р1 в 5 единиц и выигрыш этих единиц игрока Р2.
В общем случае МИ задается прямоугольной матрицей размерности mxn. Номер строки матрицы соответствует номеру Ai – стратегии игрока P1; номер столбца соответствует Bj стратегии игрока Р2. Эта игра однозначно определяется следующей матрицей A=[aij]mxn, где aij - действительное число, которое представляет собой сумму выигрыша, уплачиваемую игроком Р2 игроку Р1, если Р1 выбирает стратегию, которая соответствует i-й строке, а Р2 выбирает стратегию j-го столбца. МИ записывают в виде таблицы, которая называется платежной матрицей.
Каждый игрок выбирает наиболее выгодную стратегию. Первый игрок всегда стремится выбрать стратегию с максимальным выигрышем, тогда второй игрок стремится выбрать стратегию с минимальным проигрышем.
Нижняя чистая цена игры – максимин – число, равное максимальному по j из минимальных по i.
= maxj(mini aij).
Верхняя чистая граница – минимакс – число, равное минимальному по j из максимальных по i.
= minj(maxi aij).
Стратегии игроков, соответственно называются минимаксными или максиминными.
Пример. Найти минимаксную и максиминную стратегии игроков в МИ.
|
В1 |
В2 |
В3 |
В4 |
I |
A1 |
2 |
-3 |
4 |
5 |
-3 |
A2 |
3 |
7 |
8 |
4 |
3 |
A3 |
5 |
1 |
3 |
7 |
1 |
A4 |
4 |
6 |
2 |
9 |
2 |
j |
5 |
7 |
8 |
9 |
|
= minj (maxi aij) = min j = 5.
Вывод. Какой бы выбор по столбцам ни сделал игрок В, выигрыш игрока А в худшем случае составит –3, 3, 1, 2. Игрок А выбирает стратегию с макс. выигрышем, = 3, т.е. выбирается стратегия А2. В худшем случае игрок В может проиграть 5, 7, 8, 9. Игрок В минимизирует свой проигрыш, поэтому он выбирает стратегию В1.