- •Лабораторная работа 4
- •1.1. Нижняя и верхняя цены игры. Принцип минимакса
- •1.2 Вполне определенные игры (игры с седловой точкой)
- •2. Доминирующие и доминируемые стратегии
- •3 Игры, не содержащие седловой точки. Смешанные стратегии
- •4. Решение игры 2х2 в смешанных стратегиях аналитическим методом
- •4. Решение игры 2х2 в смешанных стратегиях графическим методом
- •Литература
4. Решение игры 2х2 в смешанных стратегиях графическим методом
Пример 4. Решить графически игру, заданную платежной матрицей
Н =
.
Решение.
1. Доминирующих строк и столбцов нет.
2. Так как размерность матрицы 2 х 2 задача может быть решена графическим методом.
Решение. Откладываем единичный отрезок (0,1) и проводим оси 1 и 2 (рисунок 3).
1
2
а11= 1,5
а21= 2
S1
S1”
а12= 3
S2
S2”
а22
= 1
V
N
х
0
R1
R2
1
R1
М
p2
p1
Рисунок 3 – Графическая интерпретация игры 2 х 2 в смешанных стратегиях
(для игрока А)
На оси 1 откладываем отрезок a11 = 1,5 (точка S1), соответствующий стратегии В1 и отрезок а12 = 3 (точка S2), соответствующий стратегии В2.
На оси 2 откладываем отрезок a21 = 2 (точка S2), соответствующий стратегии В1 и отрезок а12 = 3 (точка S2), соответствующий стратегии В2.
Точка N - точка пересечения прямых (S1 – S1”) (S2-S2”). Ее абсцисса определяет значение вероятности p2 (отрезок, отложенный от точки 0). Вероятность p1 = 1 - p2 . Ордината точки N – определяет цену игры V .
Если график построен в масштабе, то значения p1, p2 и V могут быть получены непосредственно измерениями на графике.
Эта же задача (задача измерения) может быть решена аналитически.
Уравнение прямой (S1-S1”), походящей через точки S1 = (0;1,5) и S1” = (1;2), записывается в виде
.
В данном уравнении координата х – откладывается по оси абсцисс, а координата y – по оси ординат (оси 1).
Преобразовав это уравнение, получим
.
Уравнение прямой (S2-S2”), походящей через точки S2 = (0;3) и S2” = (1;1), записывается в виде
.
Преобразовав это уравнение, получим
.
Координаты точки N получим путем решения системы уравнений
.
Результат решения
x = 0.6; y = 1,8, т.е. N ( 0,6; 1,8).
Из анализа рисунка 3 следует, что p1* = 0,6; p2*= 1 – 0,6 = 0,4; V = 1,8 .
Это и есть решение игры в смешанных стратегиях.
Интерпретация результатов. Таким образом, игрок А должен чередовать стратегии R1 и R2 так. чтобы их частость составила : для стратегии R1 – 0,6, для стратегии R2 – 0,4, т.е., если игра повторяется 10 раз, то игрок А должен 6 раз использовать стратегию R1 и 4 раза - стратегию R2. При этом игрок А в среднем получит выигрыш равный цене игры, т.е V = 1,8 .
Графически решение может быть получено и для игрока В. Для этого необходимо поменять местами игрока А и В, и вместо максимума нижней границы в соответствии с принципом минимакса рассмотреть минимум верхней границы (рисунок 4).
На оси 1 откладываем отрезок a11 = 1,5 (точка R1), соответствующий стратегии R1 и отрезок а21 = 2 (точка R2), соответствующий стратегии R2.
На оси 2 откладываем отрезок a22 = 1 (точка R2”), соответствующий стратегии S2 и отрезок а12 = 3 (точка R1”), соответствующий стратегии A1.
Точка N - точка пересечения прямых (R1 – R1”) и (R2-R2”). Ее абсцисса определяет значение вероятности q1 (отрезок, отложенный от точки 0). Вероятность q2 = 1 - q1 . Ордината точки N – определяет цену игры V .
Если график построен в масштабе, то значения q1, q2 и V могут быть получены непосредственно измерениями на графике.
Эта же задача (задача измерения) может быть решена аналитически.
Уравнение прямой (S1-S1”), походящей через точки R1 = (0;1,5) и R1” = (1;3), записывается в виде
.
В данном уравнении координата х – откладывается по оси абсцисс, а координата y – по оси ординат (оси 1).
Преобразовав это уравнение, получим
.
Уравнение прямой (R2-R2”), походящей через точки R2 = (0;2) и R2” = (1;1), записывается в виде
.
Преобразовав это уравнение, получим
.
Координаты точки N получим путем решения системы уравнений
.
Результат решения
x = 0.2; y = 1,8, т.е. N ( 0,2; 1,8).
Из анализа рисунка 3 следует, что q2* = 0,2; q1*= 1 – 0,2 = 0,8; V = 1,8 .
Это и есть решение игры в смешанных стратегиях.
Интерпретация результатов. Таким образом, игрок B должен чередовать стратегии S1 и S2 так. чтобы их частость составила: для стратегии S1 – 0,8, для стратегии S2 – 0,2, т.е., если игра повторяется 10 раз, то игрок B должен 8 раз использовать стратегию S1 и 2 раза - стратегию S2. При этом игрок B в среднем получит выигрыш равный цене игры, т.е V = 1,8 .
Если платежная матрица содержит отрицательные числа, то для упрощения решения задачи графическим методом, целесообразно предварительно перейти к новой матрице (преобразовать матрицу) так, чтобы все элементы матрицы были бы положительными. Для этого необходимо ко всем элементам матрицы добавить одно и тоже соответствующее положительное число С. Решение игры при этом не изменится, но из полученного значения цены игры V необходимо вычесть добавленное число С.
1
2
а11= 1,5
а12= 3
R1
R1”
а21= 2
R2
R2”
а22
= 1
V
N
N
х
0
R1
S2
1
S1
М
q2
q1
Рисунок 4 – Графическая интерпретация игры 2 х 2 в смешанных стратегиях
(для игрока В)
Практическая часть
Задание 3. В соответствии с таблицей 3 решить игру с заданной платежной матрицей графическим методом (за игрока А и за игрока В). Дать интерпретацию полученных результатов.
Таблица 3- Варианты заданий
№ по журналу |
1, 17 |
2,. 18 |
3, 19 |
4, 20 |
5, 21 |
6, 22 |
7, 23 |
8, 24 |
9, 25 |
10, 26 |
11, 27 |
12, 28 |
13, 29 |
14, 30 |
15, 31 |
Вариант |
15 |
14 |
13 |
12 |
11 |
10 |
9 |
8 |
7 |
6 |
5 |
4 |
3 |
2 |
1 |
Вариант 1. H = . Вариант 2. H =
Вариант 3. H = . Вариант 4. H = .
Вариант 5. H = . Вариант 6. H = .
Вариант 7. H = . Вариант 8. H = .
Вариант 9. H = Вариант 10. H = .
Вариант 11. H = . Вариант 12. H = .
Вариант 13. H = . Вариант 14. H = .
Вариант 15. H = .
Теоретическая часть
Сведение игры к задаче линейного программирования
Если игра имеет
размерность платежной матрицы m
x
n
и не имеет седловой точки (
)
, то ее решение аналитическим и графическим
методами становится невозможно. Одним
из путей решения такой задачи является
сведение ее к задаче линейного
программирования.
Предположим, что все m стратегий игрока А являются активными. Определим вероятности их применения в смешанной оптимальной стратегии. Обозначим эти вероятности через вектор Р = (p1,p2,…,pm) , цену игры через V.
Оптимальная смешанная стратегия игрока А определяется из условия, введенного нами в предыдущей лекции
. ( 3 )
Пусть
V
=
.
( 4
)
Поскольку при оптимальной стратегии средний выигрыш игрока А при любой стратегии игрока В , то справедлива система n неравенств:
(
5
)
. . . . . . . . . . . . . . . . . . . . . . . . . . .
или
. ( 6 )
Добавим к
ограничениям (5) стандартные
( 7 ) и получим задачу линейного
программирования
- целевая функция 3 линейна;
- системы ограничений (6) и (7) также линейны.
Для того чтобы можно было применить классический симплекс–метод или метод симплекс-таблиц преобразуем целевую функцию на максимум и введем новые неизвестные
;
; … ;
.
Чтобы исключить при таком преобразовании возможность деления на нуль, увеличим цену игры V на положительное число С. Для этого достаточно ко всем элементам матрицы игры aij одно и тоже положительное число, так, чтобы все эти элементы стали положительными. Следует отметить. что эта операция не меняет искомых оптимальных стратегий, т.к.
при том, что
,
.
Разделив левую и правую части неравенств ограничений (5) на V получим новую эквивалентную систему неравенств
(
8
)
. . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
( 9
)
В силу того, что
max
V
= min
, получаем задачу в новой математической
формулировке:
- целевая функция
→ max
( 10
)
- при ограничениях
.
( 11
)
Это общий подход к решению игры за игрока А.
Для игрока В оптимальная стратегия определяется из условия (предыдущая лекция)
( 12 )
при ограничении
. ( 13 )
Эта задача записывается как симметричная двойственная задача линейного программирования к задаче игрока А (10),(11) , т.е.:
максимизировать целевую функцию
(
14
)
при ограничениях
,
( 15
)
где
.
( 16
)
Пример 5. Игра задана матрицей
Н =
Требуется решить игру.
Решение.
1. Доминирующих строк и столбцов нет.
2. Вычисляем верхнюю α и нижнюю β цену игры:
α1 = -5 ; α1 = -2 ; α1 = -3 ; α = -2 ;
β1 = 4 ; β2 = 5 ; β3 = 2 ; β4 = 6 ; β = 2 .
Таким образом,
-
седловой точки нет и решение игры
необходимо вычислять в смешанных
стратегиях.
3. Матрица игры имеет размерность 3 х 4, поэтому применить аналитический и графический методы не представляется возможным и задачу необходимо решать методом сведения к задаче линейного программирования.
3.1 Так как нижняя цена игры – число отрицательное ( α = -2 ), то возможно, что значение цены игры V не будет положительным числом. Преобразуем исходную матрицу так, чтобы все ее элементы были бы положительными. Для этого добавим ко всем элементам матрицы число С не менее 2. Выберем, например, число С = 6. Тогда матрица игры примет вид
Н1
=
.
3.2 Решаем задачу за игрока В. С учетом (11), (12) получим задачу линейного программирования:
- максимизировать
целевую функцию
(игрок В имеет четыре стратегии ) ,
- при ограничениях
( по элемента
матрицы Н1)
.
3.3. Решение задачи линейного программирования методом симплекс – таблиц.
Результаты решения:
Lmax = 0,16; y1 = 0; ; y2 = 0; ; y3 = 0,12; ; y4 = 0,04 .
3.5 Решение игры:
;
Проверка
→ 0 + 0 0,75 + 0,25 = 1 .
4. Интерпретация результатов решения игры.
Игроку В не имеет смысла использовать стратегии S1и S2, т.к. q1 = q2 = 0.
Игрок В должен
случайно с относительными частотами
,
чередовать использование стратегий S3
и S4.
При этом ему обеспечен средний выигрыш
V
= 0,25 д.ед.
Оптимальные стратегии игрока А могут быть получены из решения двойственной задачи линейного программирования.
В настоящее время развитие теории игр вышло далеко за пределы рассмотренных методов, широко используются множественные коалиционные игры, дифференциальные игры и т.д.
Практическая часть
Задание 4. Решить игру. Дать интерпретацию полученных результатов.
Нечетные номера по журналу – задача 1, четные – задача 2.
Задача 1. Предприятие (игрок А) может выпускать три вида продукции А1,А2,А3 (стратегии игрока А) , получая при этом прибыль, зависящую от спроса, который может быть в одном их четырех состояний В1,В2,В3,В4 (стратегии игрока В). Спрос определяется потребителем (игрок В).
Величина прибыли предприятия при выпуске продукции Аi и состоянии спроса Bj задана таблицей 4.
Таблица 4 – Исходные данные к задаче 1.
|
В1 |
В2 |
В3 |
В4 |
А1 |
3 |
3 |
6 |
8 |
А2 |
9 |
10 |
4 |
2 |
А3 |
7 |
7 |
5 |
4 |
Требуется:
- за игрока А принять решение о выборе стратегии, обеспечивающей среднюю величину прибыли при любом состоянии спроса, считая его неопределенным;
- за игрока В принять решение о выборе стратегии, обеспечивающей оптимальный спрос при любой стратегии игрока А.
Задача 2. Магазин может завести в различных пропорциях товары трех типов А1,А2,А3 (стратегии игрока А). реализация товаров и прибыли магазина зависят от вида товара и величины спроса, который может принимать три состояния В1,В2,В3 и не прогнозируется.
Матрица игры задача таблицей 5.
Таблица 5 – Исходные данные к задача 2
|
В1 |
В2 |
В3 |
А1 |
20 |
15 |
10 |
А2 |
16 |
12 |
14 |
А3 |
13 |
18 |
15 |
- за игрока А принять решение о выборе стратегии, позволяющей максимизировать среднюю гарантированную прибыль;
- за игрока В принять решение о выборе стратегии, позволяющей минимизировать среднюю величину проигрыша.
Отчет должен содержать:
1) тему и цель лабораторной работы;
2) выполнение заданий: 1, 2, 3, 4 с выводами по каждой задаче.
