Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МОР_Ч2_ЛР4.doc
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
433.66 Кб
Скачать

4. Решение игры 2х2 в смешанных стратегиях графическим методом

Пример 4. Решить графически игру, заданную платежной матрицей

Н = .

Решение.

1. Доминирующих строк и столбцов нет.

2. Так как размерность матрицы 2 х 2 задача может быть решена графическим методом.

Решение. Откладываем единичный отрезок (0,1) и проводим оси 1 и 2 (рисунок 3).

1

2

а11= 1,5

а21= 2

S1

S1

а12= 3

S2

S2

а22 = 1

V

N

х

0

R1

R2

1

R1

М

p2

p1

Рисунок 3 – Графическая интерпретация игры 2 х 2 в смешанных стратегиях

(для игрока А)

На оси 1 откладываем отрезок a11 = 1,5 (точка S1), соответствующий стратегии В1 и отрезок а12 = 3 (точка S2), соответствующий стратегии В2.

На оси 2 откладываем отрезок a21 = 2 (точка S2), соответствующий стратегии В1 и отрезок а12 = 3 (точка S2), соответствующий стратегии В2.

Точка N - точка пересечения прямых (S1 – S1”) (S2-S2”). Ее абсцисса определяет значение вероятности p2 (отрезок, отложенный от точки 0). Вероятность p1 = 1 - p2 . Ордината точки N – определяет цену игры V .

Если график построен в масштабе, то значения p1, p2 и V могут быть получены непосредственно измерениями на графике.

Эта же задача (задача измерения) может быть решена аналитически.

Уравнение прямой (S1-S1”), походящей через точки S1 = (0;1,5) и S1” = (1;2), записывается в виде

.

В данном уравнении координата х – откладывается по оси абсцисс, а координата y – по оси ординат (оси 1).

Преобразовав это уравнение, получим

.

Уравнение прямой (S2-S2”), походящей через точки S2 = (0;3) и S2” = (1;1), записывается в виде

.

Преобразовав это уравнение, получим

.

Координаты точки N получим путем решения системы уравнений

.

Результат решения

x = 0.6; y = 1,8, т.е. N ( 0,6; 1,8).

Из анализа рисунка 3 следует, что p1* = 0,6; p2*= 1 – 0,6 = 0,4; V = 1,8 .

Это и есть решение игры в смешанных стратегиях.

Интерпретация результатов. Таким образом, игрок А должен чередовать стратегии R1 и R2 так. чтобы их частость составила : для стратегии R1 – 0,6, для стратегии R2 – 0,4, т.е., если игра повторяется 10 раз, то игрок А должен 6 раз использовать стратегию R1 и 4 раза - стратегию R2. При этом игрок А в среднем получит выигрыш равный цене игры, т.е V = 1,8 .

Графически решение может быть получено и для игрока В. Для этого необходимо поменять местами игрока А и В, и вместо максимума нижней границы в соответствии с принципом минимакса рассмотреть минимум верхней границы (рисунок 4).

На оси 1 откладываем отрезок a11 = 1,5 (точка R1), соответствующий стратегии R1 и отрезок а21 = 2 (точка R2), соответствующий стратегии R2.

На оси 2 откладываем отрезок a22 = 1 (точка R2”), соответствующий стратегии S2 и отрезок а12 = 3 (точка R1”), соответствующий стратегии A1.

Точка N - точка пересечения прямых (R1 – R1”) и (R2-R2”). Ее абсцисса определяет значение вероятности q1 (отрезок, отложенный от точки 0). Вероятность q2 = 1 - q1 . Ордината точки N – определяет цену игры V .

Если график построен в масштабе, то значения q1, q2 и V могут быть получены непосредственно измерениями на графике.

Эта же задача (задача измерения) может быть решена аналитически.

Уравнение прямой (S1-S1”), походящей через точки R1 = (0;1,5) и R1” = (1;3), записывается в виде

.

В данном уравнении координата х – откладывается по оси абсцисс, а координата y – по оси ординат (оси 1).

Преобразовав это уравнение, получим

.

Уравнение прямой (R2-R2”), походящей через точки R2 = (0;2) и R2” = (1;1), записывается в виде

.

Преобразовав это уравнение, получим

.

Координаты точки N получим путем решения системы уравнений

.

Результат решения

x = 0.2; y = 1,8, т.е. N ( 0,2; 1,8).

Из анализа рисунка 3 следует, что q2* = 0,2; q1*= 1 – 0,2 = 0,8; V = 1,8 .

Это и есть решение игры в смешанных стратегиях.

Интерпретация результатов. Таким образом, игрок B должен чередовать стратегии S1 и S2 так. чтобы их частость составила: для стратегии S1 – 0,8, для стратегии S2 – 0,2, т.е., если игра повторяется 10 раз, то игрок B должен 8 раз использовать стратегию S1 и 2 раза - стратегию S2. При этом игрок B в среднем получит выигрыш равный цене игры, т.е V = 1,8 .

Если платежная матрица содержит отрицательные числа, то для упрощения решения задачи графическим методом, целесообразно предварительно перейти к новой матрице (преобразовать матрицу) так, чтобы все элементы матрицы были бы положительными. Для этого необходимо ко всем элементам матрицы добавить одно и тоже соответствующее положительное число С. Решение игры при этом не изменится, но из полученного значения цены игры V необходимо вычесть добавленное число С.

1

2

а11= 1,5

а12= 3

R1

R1

а21= 2

R2

R2

а22 = 1

V

N

N

х

0

R1

S2

1

S1

М

q2

q1

Рисунок 4 – Графическая интерпретация игры 2 х 2 в смешанных стратегиях

(для игрока В)

Практическая часть

Задание 3. В соответствии с таблицей 3 решить игру с заданной платежной матрицей графическим методом (за игрока А и за игрока В). Дать интерпретацию полученных результатов.

Таблица 3- Варианты заданий

№ по журналу

1,

17

2,.

18

3,

19

4,

20

5,

21

6,

22

7,

23

8,

24

9,

25

10,

26

11,

27

12,

28

13,

29

14,

30

15,

31

Вариант

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

Вариант 1. H = . Вариант 2. H =

Вариант 3. H = . Вариант 4. H = .

Вариант 5. H = . Вариант 6. H = .

Вариант 7. H = . Вариант 8. H = .

Вариант 9. H = Вариант 10. H = .

Вариант 11. H = . Вариант 12. H = .

Вариант 13. H = . Вариант 14. H = .

Вариант 15. H = .

Теоретическая часть

Сведение игры к задаче линейного программирования

Если игра имеет размерность платежной матрицы m x n и не имеет седловой точки ( ) , то ее решение аналитическим и графическим методами становится невозможно. Одним из путей решения такой задачи является сведение ее к задаче линейного программирования.

Предположим, что все m стратегий игрока А являются активными. Определим вероятности их применения в смешанной оптимальной стратегии. Обозначим эти вероятности через вектор Р = (p1,p2,…,pm) , цену игры через V.

Оптимальная смешанная стратегия игрока А определяется из условия, введенного нами в предыдущей лекции

. ( 3 )

Пусть V = . ( 4 )

Поскольку при оптимальной стратегии средний выигрыш игрока А при любой стратегии игрока В , то справедлива система n неравенств:

( 5 )

. . . . . . . . . . . . . . . . . . . . . . . . . . .

или . ( 6 )

Добавим к ограничениям (5) стандартные ( 7 ) и получим задачу линейного программирования

- целевая функция 3 линейна;

- системы ограничений (6) и (7) также линейны.

Для того чтобы можно было применить классический симплекс–метод или метод симплекс-таблиц преобразуем целевую функцию на максимум и введем новые неизвестные

; ; … ; .

Чтобы исключить при таком преобразовании возможность деления на нуль, увеличим цену игры V на положительное число С. Для этого достаточно ко всем элементам матрицы игры aij одно и тоже положительное число, так, чтобы все эти элементы стали положительными. Следует отметить. что эта операция не меняет искомых оптимальных стратегий, т.к.

при том, что , .

Разделив левую и правую части неравенств ограничений (5) на V получим новую эквивалентную систему неравенств

( 8 )

. . . . . . . . . . . . . . . . . . . . . . . . . . .

.

. ( 9 )

В силу того, что

max V = min , получаем задачу в новой математической формулировке:

- целевая функция → max ( 10 )

- при ограничениях

. ( 11 )

Это общий подход к решению игры за игрока А.

Для игрока В оптимальная стратегия определяется из условия (предыдущая лекция)

( 12 )

при ограничении . ( 13 )

Эта задача записывается как симметричная двойственная задача линейного программирования к задаче игрока А (10),(11) , т.е.:

максимизировать целевую функцию

( 14 )

при ограничениях

, ( 15 )

где

. ( 16 )

Пример 5. Игра задана матрицей

Н =

Требуется решить игру.

Решение.

1. Доминирующих строк и столбцов нет.

2. Вычисляем верхнюю α и нижнюю β цену игры:

α1 = -5 ; α1 = -2 ; α1 = -3 ; α = -2 ;

β1 = 4 ; β2 = 5 ; β3 = 2 ; β4 = 6 ; β = 2 .

Таким образом, - седловой точки нет и решение игры необходимо вычислять в смешанных стратегиях.

3. Матрица игры имеет размерность 3 х 4, поэтому применить аналитический и графический методы не представляется возможным и задачу необходимо решать методом сведения к задаче линейного программирования.

3.1 Так как нижняя цена игры – число отрицательное ( α = -2 ), то возможно, что значение цены игры V не будет положительным числом. Преобразуем исходную матрицу так, чтобы все ее элементы были бы положительными. Для этого добавим ко всем элементам матрицы число С не менее 2. Выберем, например, число С = 6. Тогда матрица игры примет вид

Н1 = .

3.2 Решаем задачу за игрока В. С учетом (11), (12) получим задачу линейного программирования:

- максимизировать целевую функцию (игрок В имеет четыре стратегии ) ,

- при ограничениях

( по элемента матрицы Н1)

.

3.3. Решение задачи линейного программирования методом симплекс – таблиц.

Результаты решения:

Lmax = 0,16; y1 = 0; ; y2 = 0; ; y3 = 0,12; ; y4 = 0,04 .

3.5 Решение игры:

;

Проверка → 0 + 0 0,75 + 0,25 = 1 .

4. Интерпретация результатов решения игры.

Игроку В не имеет смысла использовать стратегии S1и S2, т.к. q1 = q2 = 0.

Игрок В должен случайно с относительными частотами , чередовать использование стратегий S3 и S4. При этом ему обеспечен средний выигрыш V = 0,25 д.ед.

Оптимальные стратегии игрока А могут быть получены из решения двойственной задачи линейного программирования.

В настоящее время развитие теории игр вышло далеко за пределы рассмотренных методов, широко используются множественные коалиционные игры, дифференциальные игры и т.д.

Практическая часть

Задание 4. Решить игру. Дать интерпретацию полученных результатов.

Нечетные номера по журналу – задача 1, четные – задача 2.

Задача 1. Предприятие (игрок А) может выпускать три вида продукции А123 (стратегии игрока А) , получая при этом прибыль, зависящую от спроса, который может быть в одном их четырех состояний В1234 (стратегии игрока В). Спрос определяется потребителем (игрок В).

Величина прибыли предприятия при выпуске продукции Аi и состоянии спроса Bj задана таблицей 4.

Таблица 4 – Исходные данные к задаче 1.

В1

В2

В3

В4

А1

3

3

6

8

А2

9

10

4

2

А3

7

7

5

4

Требуется:

- за игрока А принять решение о выборе стратегии, обеспечивающей среднюю величину прибыли при любом состоянии спроса, считая его неопределенным;

- за игрока В принять решение о выборе стратегии, обеспечивающей оптимальный спрос при любой стратегии игрока А.

Задача 2. Магазин может завести в различных пропорциях товары трех типов А123 (стратегии игрока А). реализация товаров и прибыли магазина зависят от вида товара и величины спроса, который может принимать три состояния В123 и не прогнозируется.

Матрица игры задача таблицей 5.

Таблица 5 – Исходные данные к задача 2

В1

В2

В3

А1

20

15

10

А2

16

12

14

А3

13

18

15

- за игрока А принять решение о выборе стратегии, позволяющей максимизировать среднюю гарантированную прибыль;

- за игрока В принять решение о выборе стратегии, позволяющей минимизировать среднюю величину проигрыша.

Отчет должен содержать:

1) тему и цель лабораторной работы;

2) выполнение заданий: 1, 2, 3, 4 с выводами по каждой задаче.