Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Херсонский национальный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

11-12 / лаб11 / 11.doc

Скачиваний:

Добавлен:

07.02.2016

Размер:

161.28 Кб

Скачать

☆

1 / 21 2 > Следующая >>>

Лабораторная работа 11 Тема: Теория игр

Цель работы: Найти решение матричной игры в смешанных стратегиях, представленной моделью задачи линейного программирования.

Теоретические сведения

Для двух игроков А и В задана платежная матрица

		Стратегии игрока B
		B₁	B₂	B₃	B₄	B₅
Стратегии игрока A	A₁	-2	3	-1	1	4
	A₂	-1	4	-2	2	3
	A₃	7	0	1	-1	0
	A₄	-1	3	0	3	4
	A₅	6	-1	1	-1	-1

Игрок А использует логику, которая гарантирует ему максимальный выигрыш вне зависимости от поведения игрока В.

Определяются минимальные элементы каждой строки, что соответствует минимальным выигрышам игрока А при каждой стратегии и среди них, находится максимальное число, равное -1.

Таким образом, свой выбор, игрок А остановит на стратегии A₃, которая обеспечит ему выигрыш -1, т.е. потерю не более 1 ден.ед.

Значение равное -1, называется нижней ценой игры.

		Стратегии игрока B					Минимальный элемент в строке
		B₁	B₂	B₃	B₄	B₅	Минимальный элемент в строке
Стратегии игрока A	A₁	-2	3	-1	1	4	-2
	A₂	-1	4	-2	2	3	-2
	A₃	7	0	1	-1	0	-1
	A₄	-1	3	0	3	4	-1
	A₅	6	-1	1	-1	-1	-1

Игрок В использует логику, которая гарантирует ему минимальный проигрыш вне зависимости от поведения игрока А.

Определяются максимальные элементы каждого столбца, что соответствует максимальным проигрышам игрока В при каждой стратегии и среди них, находится минимальное число, равное 1.

Свой выбор, игрок В остановит на стратегии В₃, которая обеспечит ему проигрыш 1, т.е. потерю не более 1 ден.ед.

Значение равное 1, называется верхней ценой игры.

		Стратегии игрока B					Минимальный элемент в строке
		B₁	B₂	B₃	B₄	B₅	Минимальный элемент в строке
Стратегии игрока A	A₁	-2	3	-1	1	4	-2
	A₂	-1	4	-2	2	3	-2
	A₃	7	0	1	-1	0	-1
	A₄	-1	3	0	3	4	-1
	A₅	6	-1	1	-1	-1	-1
Максимальный элемент в столбце		7	4	1	3	4

Если верхняя цена игры равна нижней цене игры (седловая точка), то было бы найдено решение, которое устраивает обоих игроков, исходя из их логики. В рассматриваемом примере, если игроки пользуются только чистыми стратегиями, оптимальное решение не найдено. Но, всегда есть решение в смешанных стратегиях.

Смешанной стратегией игрока А называется применение чистых стратегий A₁ , A₂ , A₃ , A₄ , A₅ c вероятностями p₁ , p₂ , p₃ , p₄ , p₅ .

Смешанную стратегию первого игрока обозначают как вектор

P = ( p₁ , p₂ , p₃ , p₄ , p₅ ) ,

где p₁ + p₂ + p₃ + p₄ + p₅ = 1; p₁ , p₂ , p₃ , p₄ , p₅ 0.

Смешанной стратегией игрока B называется применение чистых стратегий B₁ , B₂ , B₃ , B₄ , B₅ c вероятностями q₁ , q₂ , q₃ , q₄ , q₅ .

Смешанную стратегию второго игрока обозначают как вектор

Q = ( q₁ , q₂ , q₃ , q₄ , q₅ ) ,

где q₁ + q₂ + q₃ + q₄ + q₅ = 1 и q₁ , q₂ , q₃ , q₄ , q₅ 0

Оптимальное решение игры (или просто - решение игры) - это пара оптимальных смешанных стратегий

P* ( p*₁ , p*₂ , p*₃ , p*₄ , p*₅ ) и Q* ( q*₁ , q*₂ , q*₃ , q*₄ , q*₅ ),

Таким образом, если один из игроков придерживается своей оптимальной стратегии, то другому невыгодно отступать от своей стратегии.

Выигрыш игрока А равный проигрышу игрока В, соответствующий оптимальному решению, называется ценой игры v.

Цена игры больше либо равна нижней цены игры и меньше или равна верхней цены игры, т.е. -1 v 1.

Исходную платежную матрицу можно уменьшить, если исключить из нее стратегии, которыми заведомо не выгодно пользоваться игрокам.

		Стратегии игрока B
		B₁	B₂	B₃	B₄	B₅
Стратегии игрока A	A₁	-2	3	-1	1	4
	A₂	-1	4	-2	2	3
	A₃	7	0	1	-1	0
	A₄	-1	3	0	3	4
	A₅	6	-1	1	-1	-1

1. Стратегия A₄ является доминирующей над стратегией A₁ , т.к. каждый элемент строки 4 больше или равен соответствующего элемента строки.

Игроку А заведомо не выгодно пользоваться стратегией A₁. Удаляем стратегию A₁ из рассмотрения.

		Стратегии игрока B
		B₁	B₂	B₃	B₄	B₅
Стратегии игрока A	A₂	-1	4	-2	2	3
	A₃	7	0	1	-1	0
	A₄	-1	3	0	3	4
	A₅	6	-1	1	-1	-1

2. Стратегия A₃ является доминирующей над стратегией A₅ , поэтому удаляем стратегию A₅ из рассмотрения.

		Стратегии игрока B
		B₁	B₂	B₃	B₄	B₅
Стратегии игрока A	A₂	-1	4	-2	2	3
	A₃	7	0	1	-1	0
	A₄	-1	3	0	3	4

3. Стратегия B₄ является доминирующей над стратегией B₅. Удаляется стратегия B₅ из рассмотрения.

		Стратегии игрока B
		B₁	B₃	B₄
Стратегии игрока A	A₂	-1	-2	2
	A₃	7	1	-1
	A₄	-1	0	3

4. Игроку А заведомо не выгодно пользоваться стратегией A₂. Удаляется стратегия A₂ из рассмотрения.

		Стратегии игрока B
		B₁	B₃	B₄
Стратегии игрока A	A₃	7	1	-1
Стратегии игрока A	A₄	-1	0	3

После преобразований платежной матрицы, оптимальное решение будем искать в виде :

P* = ( 0 , 0 , p*₃ , p*₄ , 0 ) ,

Q* = ( q*₁ , 0 , q*₃ , q*₄ , 0 ).

В задаче, значение цены игры определяется неравенством -1 v 1. В дальнейшем, потребуется, чтобы цена игры была положительной, для этого воспользуемся следующей теоремой.

Если к каждому элементу платежной матрицы прибавить положительное число, то цена игры увеличится на это число, при этом оптимальное решение игры не изменится. Если все элементы матрицы больше или равны нулю, то и цена игры будет положительной.

Таким образом, необходимо ко всем элементам матрицы прибавить число, равное по модулю наименьшему элементу матрицы.

Прибавим 1 к каждому элементу матрицы. Тогда, цена исходной игры v = v₁ -1, где v₁ - цена игры новой матрицы.

		Стратегии игрока B
		B₁	B₃	B₄
Стратегии игрока A	A₃	8	2	0
Стратегии игрока A	A₄	0	1	4

Если P* = ( 0 , 0 , p*₃ , p*₄ , 0 ) и Q* = ( q*₁ , 0 , q*₃ , q*₄ , 0 ) являются оптимальным решением, то должны выполняться две следующие системы неравенств :

8 p*₃ v₁

2 p*₃ + p*₄ v₁

4 p*₄ v₁

8 q*₁ + 2 q*₃ v₁

q*₃ + 4 q*₄ v₁

Рассмотрим первую систему.

Разделим все члены системы на цену игры v₁. Знаки в неравенствах системы не изменятся, так как цена игры положительная.

Введем новые обозначения:

y₁ = p*₃ / v₁ , y₂ = p*₄ / v₁

Рассмотрим сумму:

y₁ + y₂ = p*₃ / v₁ + p*₄ / v₁ = 1/v₁ * ( p*₃ + p*₄ ) = 1/v₁,

где ( p*₃ + p*₄ )=1 (сумма вероятностей используемых стратегий равна единице).

Игрок A старается увеличить свой выигрыш, т.е. цену игры v₁, поэтому выражение 1/v₁ будет стремиться к минимуму. Таким образом, из первой системы будет получена задача линейного программирования.

Требуется найти минимум линейной функции

F = y₁ + y₂

при следующей системе ограничений:

8 y₁ 1

2 y₁ + y₂ 1

4 y₂ 1

Рассмотрим вторую систему.

Введем новые обозначения:

x₁ = q*₁ / v₁ , x₂ = q*₃ / v₁ , x₃ = q*₄ / v₁

Рассмотрим сумму:

x₁ + x₂ + x₃ = q*₁ / v₁ + q*₃ / v₁ + q*₄ / v₁ = 1/v₁ * ( q*₁ + q*₃ + q*₄ ) = 1/v₁

Игрок B старается уменьшить свой проигрыш, т.е. цену игры v₁, поэтому выражение 1/v₁ будет стремиться к максимуму. Таким образом, из первой системы будет получена задача линейного программирования.

Требуется найти максимум линейной функции

L = x₁ + x₂ + x₃

при следующей системе ограничений :

8 x₁ + 2 x₂ 1

x₂ + 4 x₃ 1

Полученные задачи являются парой симметричных взаимно двойственных задач.

Если решить одну из этих задач, то автоматически будет получено решение второй.

Для решения воспользуемся симплекс-методом, реализованного в виде надстройки Excel Поиск решений (лабораторная работа 3).

В книге Поиск решений на странице Таблица с формулами последовательно внести данные первой и второй систем и найти решение. Предварительно изменить формат ячеек для переменных и целевой функции на числовой с двумя знаками после запятой.

Решение для первой задачи

y₁ = 0,38; y₂ = 0,25; F = 0,63.

Решение для второй задачи

х₁ = 0; х₂ = 0,5; х₃ = 0,13; L = 0,63.

Максимальное значение функции прямой задачи равно минимальному значению функции двойственной задачи.

Найдем цену игры v₁.

v₁ = 1 / F = 1 / L = 1/0,63 = 1,6

Так как к каждому элементу матрицы мы прибавили 1, следовательно, цена исходной игры равна:

v = v₁ - 1 = 1,6 - 1 = 0,6.

Теперь можно найти оптимальное решение игры.

Вероятности стратегий игрока А.

p*₁ = 0;

p*₂ = 0;

p*₃ = y₁ * v₁ = 0,38 * 1,6 = 0,6;

p*₄ = y₂ * v₁ = 0,25 * 1,6 = 0,4;

p*₅ = 0;

P* = ( 0; 0; 0,6; 0,4; 0 );

Цена игры v = 0,6.

Вероятности стратегий игрока В.

q*₁ = x₁ * v₁ = 0 * 1,6 = 0;

q*₂ = 0;

q*₃ = x₂ * v₁ = 0,5 * 1,6 = 0,8;

q*₄ = x₃ * v₁ = 0,13 * 1,6 = 0,2;

q*₅ = 0.

Q* = ( 0; 0; 0,8; 0,2; 0 )

Цена игры v = 0,6.

Анализ результата решения задачи.

Выигрыш игрока А составит 3/5 денежных единиц, а проигрыш игрока В составит ту же сумму (игра с нулевой суммой).

Игрок А использует свои стратегии следующим образом:

A₁ на 0 %
A₂ на 0 %
A₃ на 60 %
A₄ на 40 %
A₅ на 0 %

Игрок B использует свои стратегии следующим образом:

B1 на 0 %
B2 на 0 %
B3 на 80 %
B4 на 20 %
B5 на 0 %

1 / 21 2 > Следующая >>>

Соседние файлы в папке лаб11

#
07.02.201610.27 Кб121.xlsx
#
07.02.2016161.28 Кб1111.doc
#
07.02.201610.28 Кб112.xlsx
#
07.02.201610.25 Кб11x2.xlsx
#
07.02.201610.24 Кб15Линейное программирование.xlsx