Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Витебский государственный университет им. П. М. Машерова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

УМК ЭММ и М.doc

Скачиваний:

Добавлен:

01.03.2025

Размер:

5.95 Mб

Скачать

☆

<<< < Предыдущая 9 10 11 12 13 14 15 16 17 18 19 2021 / 3421 22 23 24 25 26 27 28 29 30 31 32 33 > Следующая >>>

6.4. Приведение матричной игры к задаче линейного программирования

Пусть имеется игра с платежной матрицей .

Обозначим через и оптимальные смешанные стратегии игроков А и В. Стратегия игрока А гарантирует ему выигрыш не меньше , независимо от выбора стратегии игроком В. Это можно записать так:

(6.4.1)

где

Аналогично, стратегия игрока В гарантирует ему проигрыш не больше , независимо от выбора стратегии игроком А, т.е.:

(6.4.2)

где

Считаем, что цена игры , так как элементы платежной матрицы всегда можно сделать положительными.

Преобразуем системы (6.4.1) и (6.4.2), разделив обе части каждого неравенства на положительное число и введем новые обозначения (i = ; j = ). Получим:

(6.4.3)

где

(6.4.4)

(6.4.5)

где

(6.4.6)

Так как игрок А стремится максимизировать цену игры то обратная величина будет минимизироваться, поэтому оптимальная стратегия игрока А определится из ЗЛП следующего вида:

(6.4.7)

при ограничениях (6.4.3), (6.4.4).

Оптимальная смешанная стратегия игрока В определится решением задачи следующего вида:

(6.4.8)

при ограничениях (6.4.5), (6.4.6).

Решив пару двойственных задач графически (для случая двух переменных) или симплекс-методом, определим:

, (6.4.9)

(6.4.10)

Пример 6.4.1. Решить игру с платежной матрицей , сведя ее к паре задач линейного программирования.

Решение. Проверим, имеет ли игра седловую точку, табл. 6.4.1.

Таблица 6.4.1


2	1	0	0
3	0	1	0
1	2	4	1
3	2	4	1 2

Получаем:

; .

Так как , то решение игры может быть найдено в смешанных стратегиях, а цена игры заключена в пределах Доминирования и дублирования стратегий в данной игре нет, поэтому размерность платежной матрицы сохраняется, и все имеющиеся стратегии участвуют в дальнейшем решении. Так как все элементы платежной матрицы неотрицательны, то не требуются дополнительные преобразования.

Исходной игре будет соответствовать пара двойственных задач линейного программирования.

Для определения оптимальной смешанной стратегии игрока :

Решим вторую задачу симплекс-методом. Для этого перейдем от симметрической формы записи ЗЛП к каноническому виду:

Балансовые переменные и составят начальный базис, а основные переменные и будут свободными.

Составим первую симплексную таблицу (табл. 6.4.2). Начальный опорный план не является оптимальным. Выбрав в качестве разрешающего элемента «2», введем в базис и выведем из базиса (табл. 6.4.3).

Таблица 6.4.2 Таблица 6.4.3

Так как в строке табл. 6.4.3 есть отрицательный элемент, то полученный план задачи не оптимален. Найдем:

Если в качестве разрешающего элемента принять « », то дальнейшее решение задачи позволяет получить оптимальный план, заданный в табл. 6.4.4. В случае выбора в качестве разрешающего элемента «3» оптимальный план будет определен в таблице 6.4.5.

Заметим, что согласно обеим таблицам (табл. 6.4.4, табл. 6.4.5) решение ЗЛП одно и то же: На основании формул (6.4.9) и (6.4.10) получим цену игры и компоненты оптимальной смешанной стратегии игрока В:

Таким образом,

Таблица 6.4.4 Таблица 6.4.5

Определим оптимальную смешанную стратегию игрока . Введем дополнительные переменные и в ограничения задачи линейного программирования игрока :

Введенные переменные и составят начальный базис. Переменные и будут свободными. Между переменными канонических форм рассматриваемых двойственных задач существует следующее соответствие:

Учитывая это соответствие, выписываем из строки целевой функции (табл. 6.4.4) значения компонент оптимального плана прямой задачи: . На основании формул (4.10) получим компоненты оптимальной смешанной стратегии игрока :

Таким образом,

Если воспользоваться табл. 6.4.5, то . Тогда компоненты оптимальной смешанной стратегии игрока :

Таким образом,

Заметим, что неединственность оптимального плана задачи по определению смешанной стратегии игрока обусловлена тем, что согласно последним симплексным таблицам (табл. 6.4.4 и табл. 6.4.5) и использованному соответствию переменных прямой и двойственной ЗЛП можно указать равные нулю свободные переменные оптимального плана . А именно, в табл. 6.4.4 что соответствует свободной переменной ; в табл. 6.4.5 что соответствует свободной переменной . Согласно свойствам оптимального решения ЗЛП, чистая цена игры будет достигаться также при использовании игроком любой смешанной стратегии, являющейся выпуклой линейной комбинацией стратегий и , т.е. где

Окончательно, чистая цена игры достигается при использовании игроком оптимальной смешанной стратегии где игроком – оптимальной смешанной стратегии

Ответ: ,

При больших размерностях платежной матрицы (m>3, n>3) соответствующие ей задачи линейного программирования целесообразно решать на ЭВМ (например, в среде Excel). Если или то решение матричной игры в смешанных стратегиях можно найти графическим методом.

Пример 6.4.2.

Графическим методом решить игру с платежной матрицей .

Решение. Проверим, имеет ли игра седловую точку, табл. 6.4.6.

Таблица 6.4.6


3	8	3
12	1	1
9	6	6
12	8	6 8

Получаем,

В данном случае , т.е. . Следовательно, решение игры может быть найдено в смешанных стратегиях, а цена игры будет заключена в пределах . Доминирования стратегий в данной игре нет, все элементы платежной матрицы положительны, поэтому платежная матрица не требует упрощения.

Для определения оптимальных стратегий игроков, составим пару двойственных ЗЛП.

Для определения оптимальной смешанной стратегии игрока :

Так как задача по определению оптимальной смешанной стратегии игрока содержит две переменные, то для ее решения может быть использован графический метод.

Построим граничные прямые (I), (II), (III), рис. 4.1.

Рис. 6.4.1

Далее найдем область допустимых решений – пятиугольник (выделенная область). Построим градиент функции . Максимум целевой функции достигается в точке В. Найдем координаты точки В, как координаты точки пересечения прямых (I) и (III) из решения системы линейных уравнений: . Получаем, т.е. , тогда

Согласно формулам (6.4.9) и (6.4.10) цена игры компоненты смешанной стратегии откуда

Для определения оптимальной смешанной стратегии игрока прежде всего найдем решение прямой задачи. В оптимальном плане двойственной задачи и поэтому оба ограничения прямой задачи ее оптимальным планом обращаются в равенства. Подставим значения и в ограничения двойственной задачи:

Второе ограничение обращается в строгое неравенство. Следовательно, в оптимальном плане прямой задачи соответствующая ему вторая переменная равна нулю, т.е. Учитывая все это, для определения оптимального плана ЗЛП получаем следующую систему: