
- •Часть 3
- •§1. Мажорирующие и минорирующие стратегии. Понижение порядка матрицы в матричной игре
- •– Столбцы, – строки матрицы а. Столбец и к-ая чистая стратегия второго игрока называются мажорирующими, если найдутся такие числа
- •§2. Графо-аналитический метод решения игр с двустрочными и двустолбцовыми матрицами
- •П.1. Графо-аналитический метод для решения игры с двустрочной матрицей выигрышей
- •П.2. Графо-аналитический метод для решения игры с двустолбцовой матрицей выигрышей
- •§3. Игры с матрицами, отличающимися порядком строк и столбцов
- •§4. Простые стратегии
- •§5. Общее решение игровых задач
- •§1. Мажорирующие и минорирующие стратегии.
- •§2. Графо-аналитический метод решения игр с двустрочными и
- •§3. Игры с матрицами отличающимися порядком строк и столбцов.......19
- •§4. Простые стратегии………………………………………………...……21
- •§5. Общее решение игровых задач…………………………………...……24
П.2. Графо-аналитический метод для решения игры с двустолбцовой матрицей выигрышей
применяется, если цена игры .
Метод основывается на равенстве (2.1). Поскольку обоснование этого метода базируется на положениях, близких к положениям, изложенным в предыдущем пункте. Поэтому метод излагаться будет несколько менее подробно, чем метод для двустрочной матрицы.
Если
в (2.1) взять по
минимум от обеих частей равенства, то
цену игры получим
из равенства
.
(2.20)
Обозначим
,
(2.21)
,
(2.22)
.
(2.23)
Пусть
,
т.е. в силу (2.22) и (2.23)
.
Отсюда
для всех
.
Тогда в силу (2.21)
.
(2.24)
Так
как
–
цена игры, то согласно теореме 2.2.1
(оптимальности)
является оптимальной смешанной
стратегией второго игрока.
Для
вычисления
и
проведем следующие графические
построения. Пусть
–
произвольная смешанная стратегия
второго игрока. Обозначим
.
Тогда
.
Учитывая это и (2.21)–(2.23) введем следующие
функции одномерного аргумента
:
,
.
Тогда
,
а
вместо нахождения точки
минимума функции
следует найти точку
минимума функции
.
Пусть,
например,
.
На рис. 3 изобразим графики функций
и темной линией – график функции
.
Рис. 3 показывает, что точка
является решением уравнения
,
а
.
Рис.3
Таким
образом, на первом этапе решения игровой
задачи с двустолбцовой матрицей
находятся цена
и оптимальная стратегия
второго игрока.
В
случаях
матрица имеет седловую точку, которая
и является решением.
Пусть
теперь
,
т.е.
.
Тогда по теореме 2.2.2 о дополняющей
нежесткости
(2.25)
Обозначим
.
Если
,
то
.
Тогда по теореме о дополняющей нежесткости
.
Поэтому в системе (2.25) для каждого
полагается
.
Если после этого в системе остаются две
неизвестных, то ее решением завершается
отыскание оптимальной стратегии
первого игрока. Исследуем случай, когда
в множестве
остаются более двух индексов, т.е. в
системе (2.25) остаются более двух
неизвестных. Выберем любые три индекса
.
Пусть
– соответствующие этим индексам строки
матрицы
.
Так как эти три вектора двумерные, а
число их больше двух, они линейно
зависимы. Значит, найдутся такие числа
не все равные нулю, что будет выполнено
равенство
.
(2.26)
Умножая
его скалярно на оптимальную стратегию
второго игрока, получим
.
(2.27)
Так как , то
.
(2.28)
Подставляя (2.28) в (2.27) и учитывая, что , получим
. (2.29)
Таким образом, среди есть числа разных знаков. Пусть, например . Представим тогда равенство (2.29) в виде
(2.30)
Из (2.26) следует
.
Так
как в этом равенстве коэффициенты
неотрицательны и для них выполняется
соотношение (2.30), то вектор
является выпуклой комбинацией векторов
.
Следовательно, по определению 1.2
-ая
чистая стратегия первого игрока является
минорирующей. Согласно теореме 1.2
существует оптимальная смешанная
стратегия первого игрока с
.
Тогда в системе (2.25) полагаем
.
Проделывая такую операцию с каждой
тройкой векторов-строк матрицы
,
оставим в системе (2.25) две неизвестных
величины, которые и найдем, решая эту
систему.
Пример 2.2. Определить цену и оптимальные стратегии игроков в матричной игре с
.
Решение. Построим 6 функций
и
функцию
.
Последняя функция на рис.4 выделена
темной линией.
Рис.4
Согласно
рис.4 точка
является решением, например, уравнения
.
Решая это уравнение, найдем
.
Тогда
,
а
.
Множеством активных индексов является
.
Тогда
.
Минорирующими стратегиями первого
игрока будут первая и пятая (на рис.4
графики функций
лежат между графиками функций
).
Поэтому существует оптимальная стратегия
первого игрока, для которой
.
Таким образом, система (2.19) для данного
примера имеет вид
Решая
эту систему, находим
Итак, задача решена. Ответ:
,
,
.
П.3. Связь между графо-аналитическими методами решения игровых задач с двустрочными и двустолбцовыми матрицами выигрышей
Докажем
теорему о связи между решениями игр с
матрицами
и
,
которая вытекает из теоремы 2.2.1 о
необходимых и достаточных условиях
оптимальности смешанных стратегий и
ее следствия.
Теорема
2.2. Пусть
– оптимальные стратегии первого и
второго игроков в игре с матрицей
и
ценой
.
Для игры с матрицей
оптимальные стратегия
первого и, соответственно, второго
игроков и цена
в игре с матрицей
будут удовлетворять равенствам
,
.
Доказательство. Согласно теореме 2.2.1 об оптимальных смешанных стратегиях для цены оптимальных стратегий первого и второго игроков выполняются неравенства
,
.
(2.31)
Умножим неравенства (2.31) на –1
,
. (2.32)
Поскольку
матрица
имеет
строк, то любой вектор
,
для которого
и
,
является смешанной стратегией первого
игрока в игре с матрицей
.
По условиям теоремы этими свойствами
обладает вектор
.
Значит, вектор
является смешанной стратегией первого
игрока в игре с матрицей
.
Аналогичные рассуждения показывают,
что вектор
является смешанной стратегией второго
игрока в игре с матрицей
.
Суммирование
в первой группе неравенств (2.31) ведется
по второму индексу чисел
,
а в первой группе неравенств (2.32) – по
первому. Аналогичная смена индекса
суммирования происходит и во вторых
группах неравенств (2.31) и (2.32). Значит,
матрицы систем (2.31) и (2.32) являются
транспонированными относительно друг
друга. Поскольку неравенства (2.32)
выполняются для одного и того же числа
и смешенных
стратегий в игре с
,
то согласно следствию теоремы 2.2.1 это
число является ценой, а смешанные
стратегии оптимальными такой игры.
Теорема доказана.
Сделаем из этой теоремы вычислительные выводы.
Вместо того чтобы применять метод, описанный в П.2 данного параграфа к двустолбцовой матрице, можно проделать следующие процедуры:
Двустолбцовая матрица транспонируется, и знаки всех ее элементов заменяются на противоположные.
Решается вспомогательная задача с двустрочной матрицей .
Ответ записывается в соответствии с теоремой 2.2, т.е. у найденной цены изменяется знак на противоположный, оптимальная стратегия первого (второго) игрока вспомогательной задачи c матрицей принимается за стратегию второго (первого) игрока задачи с матрицей .