Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория игр.ч.3.doc
Скачиваний:
0
Добавлен:
13.12.2019
Размер:
2.34 Mб
Скачать

П.2. Графо-аналитический метод для решения игры с двустолбцовой матрицей выигрышей

применяется, если цена игры .

Метод основывается на равенстве (2.1). Поскольку обоснование этого метода базируется на положениях, близких к положениям, изложенным в предыдущем пункте. Поэтому метод излагаться будет несколько менее подробно, чем метод для двустрочной матрицы.

Если в (2.1) взять по минимум от обеих частей равенства, то цену игры получим из равенства

. (2.20)

Обозначим

, (2.21)

, (2.22)

. (2.23)

Пусть , т.е. в силу (2.22) и (2.23) . Отсюда для всех . Тогда в силу (2.21)

. (2.24)

Так как – цена игры, то согласно теореме 2.2.1 (оптимальности) является оптимальной смешанной стратегией второго игрока.

Для вычисления и проведем следующие графические построения. Пусть – произвольная смешанная стратегия второго игрока. Обозначим . Тогда . Учитывая это и (2.21)–(2.23) введем следующие функции одномерного аргумента :

,

.

Тогда

,

а вместо нахождения точки минимума функции следует найти точку минимума функции .

Пусть, например, . На рис. 3 изобразим графики функций и темной линией – график функции . Рис. 3 показывает, что точка является решением уравнения , а .

Рис.3

Таким образом, на первом этапе решения игровой задачи с двустолбцовой матрицей находятся цена и оптимальная стратегия второго игрока.

В случаях матрица имеет седловую точку, которая и является решением.

Пусть теперь , т.е. . Тогда по теореме 2.2.2 о дополняющей нежесткости

(2.25)

Обозначим

.

Если , то . Тогда по теореме о дополняющей нежесткости . Поэтому в системе (2.25) для каждого полагается . Если после этого в системе остаются две неизвестных, то ее решением завершается отыскание оптимальной стратегии первого игрока. Исследуем случай, когда в множестве остаются более двух индексов, т.е. в системе (2.25) остаются более двух неизвестных. Выберем любые три индекса . Пусть – соответствующие этим индексам строки матрицы . Так как эти три вектора двумерные, а число их больше двух, они линейно зависимы. Значит, найдутся такие числа не все равные нулю, что будет выполнено равенство

. (2.26)

Умножая его скалярно на оптимальную стратегию второго игрока, получим

. (2.27)

Так как , то

. (2.28)

Подставляя (2.28) в (2.27) и учитывая, что , получим

. (2.29)

Таким образом, среди есть числа разных знаков. Пусть, например . Представим тогда равенство (2.29) в виде

(2.30)

Из (2.26) следует

.

Так как в этом равенстве коэффициенты неотрицательны и для них выполняется соотношение (2.30), то вектор является выпуклой комбинацией векторов . Следовательно, по определению 1.2 -ая чистая стратегия первого игрока является минорирующей. Согласно теореме 1.2 существует оптимальная смешанная стратегия первого игрока с . Тогда в системе (2.25) полагаем . Проделывая такую операцию с каждой тройкой векторов-строк матрицы , оставим в системе (2.25) две неизвестных величины, которые и найдем, решая эту систему.

Пример 2.2. Определить цену и оптимальные стратегии игроков в матричной игре с

.

Решение. Построим 6 функций

и функцию . Последняя функция на рис.4 выделена темной линией.

Рис.4

Согласно рис.4 точка является решением, например, уравнения . Решая это уравнение, найдем . Тогда , а . Множеством активных индексов является . Тогда . Минорирующими стратегиями первого игрока будут первая и пятая (на рис.4 графики функций лежат между графиками функций ). Поэтому существует оптимальная стратегия первого игрока, для которой . Таким образом, система (2.19) для данного примера имеет вид

Решая эту систему, находим Итак, задача решена. Ответ: , , .

П.3. Связь между графо-аналитическими методами решения игровых задач с двустрочными и двустолбцовыми матрицами выигрышей

Докажем теорему о связи между решениями игр с матрицами и , которая вытекает из теоремы 2.2.1 о необходимых и достаточных условиях оптимальности смешанных стратегий и ее следствия.

Теорема 2.2. Пусть – оптимальные стратегии первого и второго игроков в игре с матрицей

и ценой . Для игры с матрицей оптимальные стратегия первого и, соответственно, второго игроков и цена в игре с матрицей будут удовлетворять равенствам , .

Доказательство. Согласно теореме 2.2.1 об оптимальных смешанных стратегиях для цены оптимальных стратегий первого и второго игроков выполняются неравенства

, . (2.31)

Умножим неравенства (2.31) на –1

, . (2.32)

Поскольку матрица имеет строк, то любой вектор , для которого и , является смешанной стратегией первого игрока в игре с матрицей . По условиям теоремы этими свойствами обладает вектор . Значит, вектор является смешанной стратегией первого игрока в игре с матрицей . Аналогичные рассуждения показывают, что вектор является смешанной стратегией второго игрока в игре с матрицей . Суммирование в первой группе неравенств (2.31) ведется по второму индексу чисел , а в первой группе неравенств (2.32) – по первому. Аналогичная смена индекса суммирования происходит и во вторых группах неравенств (2.31) и (2.32). Значит, матрицы систем (2.31) и (2.32) являются транспонированными относительно друг друга. Поскольку неравенства (2.32) выполняются для одного и того же числа и смешенных стратегий в игре с , то согласно следствию теоремы 2.2.1 это число является ценой, а смешанные стратегии оптимальными такой игры. Теорема доказана.

Сделаем из этой теоремы вычислительные выводы.

Вместо того чтобы применять метод, описанный в П.2 данного параграфа к двустолбцовой матрице, можно проделать следующие процедуры:

  1. Двустолбцовая матрица транспонируется, и знаки всех ее элементов заменяются на противоположные.

  2. Решается вспомогательная задача с двустрочной матрицей .

  3. Ответ записывается в соответствии с теоремой 2.2, т.е. у найденной цены изменяется знак на противоположный, оптимальная стратегия первого (второго) игрока вспомогательной задачи c матрицей принимается за стратегию второго (первого) игрока задачи с матрицей .