Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
теория игр шпоры.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
758.12 Кб
Скачать

11.Верхние и нижние цены в s-игре

Дальше будем обозначать S-игру через . Для перехода от игры к S-игре вместо пространства смешанных стратегий второго игрока необходимо использовать пространство S-стратегий, т.е. выпуклую оболочку . Обозначим потери второго игрока в S-игре через , тогда S — игра зависит от P, и , причем потери должны быть найдены как скалярное произведение . Таким образом, выражение определяет S-игру. Функция потерь определяется выражением:

.

Рассмотрим процедуру оценки верхних и нижних цен в S-игре. Если первый игрок применяет смешанную стратегию , то значение его гарантированного выигрыша

.

Обозначим через такую стратегию первого игрока, при которой достигает максимума:

(эта нижняя цена игры совпадает с ценой игры в обычной форме в силу эквивалентности S-игры с обычной игрой). Стратегию называют максиминной стратегией первого игрока.

Предположим теперь, что второй игрок применяет некоторую стратегию . При этом значение его проигрыша . Тогда второго игрока будет интересовать стратегия:

. Стратегию называют минимаксной стратегией второго игрока.

Таким образом, максиминная стратегия первого игрока определяет нижнюю цену в S-игре:

.

Аналогично стратегия определяет верхнюю цену в S-игре:

.

Выражения для и можно представить в более удобном виде, если воспользоваться теоремой.

Теорема. Если S — произвольная точка m-мерного пространства и — многомерная переменная, то имеет место соотношение

.

Доказательство. Пусть . Рассмотрим частное значение p, соответствующее случаю

при и при . В этом случае . Таким образом, является частным значением скалярного произведения , а значит, подмножеством множества значений , получающихся при всевозможных значениях p. На основании теоремы о верхней границе подмножества находим

.

С другой стороны, заменяя в выражении для значения на максимальное значение , получаем

.

Это выражение справедливо при любом p. Сопоставляя два последних выражения приходим к соотношению:

. Теорема доказана.

Если воспользоваться доказанной теоремой, то выражение для B(S) можно переписать в виде

.

Из этого равенства вытекают два следствия:

  1. , т.е. любая точка имеет по крайней мере одну координату, не меньшую, чем верхняя цена игры;

  2. Если в качестве S взять , то получим:

. Верхняя цена игры равна максимальной из координат точки , определяющей минимаксную стратегию второго игрока.

12.Теорема о минимаксе

Возможность нахождения каждым игроком своей наилучшей стратегии основывается на следующей теореме, которая может рассматриваться как доказательство существования решения для конечных игр.

Теорема. Всякая конечная антагонистическая игра имеет цену, и у каждого игрока существует по меньшей мере одна оптимальная стратегия.

Исходные предпосылки. Пусть — конечная игра, а — смешанное расширение этой игры. При доказательстве теоремы удобно вести рассуждения в терминах S-игры, поэтому через обозначим эквивалентную S-игру.

Нижняя и верхняя цены S-игры будут равны и соответственно, независимо от того, рассматривают игру G или эквивалентную ей S-игру , причем .

Для того, чтобы доказать теорему, достаточно показать, что , так как из сравнения с предыдущим неравенством будет следовать , т.е. что игра имеет цену.

Для доказательства этого неравенства достаточно найти такую смешанную стратегию первого игрока, при которой для всех имеет место

. (1)

Действительно, если неравенство (1) имеет место, то

. Таким образом, доказательство теоремы будет сводиться к доказательству неравенства (1).

Доказательство. Рассмотрим множество T, состоящее из точек таких, что . На рисунке показана область T для двумерного пространства, которая в данном случае имеет вид прямоугольного клина с вершиной, лежащей на прямой, проведенной из начала координат под углом к оси абсцисс. Рассмотрим некоторые свойства множества T.

Множество T является выпуклым. Рассмотрим произвольные точки и этого множества. Уравнение отрезка, соединяющего эти две точки, будет иметь вид:

, , .

Проектируя это уравнение на i-ую ось и учитывая теорему на стр.14, получаем

(2) Следовательно, любая точка рассматриваемого отрезка принадлежит T и множество T выпуклое.

Множество T не пересекается с множеством . Это следует из того, что любая точка множества имеет по крайней мере одну координату, большую или равную (следствие 1 из теоремы «Если S — произвольная точка m-мерного пространства и — многомерная переменная, то имеет место соотношение , а значит T и не имеют общих точек.

Поскольку T и — выпуклые непересекающиеся области, то существует разделяющая их гиперплоскость такая, что множество T и окажутся в разных полупространствах, определяемых этой гиперплоскостью. Следовательно, существует такое и число c, что уравнение (3) будет уравнением разделяющей гиперплоскости, причем

для ; для . (4)

Покажем, что . Пусть — точка, у которой i-ая координата равна 1, а остальные равны малой величине . Рассмотрим точку . Так как ее максимальная координата равна (следствие 2 из теоремы «Если S — произвольная точка m-мерного пространства и — многомерная переменная, то имеет место соотношение »), то точка . Следовательно,

.

Отсюда следует, что

.

Если , то при и при этом последнее условие дает

. (5)

Введем обозначение

. (6)

Очевидно, что , так как

, .

Кроме того, введем обозначение . (7)

Поделим неравенства (4) на . С учетом (6) и (7) получим

для ;

для . (8)

Рассмотрим точку с координатами , , . Очевидно, что . На основании второго неравенства из (8) получаем

. (9)

Пусть , так что . Тогда

. (10)

Сравнивая (9) и (10), находим (11)

При этом первое из неравенств (8) дает , (12), что и доказывает неравенство (1).

Таким образом, является ценой игры, а и представляют собой оптимальные смешанные стратегии игроков. Теорема доказана.