
- •1.Основные понятия теории игр
- •1.Классификация игр
- •2.Описание игры в развернутой форме
- •3.Бескоалиционные игры
- •4.Приемлемые ситуации и ситуации равновесия в игре
- •5.Стратегическая эквивалентность игр
- •6Антагонистические игры. Общие сведения
- •7.Чистые и смешанные стратегии
- •9.Верхняя и нижняя цены игры при использовании смешанных стратегий
- •10.Основная теорема антагонистических игр.
- •11.Верхние и нижние цены в s-игре
- •12.Теорема о минимаксе
- •12.Геометрическая интерпретация минимакса
- •13.Решение антагонистических игр. Доминирующие и полезные стратегии
- •14.Игры с частными случаями платежных матриц
- •14.Теорема о поведении игроков
- •15.Решение матричных игр
- •17.Линейное программирование для решения матричных игр
- •18.Графическое решение игр 2*n и m*2
- •20.Строго выпуклые игры на единичном квадрате
- •21.Неантагонистические игры
- •21.Бескоалиционные игры
11.Верхние и нижние цены в s-игре
Дальше
будем обозначать S-игру
через
.
Для перехода от игры
к S-игре
вместо пространства смешанных стратегий
второго игрока
необходимо использовать пространство
S-стратегий,
т.е. выпуклую оболочку
.
Обозначим потери второго игрока в S-игре
через
,
тогда S
— игра зависит от P,
и
,
причем потери
должны быть найдены как скалярное
произведение
.
Таким образом, выражение
определяет S-игру.
Функция потерь определяется выражением:
.
Рассмотрим процедуру оценки верхних и нижних цен в S-игре. Если первый игрок применяет смешанную стратегию , то значение его гарантированного выигрыша
.
Обозначим
через
такую стратегию первого игрока, при
которой
достигает максимума:
(эта
нижняя цена игры совпадает с ценой игры
в обычной форме в силу эквивалентности
S-игры
с обычной игрой). Стратегию
называют максиминной
стратегией первого игрока.
Предположим
теперь, что второй игрок применяет
некоторую стратегию
.
При этом значение его проигрыша
.
Тогда второго игрока будет интересовать
стратегия:
.
Стратегию
называют минимаксной
стратегией второго игрока.
Таким образом, максиминная стратегия первого игрока определяет нижнюю цену в S-игре:
.
Аналогично
стратегия
определяет верхнюю
цену в S-игре:
.
Выражения
для
и
можно представить в более удобном виде,
если воспользоваться теоремой.
Теорема.
Если S
— произвольная точка m-мерного
пространства и
— многомерная переменная, то имеет
место соотношение
.
Доказательство.
Пусть
.
Рассмотрим частное значение p,
соответствующее случаю
при
и
при
.
В этом случае
.
Таким образом,
является частным значением скалярного
произведения
,
а значит, подмножеством множества
значений
,
получающихся при всевозможных значениях
p.
На основании теоремы о верхней границе
подмножества находим
.
С
другой стороны, заменяя в выражении для
значения
на максимальное значение
,
получаем
.
Это выражение справедливо при любом p. Сопоставляя два последних выражения приходим к соотношению:
. Теорема доказана.
Если воспользоваться доказанной теоремой, то выражение для B(S) можно переписать в виде
.
Из этого равенства вытекают два следствия:
, т.е. любая точка имеет по крайней мере одну координату, не меньшую, чем верхняя цена игры;
Если в качестве S взять
, то получим:
.
Верхняя цена игры равна максимальной
из координат точки
,
определяющей минимаксную стратегию
второго игрока.
12.Теорема о минимаксе
Возможность нахождения каждым игроком своей наилучшей стратегии основывается на следующей теореме, которая может рассматриваться как доказательство существования решения для конечных игр.
Теорема. Всякая конечная антагонистическая игра имеет цену, и у каждого игрока существует по меньшей мере одна оптимальная стратегия.
Исходные предпосылки. Пусть — конечная игра, а — смешанное расширение этой игры. При доказательстве теоремы удобно вести рассуждения в терминах S-игры, поэтому через обозначим эквивалентную S-игру.
Нижняя
и верхняя цены S-игры
будут равны
и
соответственно, независимо от того,
рассматривают игру G
или эквивалентную ей S-игру
,
причем
.
Для
того, чтобы доказать теорему, достаточно
показать, что
,
так как из сравнения с предыдущим
неравенством будет следовать
,
т.е. что игра имеет цену.
Для доказательства этого неравенства достаточно найти такую смешанную стратегию первого игрока, при которой для всех имеет место
.
(1)
Действительно, если неравенство (1) имеет место, то
.
Таким образом, доказательство теоремы
будет сводиться к доказательству
неравенства (1).
Доказательство.
Рассмотрим множество T,
состоящее из точек
таких, что
.
На рисунке показана область T
для двумерного пространства, которая
в данном случае имеет вид прямоугольного
клина с вершиной, лежащей на прямой,
проведенной из начала координат под
углом
к оси абсцисс. Рассмотрим некоторые
свойства множества T.
Множество
T
является выпуклым.
Рассмотрим произвольные точки
и
этого множества. Уравнение отрезка,
соединяющего эти две точки, будет иметь
вид:
,
,
.
Проектируя это уравнение на i-ую ось и учитывая теорему на стр.14, получаем
(2)
Следовательно, любая точка
рассматриваемого отрезка принадлежит
T
и множество T
выпуклое.
Множество T не пересекается с множеством . Это следует из того, что любая точка множества имеет по крайней мере одну координату, большую или равную (следствие 1 из теоремы «Если S — произвольная точка m-мерного пространства и — многомерная переменная, то имеет место соотношение , а значит T и не имеют общих точек.
Поскольку
T
и
— выпуклые непересекающиеся области,
то существует разделяющая их гиперплоскость
такая, что множество T
и
окажутся в разных полупространствах,
определяемых этой гиперплоскостью.
Следовательно, существует такое
и число c,
что уравнение
(3) будет
уравнением разделяющей гиперплоскости,
причем
для
;
для
. (4)
Покажем,
что
.
Пусть
— точка, у которой i-ая
координата равна 1, а остальные равны
малой величине
.
Рассмотрим точку
.
Так как ее максимальная координата
равна
(следствие 2 из теоремы «Если S
— произвольная точка m-мерного
пространства и
— многомерная переменная, то имеет
место соотношение
»),
то точка
.
Следовательно,
.
Отсюда следует, что
.
Если
,
то
при
и
при этом последнее условие дает
. (5)
Введем обозначение
. (6)
Очевидно,
что
,
так как
,
.
Кроме
того, введем обозначение
. (7)
Поделим
неравенства (4) на
.
С учетом (6) и (7) получим
для
;
для
.
(8)
Рассмотрим
точку
с координатами
,
,
.
Очевидно, что
.
На основании второго неравенства из
(8) получаем
. (9)
Пусть
,
так что
.
Тогда
.
(10)
Сравнивая
(9) и (10), находим
(11)
При
этом первое из неравенств (8) дает
, (12),
что
и доказывает неравенство (1).
Таким
образом,
является ценой игры, а
и
представляют собой оптимальные смешанные
стратегии игроков. Теорема доказана.