Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Материал по ТПР (1).doc
Скачиваний:
1
Добавлен:
05.01.2020
Размер:
673.79 Кб
Скачать

2.2. Нижняя и верхняя цена игры. Принцип минимакса

Рассмотрим некоторую игру, определяемую нижеприведенной платежной матрицей, и рассмотрим случай использования в этой игре «чистых» стратегий.

В1

В2

...

Вn

A1

a11

а12

а1n

A2

а21

а22

а2n

...

Am

am1

аm2

аmn

Дополним платежную матрицу столбцом с элементами 1, 2, …, m, где i = min ij (минимизация по j) и строкой с элементами 1, 2, …, n,

где j = max ij.минимизация по i ).

= max i или = max min ij - нижняя цена игры - так называемый максимин.

Оказывается, что при любом поведении игрока В игрок А имеет выигрыш не меньший, чем . Таким образом это оценка снизу для результата игры игрока А, если в игре исполь­зуются «чистые» стратегии.

Аналогичные рассуждения можно провести для игрока В и ввести

= min j или = min max ij - называют минимакс или верхняя цена игры. Придерживаясь «чистой» стратегии, соответствующей минимаксу, игрок В может быть уверен, что проиграет не больше .

Принцип, определяющий игрокам выбор максиминной и ми­нимаксной стратегий, называется принципом минимакса.

Рассмотрим игру, характеризующуюся «платежной матрицей»:

В1

В2

ВЗ

А1

2

-3

4

-3

А2

-3

4

-5

-5

A3

4

-5

6

-5

4

4

6

Для этой игры = -3, = 4.

Максиминная стратегия игрока А гарантирует, что игрок А проиграет не более 3 руб., минимаксная стратегия игрока В гаран­тирует, что он проиграет не больше 4 руб.

Для рассматриваемой игры минимаксные стратегии неустой­чивы.

Действительно, пусть Игрок В выбрал стратегию В1, тогда, поняв это, игрок А выберет A3 и будет выигрывать 4 руб. На это игрок В может ответить стратегией В2 и будет выигрывать 5 руб. На это игрок А ответит стратегией А2 и будет выигрывать 4 руб. и т.д.

В нашем случае соответствующие минимаксные стратегии иг­роков неустойчивы, и могут быть изменены после поступления ин­формации о поведении противника.

Однако, существуют игры, для которых значения максимина и минимакса совпадают. При этом минимаксные стратегии игроков А и В («чистые стратегии») являются устойчивыми стратегиями.

В платежной матрице такой игры имеется элемент, который является одновременно минимальным в своей строке и максималь­ным в соответствующем столбце. Такой элемент называют «седловой точкой», а соответствующую игру - игрой с «седловой точкой».

Для игры с «седловой точкой» минимаксные стратегии игро­ков А и В являются оптимальными стратегиями, т.е. если один игрок придерживается своей минимаксной стратегии, то для другого игрока не может быть выгодным отклоняться от своей минимаксной стратегии.

Для игры с «седловой точкой» минимаксные стратегии обла­дают устойчивостью.

Одним из фундаментальных результатов «Теории игр» являет­ся доказательство факта, что «игры с полной информацией» явля­ются играми с «седловой точкой» (к таким играм относятся, напри­мер, шашки, шахматы, крестики-нолики и т.д.).

«Игры с полной информацией» - это игры, в которых каждый игрок при каждом личном ходе знает результаты всех предыдущих ходов - как личных, так и случайных. Таким образом, доказано, что любая «игра с полной информацией» имеет «седловую точку» и, следовательно, оптимальное решение в «чистых стратегиях». Это сильный результат, если учитывать, что класс игр с полной ин­формацией достаточно велик.

Другим интересным фундаментальным результатом «Теории игр» является утверждение, что для каждой «конечной игры» мож­но в классе «смешанных стратегий» найти пару устойчивых опти­мальных стратегий для игроков А и В, обладающих свойством -если один из игроков придерживается своей оптимальной страте­гии, то другому не может быть выгодно отступать от своей (здесь оптимальные стратегии смешанные).

Рассмотренный материал из «Теории игр» является очень кратким введением, позволяющим почувствовать специфику задач этого раздела математики, получить представление об используемом аппарате и сложности задач данной области.