Скачиваний:
11
Добавлен:
28.06.2014
Размер:
25.13 Кб
Скачать

Математическая модель Платежная матрица. Принцип минимакса 

           Рассмотрим конечную игру, в которой игрок А («мы») имеет m стратегий, а игрок В(«противник») — n стратегий. Такая игра называется   игрой m x n. Будем обозначать наши стратегии А 1, А2, ..., Аm; стратегии  противника — В1,B2,...,Вn.  Предположим, что каждая сторона выбрала определенную стратегию: мы выбрали Ai, противник — Вj .Если игра состоит только из личных ходов, то выбор стратегий Ai, Bj однозначно определяет исход игры — наш выигрыш (положительный или отрицательный); обозначим его aij

         Предположим, что нам известны значения aij при каждой паре стратегий. Эти значения можно записать в виде прямоугольной таблицы (матрицы), строки которой соответствуют нашим стратегиям ( Аi ), а столбцы — стратегиям противника (Bj):

  Ai\Bj

В1 

В2 

... 

Вn

A1  

A11 

A12 

... 

A1n 

A2 

A21 

A22 

... 

A2n 

... 

... 

... 

... 

... 

Am 

Am1 

Am2 

... 

Amn 

 

Такая таблица называется платежной матрицей или просто матрицей игры.

      Заметим, что построение платежной матрицы, особенно для игр с большим количеством стратегий, может само по себе представлять весьма непростую задачу. Например, для шахматной игры число возможных стратегий так велико, что построение платежной матрицы (даже с привлечением вычислительных машин) является пока практически неосуществимым. Однако в принципе любая конечная игра может быть приведена к матричной форме.

       Рассмотрим игру m x n. Буквой i будем обозначать номер нашей стратегии, буквой j – номер стратегии противника.  вопрос о смешанных стратегиях и будем рассматривать пока только чистые. Поставим задачу: определить наилучшую среди наших стратегий A1, А2, ..., Аm. Проанализируем последовательно каждую из них, начиная с А1 и кончая Аm. Выбирая A1, мы должны рассчитывать, что противник ответит на нее той из стратегий , для которой наш выигрыш минимален. Найдем минимальное из чисел аij в строке и обозначим его ai: (знак  обозначает минимальное значение данного параметра при всех возможных j). 

       (1)

Выпишем числа аi (минимумы строк) рядом с матрицей справа в виде добавочного столбца 

A\B

B1

В2

... 

Вn

Ai

(минимумы  по

строкам)

А1

A11

A12

... 

A1n

A1

А2

A21

A22

... 

A2n

a2

... 

... 

... 

... 

... 

... 

Аm

Am1

Am2

... 

Amn

Am

Bj

B1

B2

... 

Bn

(максимумы по столбцам)  

          Выбирая какую-то стратегию Аi, мы должны рассчитывать на то, что в результате разумных действий противника мы выиграем только ai. Естественно, действуя наиболее осторожно (т. е. избегая всякого риска), мы должны предпочесть другим ту стратегию, для которой число ai максимально. Обозначим это максимальное значение а:

или принимая во внимание формулу (1), 

 (2) 

 

а называется нижней ценой игры, иначе — максиминным выигрышем или максимином. Та стратегия игрока А, которая соответствует максимину а, называется максиминной стратегией. 

        Очевидно, если мы будем придерживаться максиминной стратегии, то нам при любом поведении противника гарантирован выигрыш, во всяком случае, не меньший а. Поэтому величина a и называется «нижней ценой игры». Это — тот гарантированный минимум, который мы можем себе обеспечить, придерживаясь своей наиболее осторожной («перестраховочной») стратегии.

        Очевидно, аналогичное рассуждение можно провести и за противника В. Он заинтересован в том, чтобы обратить наш выигрыш в минимум; значит, он должен просмотреть все свои стратегии, выделяя для каждой из них максимальное значение выигрыша. Выпишем внизу матрицы (4,2) максимальные значения ai. по столбцам:

и найдем их минимальное: 

(3) 

 

      Величина B называется верхней ценой игры, иначе минимаксным выигрышем или минимаксом. Соответствующая выигрышу В стратегия противника называется его минимаксной стратегией. Придерживаясь своей наиболее осторожной минимаксной стратегии, противник гарантирован, что в любом случае он проиграет не больше В.

 

Соседние файлы в папке chapter4