Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория систем и системный анализ.doc
Скачиваний:
29
Добавлен:
08.12.2018
Размер:
764.93 Кб
Скачать

5.2 Платежная матрица

Рассмотрим конечную игру, в которой игрок A имеет m-стратегий, а игрок B-конкурент n-стратегий. Такая игра называется m x n игрой. Стратегии: A1, A2, …, Am; B1, B2, …, Bn – конкурент.

Предположим, что «мы» выбрали стратегию Ai, а конкурент стратегию Bj. Если игра состоит только из личных ходов, то выбор стратегий Ai и Bj однозначно определяют исход игры: «нам» выигрыш , которое может быть как больше нуля, так и меньше нуля.

Если игра состоит как из личных, так и из случайных ходов, то выигрыш при паре Ai и Bj – есть величина случайная, зависящая от исходов всех случайных ходов. В этом случае оценка выигрыша является математическим ожиданием случайного выигрыша.

Предположим, что нам известно при каждой стратегии. Эти значения можно записать в виде таблицы (матрицы):

Ai/Bj

B1

B2

Bn

A1

A2

Am

Такая таблица называется платежной матрицей или матрицей игры.

5.3 Нижняя и верхняя цена игры. Принцип min и max

Обозначим буквой i – номер нашей стратегии, а j – номер стратегии противника. Будем рассматривать чистые стратегии.

Поставим задачу определить наилучшую среди наших стратегий A1, A2, … Am. Для этого проанализируем каждую из них, выбирая Ai рассчитывая при этом, что противник будет отвечать на нее Bj, при которой нам выигрыш - минимален. Найдем минимальное из в i строке и обозначим его .

Выбирая Ai, мы должны рассчитывать на то, что в результате разумных действий мы выигрываем, только . Естественно действуя наиболее осторожно избегая, риска, мы должны предложить другим эту стратегию, при которой максимально. Обозначим это максимальное значение через , или.

Величина называется нижней ценой игры или максимином max min . Та стратегия Ai, которая обеспечивает максимин для игрока A, называется максиминной стратегией. Если мы будем придерживаться этой стратегии, то при любом поведении противника гарантирован выигрыш не меньше чем .

Аналогичные рассуждения можно провести для конкурента B. Он заинтересован в том, чтобы обратить нам выигрыш в минимальный. Значит, он должен просмотреть все свои стратегии, выделяя для каждой из них максимальное значение выигрыша.

Вынесем внизу таблицы максимальные значения по столбцам и найдем их минимальные значения, то есть или .

Величина называется верхней ценой игры – минимакс, стратегия – минимаксная стратегия.

Придерживаясь наиболее осторожной минимаксной стратегии, конкурент гарантирует, что он проиграет не более чем .

Принцип осторожности, диктующий игрокам выбор соответствующей стратегии (минимаксной, максиминной), является в теории игр основным и называется принципом минимакса.