Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный университет приборостроения и информатики

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Метод. указания к контр. работе по МПУР.doc

Скачиваний:

Добавлен:

01.05.2025

Размер:

5.81 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 45 / 105 6 7 8 9 10 > Следующая >>>

Методы и модели решения игровых задач Принцип минимакса

Рассмотрим конечную парную игру с нулевой суммой. Игрок I имеет m стратегий (А₁, А₂, ..., А_m), а игрок II — n стратегий (В₁, В₂, ..., В_n). Такая игра называется игрой размерностью m  n. Пусть каждая сторона определилась с выбором стратегии: игрок I — A_i (i = 1, 2, ..., m), игрок II — B_j (j = 1, 2, ..., n). Выигрыши игрока I — (A_i, B_j) и игрока II — (A_i, B_j) удовлетворяют соотношению (A_i, B_j) + (A_i, B_j) = 0.

Если игра состоит только из личных ходов, то выбор стратегии (A_i, B_j) однозначно определяет исход игры , т.е. выигрыш игрока I. Если игра содержит также случайные ходы, то выигрыш при паре стратегий (A_i, B_j) есть величина случайная, зависящая от исходов всех случайных ходов. В этом случае ожидаемый выигрыш — это среднее значение (математическое ожидание). Предположим, что значения a_ij известны для каждой пары стратегий (A_i, B_j). Построим таблицу, строки которой соответствуют стратегиям игрока I, а столбцы — стратегиям игрока II, т.е. платежную матрицу. Каждый элемент (a_ij > 0) матрицы определяет величину выигрыша игрока I и проигрыш игрока II. Цель игрока I — максимизировать свой выигрыш, а игрока II — минимизировать свой проигрыш. Платежная матрица имеет следующий вид:

I \ II B₁ B₂ ... B_j ... B_n

A₁ a₁₁ a₁₂ ... a_1j ... a_1n ₁

A₂ a₂₁ a₂₂ ... a_2j ... a_2n ₂

... ... ... ... ... ... ... ...

A_i a_i1 a_i2 ... a_ij ... a_in _i

... ... ... ... ... ... ... ...

A_m a_m1 a_m2 ... a_mj ... a_mn _m

Β_j ₁ ₂ ... _j ... _n

Задача состоит в определении:

наилучшей (оптимальной) стратегии игрока I из стратегий A₁, A₂, ..., A_m;
наилучшей (оптимальной) стратегии игрока II из стратегий B₁, B₂, ..., B_m.

Для решения задачи применяется принцип, согласно которому участники игры одинаково разумны и каждый из них делает все для того, чтобы добиться своей цели.

Проанализируем последовательно каждую стратегию игрока I. Если игрок I выбирает стратегию А₁, то игрок II может выбрать такую стратегию B_j, при которой выигрыш игрока I будет равен наименьшему из чисел a₁_j:

Выбирая стратегию A_i, игрок I должен рассчитывать на то, что в результате разумных действий игрока II он не выиграет больше, чем _i. Поэтому игрок I должен выбрать ту стратегию, для которой _i максимально:

Величина  — гарантированный выигрыш, который может обеспечить себе игрок I при любом поведении игрока II. Величина  называется нижней ценой игры или максимином, а стратегия А_i игрока I, обеспечивающая получение нижней цены игры, называется максиминной чистой стратегией. При этом игрок I при любом поведении игрока II обеспечивает себе выигрыш, не меньше : _i   (i = 1, 2, ..., m).

Игрок II заинтересован в том, чтобы уменьшить свой проигрыш, т.е. обратить выигрыш игрока I в минимум. Для выбора оптимальной стратегии он должен найти максимальное значение выигрыша в каждом столбце:

и среди этих значений выбрать наименьшее: .

Величина  называется верхней ценой игры или минимаксом. Стратегия игрока II, обеспечивающая получение верхней цены игры, называется минимаксной чистой стратегией. Применяя ее, игрок II проиграет не больше  при любых действиях игрока I:

_j   (j = 1, 2, ..., n), причем всегда справедливо неравенство   .

Таким образом, придерживаясь максиминной стратегии A_i, игрок I желает получить выигрыш не менее  не зависимо от действий игрока II, а игрок II, придерживаясь минимаксной стратегии B_j, гарантирует себе проигрыш не больше .

Принцип, диктующий игрокам соответствующих стратегий (максиминной и минимаксной), в теории игр называется принципом минимакса.

Пример 1. Дана платежная матрица. Найти решение игры: определить нижнюю и верхнюю цены игры и минимаксные стратегии:

I \ II B₁ B₂ B₃ B₄ 

A₁ 5 3 8 2 2

A ₂ 1 6 4 3 1

A ₃ 9 5 4 7 4

Β_j 9 6 8 7

Таким образом, нижней цене игры ( = 4) соответствует стратегия A₃ игрока I. Выбирая эту стратегию, игрок I достигнет выигрыша не меньше 4 при любом поведении игрока II. Верхней цене игры ( = 6) соответствует стратегия игрока II — В₂. Эти стратегии являются минимаксными. Если обе стороны будут придерживаться этих стратегий, выигрыш будет равен а₃₃= 4.

Существуют матричные игры, для которых нижняя цена игры равна верхней, т.е.  = . Такие игры называются играми с седловой точкой.

В этом случае  =  =  называется чистой ценой игры, а стратегии игроков и , позволяющие получить это значение — оптимальными. Пара называется седловой точкой матрицы, так как элемент одновременно является минимальным в i-й строке и максимальным в j-м столбце. Оптимальные стратегии и и чистая цена являются решением игры в чистых стратегиях, т.е. без привлечения механизма случайного выбора.

Пример 2. пусть задана платежная матрица. Найти нижнюю и верхнюю цены игры.

I II B₁ B₂ B₃ 

A₁ 5 1 2 1

A₂ 2 6 2 2

A₃ 3 4 3 3

 5 6 3

Следовательно  =  =  = 3.

Седловой точкой является пара альтернатив (А₃, В₃).

<<< < Предыдущая 1 2 3 45 / 105 6 7 8 9 10 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
17.09.20191.03 Mб30Металловеденье.docx
#
01.04.2025321.02 Кб3Метод рекоменд по напис реф РвУГТСМ.doc
#
09.04.20152.82 Mб23МЕТОД УКАЗАНИЯ К КУРСУ П.У..doc
#
01.07.2025254.98 Кб0Метод указания-ФМ.doc
#
01.05.2025739.33 Кб3Метод. для практич. для всех с.doc
#
01.05.20255.81 Mб1Метод. указания к контр. работе по МПУР.doc
#
06.09.2019445.95 Кб16Метод.по мат.стат.doc
#
01.05.2025633.34 Кб0Метод.указания к лаб.практикуму .doc
#
01.07.2025164.35 Кб1МЕТОД.УКАЗАНИЯ КР 2014-15 — English.doc
#
01.07.2025246.78 Кб1МЕТОД.УКАЗАНИЯ КР 2014-15.doc
#
11.11.2019269.31 Кб3Метод_дом_контр_Логистика_обновление.doc