Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Shpory_po_MMPR.docx
Скачиваний:
3
Добавлен:
01.07.2025
Размер:
144.51 Кб
Скачать

11. Матричные игры.

Простейшим вариантом игры является антагонистическая игра, в которой противодействуют две оперирующих стороны (2 игрока), при этом множества различных альтернатив, из которых они выбирают свои решения, конечны. Такая игра называется матричной. М а т р и ч н о й и г р о й называется конечная игра двух лиц с нулевой суммой. Тогда такая игра характеризуется конструкцией

1 * Δ2 , { f1 , f2 }) (13.13)

Участники игры могут выбирать свои решения из конечного множества альтернатив Δ 1 = X = { x i , i = 1,..., m }, Δ 2 = Y = { y j , j = 1,..., n }.

Т.к. игра антагонистическая, то f 1 +f 2 =0. Откуда f 1 = f; f 2 = -f. В такой игре может быть m*n различных исходов, которые характеризуются различными значениями выигрыша первого игрока fij = f(xi,yj). Все эти исходы можно характеризовать прямоугольной матрицей выигрышей F (платежная матрица), элементы f ij которой характеризуют выигрыш первого игрока и, соответственно, проигрыш второго при выборе игроками альтернатив, номера которых соответствуют номеру строки i и столбца j этой матрицы. Итак, совокупность пар (x i ,y j ) характеризует множество исходов игры, а матрица, содержащая элементы соответствующие значениям выигрыша, называется платежной матрицей и имеет следующий вид

12. Чистые и смешанные стратегии

Стратегия– ход, приводящий к наибольшему выигрышу. Множество таких ходов у первого игрока равно X и его часто называют множеством чистых стратегий первого игрока. На каждую i-ю стратегию первого игрока, второй игрок ответит j-ой стратегией, которая минимизирует выигрыш первого игрока от применения его стратегии. Тогда гарантированный выигрыш первого игрока от применения i-ой чистой стратегии при использовании всех возможных стратегий второго игрока будет равен Fi(-) = minfij, j=1,…,n. В этих условиях для первого игрока наилучшим (оптимальным) поведением представляется выбор стратегии, максимизирующей значение гарантированного выигрыша Fi(-) , соответственно наилучшей стратегией является стратегия, на которой достигается

Это для первого игрока гарантированный выигрыш (при рациональном его поведении меньше этого значения он выиграть не может), который называется нижней ценой игры. Стратегии, доставляющие первому игроку выигрыш, равный нижней цене игры называются гарантирующими. Второй игрок, поступая аналогично, путем выбора своих гарантирующих стратегий может свести свой проигрыш к гарантированному минимуму

который называется верхней ценой игры. Для первого игрока F (+) представляет собой максимально возможный выигрыш при рациональном поведении второго игрока. Обычно принято оба вида гарантирующих стратегий для краткости называть минимаксными.

Если верхняя цена игры равна нижней F (-) = F (+) = С, то игру называют игрой, р а з р е ш и м о й в ч и с т ы х с т р а т е г и я х, а значения верхней и нижней цены игры называют просто ц е н о й игры

.

Соответствующие гарантирующие стратегии в этой ситуации являются оптимальными и целесообразно выбирать именно такие стратегии. Так как данная ситуация соответствует наличию седловой точки у платежной функции f(x,y) (функции двух векторных аргументов), то и игру называют и г р о й с с е д л о в о й т о ч к о й. Причем седловая точка определяется парой оптимальных чистых стратегий. Характерной особенностью такой игры является устойчивость поведения игроков, которая заключается в том, что любое отклонение одного из участников игры от своей оптимальной стратегии может привести только к большому проигрышу (в лучшем случае выигрыш останется без изменений).

В ситуациях, когда игра не разрешима в чистых стратегиях, выбор оптимальной стратегии становится неопределенным.

С м е ш а н н о й с т р а т е г и е й первого игрока называется упорядоченная последовательность m чисел p = (p 1 ,p 2 ,.. .,p m ) т , удовлетворяющих условиям

При этом числа p i , i=1,...,m интерпретируются как вероятности выбора i-ой чистой стратегии на каждом шаге игры, или как относительная частота выбора этой стратегии на нескольких шагах. Аналогично смешанной стратегии первого игрока вводится смешанная стратегия второго игрока q = ( q 1 ,q 2 ,...,q n ) т .

О с н о в н а я т е о р е м а т е о р и ии г р (теорема о минимаксе). Любая матричная игра разрешима в смешанных стратегиях. Таким образом, у первого игрока (соответственно и у второго игрока) с у щ е с т в у е т оптимальная смешанная стратегия, применение которой позволяет максимизировать средний выигрыш в многошаговой матричной игре.

Чистые стратегии, которым в оптимальной смешанной стратегии соответствуют нулевые компоненты называются п а с с и в н ы м и (неактивными) чистыми стратегиями. Чистые стратегии, которым в оптимальной смешанной стратегии соответствуют компоненты большие нуля, называютсяа к т и в н ы м и стратегиями.

Для выделения пассивных стратегий вводится понятие доминирующих (доминируемых) стратегий. Чистая стратегия первого игрока с номером i доминирует чистую стратегию с номером k, если для элементов платежной матрицы выполняется условие f ij ≥ f kj , j = 1,...,n, и хотя бы одно неравенство строгое. Тогда говорят, что i-ая стратегия, доминирует стратегию k-ую, или k-ая стратегия, доминируется стратегией i-ой.

Доминируемые стратегии всегда пассивны, и наоборот, если стратегия пассивна, то она доминируется какой-либо чистой стратегией, или линейной комбинацией стратегий.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]