3.5. Методы решения игр.

Покажем, что любая конечная антагонистическая игра m*n может быть сведена к задаче линейного программирования и, следовательно, решена методами линейного программирования, в частности точными, например симплекс-методом.

Рассмотрим конечную игру G = (X, Y, Q) размера m*n, где множества стратегий X = {x_i}, Y = {y_i} и платежная матрица Q = |q_ij|, i Є 1,m, j Є 1,n заданы.

Поскольку в реальных ситуациях чистых стратегий не бывает, требуется найти решение игры в смешанных стратегиях (добавляется фактор вероятности), то есть цену игры v_p и две оптимальные смешанные стратегии P¹ = (p¹_i) и P² = (p²_i), где P¹и P² – вероятностные векторы, компоненты которых удовлетворяют условиям:

(3.12)

(3.13)

Будем сначала искать оптимальную стратегию P¹ игрока 1. При ее определении будем исходить из свойств оптимальной стратегии, а именно будем учитывать, что эта стратегия должна обеспечить игроку 1 выигрыш не меньший v_p, при любом поведении противника, и равно v_p – при его оптимальном поведении.

Цена игры v_p пока неизвестна. Будем считать, что v_p> 0. Чтобы это условие выполнялось, достаточно, чтобы все элементы платежной матрицы Q = |q_ij| были неотрицательными, то есть q_ij≥ 0. Этого всегда можно добиться, прибавляя ко всем элементам q_ij достаточно большое число M. При этом цена игры увеличится на М, а оптимальные стратегии не изменятся.

Предположим, что игрок 1 применяет свою смешанную стратегию P¹, а игрок 2 – чистую стратегию y_i. Тогда средний выигрыш игрока 1, обозначенный q¹_j, равен

q¹_j = = p¹₁q₁_j+ p¹₂q₂_j+ … + p¹_mq_mj, j Є 1,n (3.14)

Поскольку ищется оптимальная стратегия игрока 1, то его средний выигрыш q¹_j должен удовлетворять условию q¹_j ≥ v_p, откуда следует n условий:

(3.15)

Введем обозначения

L₁= 1 / v_p;

z¹_i = p¹_i/ v_p, i Є 1,m.

С использованием введенных обозначений из (3.12) и (3.15) получаем:

(3.16)

(3.17)

(3.18)

Поскольку игрок 1 стремится максимизировать свой выигрыш (доставить максимум цене игры v_p), то это равносильно требованию минимизировать величину L₁= 1/v_p, то есть равносильно требованию

L₁ = (3.19)

Аналогичным образом можно найти оптимальную стратегию игрока 2.

<<< < Предыдущая 1 2 34 / 44

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
17.07.201971.17 Кб7Rynok_truda_33.doc
#
11.11.201947.54 Кб3sasha.docx
#
17.04.201540.45 Кб86Seminar_2.doc
#
17.04.201586.53 Кб65Stilistika examen.doc
#
17.04.2015201.97 Кб9Stipendialnoe-polozhenie.pdf
#
04.09.201993.7 Кб2Tema_3.doc
#
04.09.201970.66 Кб3Tema_5.doc
#
20.11.2018119.3 Кб1Tema_7_chast_1.doc
#
20.11.2018119.81 Кб1Tema_7_chast_2.doc
#
17.11.201975.26 Кб1Temperament.doc
#
17.04.201527.65 Кб10the article.doc