Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Метод_ЭММ_Теория_Игр6.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
884.22 Кб
Скачать

Решение игры в смешанных стратегиях

Если игра не имеет решения в чистых стратегиях, то решение ищется в смешанных стратегиях. Под смешанными стратегиями понимают векторы:

X = ( p1,...., pm), Y= ( q1,....,qn),

где pi и qj   вероятности выбора чистых стратегий Аi и Вj игроками А и В, т.е.:

Функция   называется платежной функцией. Она является средним выигрышем игрока А, если А выбирает стратегию X , а игрок В  стратегию Y, при многократном повторении игры.

Решением игры в смешанных стратегиях называется тройка (X0Y0 ), удовлетворяющая условию:

,

где X и Y  любые смешанные стратегии.

Величина = называется ценой игры, а стратегии X0 и Y0  оптимальными.

Векторы X0 и Y0, удовлетворяющие указанному условию, называются седловой точкой функции . Платежная функция всегда имеет седловую точку, и, следовательно, игра всегда имеет решение в смешанных стратегиях. Цена игры - это значение платежной функции в седловой точке. При этом можно также показать, что:

= H(X0, Y0) = H(X,Y)= H(X, Y).

Говорят, что k- я строка матрицы доминирует l-ю строку, если akj alj и akj > alj , хотя бы для одного j . Аналогично, k-й столбец доминирует l-й столбец, если aik ail и хотя бы для одного i aik < a il.

Доминируемые строки и столбцы можно исключить, поскольку они соответствуют невыгодным чистым стратегиям.

Стратегии, оптимальные для игры с платежной матрицей будут оптимальными и для игры с матрицей . Это свойство позволяет сводить платежные матрицы к матрицам с положительными элементами.

Активными называются чистые стратегии, которые входят в состав оптимальных смешанных стратегий с ненулевыми вероятностями.

Для того, чтобы тройка (X, Y, ) была решением игры, необходимо и достаточно выполнение следующих условий:

(5.1)

(5.2)

. (5.3)

(5.4)

(5.5)

(5.6)

Решая систему неравенств (5.1)  (5.6), можно найти решение игры. Решение игры равносильно решению пары задач линейного программирования:

Первая задача.

Обозначим ; тогда равенство (5.1) перепишется в виде

(5.7)

неравенство (5.2) принимает вид

(5.8)

а неравенство (5.3) принимает вид

. (5.9)

Оптимальная стратегия для игрока А должна максимизировать значение , следовательно минимизировать значение .

Таким образом, целевая функция имеет вид:

(5.10)

Окончательно задача ЛП формулируется так: найти минимум (5.10) при условии (5.8) и (5.9)

Вторая задача.

Обозначим ; тогда равенство (5.4) перепишется в виде

(5.11)

неравенство (5.5) принимает вид

(5.12)

а неравенство (5.3)

. (5.13)

Оптимальная стратегия для игрока B должна минимизировать значение , следовательно, максимизировать значение .

Таким образом, целевая функция имеет вид:

(5.14)

Окончательно задача ЛП формулируется так: найти максимум (5.14) при условии (5.12) и (5.13).

После того, как игра решена, т.е. получена тройка (p1, p2 ,..., pi,..., pn; q1, q2,..., qj,..., q; v), возникает вопрос о практическом применении полученного решения. Для игрока А оно состоит в том, что нельзя сообщать противнику, какая полезная стратегия будет применяться в каждой конкретной игре, а ее выбор следует осуществлять с помощью какого-либо генератора случайных чисел (жребий, таблица случайных чисел, каких-либо функций в алгоритмических языках генерирующих значения случайных величин), реализующего распределение (p1, p2 ,..., pi,..., pn). Для игрока В все эти соображения аналогичны с заменой распределения на (q1, q2,..., qj,..., qm). В случае, если игра многократно повторяется и игроки придерживаются своих оптимальных стратегий, то средний выигрыш равен .