Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Theory_antagon_igr.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.09 Mб
Скачать

1.1.2. Смешанные стратегии

Если игра не имеет седловой точки, то применение чистых стратегий не даст оптимального решения игры. В этом случае применяют смешанные стратегии.

Определение. Смешанная стратегия игрока есть вероятностное распределение на множестве его чистых стратегий.

В случае, когда игрок А имеет p чистых стратегий смешанная стратегия представляет собой вектор удовлетворяющий условиям:

(1.3)

(1.4)

Аналогично, вектором удовлетворяющим условиям

(1.5)

(1.6)

определяется смешанная стратегия игрока В.

Числа и можно интерпретировать как вероятности использования стратегий первым игроком и - вторым игроком. Чистые стратегии являются частным случаем смешанной стратегии, задаваемой единичным вектором.

Функцией выигрыша, или платежной функцией игры с матрицей при применении игроком А смешанной стратегии , а игроком В – смешанной стратегии называется математическое ожидание выигрыша игрока А (проигрыша В), подсчитываемое по формуле

(1.7)

Стратегии называются оптимальными, если выполняются неравенства

(1.8)

для любых х из множества Х смешанных стратегий игрока А и любых - множества смешанных стратегий игрока В.

Таким образом, если игрок А применяет свою оптимальную смешанную стратегию , то ему всегда гарантирован средний выигрыш , как бы при этом ни выбирал игрок В различные свои смешанные стратегии. Аналогично, применение игроком В своей оптимальной смешанной стратегии обеспечивает ему проигрыш не более, чем при любых смешанных стратегиях противника.

Совокупность оптимальных стратегий называется оптимальным решением, или просто решением игры, а значение платежной функции при этом – ценой игры

(1.9)

Фундаментальная теорема фон Неймана утверждает, что каждая матричная игра с нулевой суммой имеет решение в смешанных стратегиях.

Упражнение 1.3

Доказать, что цена игры удовлетворяет соотношениям:

Упражнение 1.4

Записать платежную функцию для игры, задаваемой матрицей . Определить цену игры и проверить справедливость неравенств (1.8).

Упражнение 1.5

Рассчитать величину платежа для игр, заданных матрицами примера 1.1 и упражнения 1.1 при

Упражнение 1.6

Доказать, что решение игры не измениться, если ко всем элементам платежной матрицы прибавить некоторое постоянное число С. Как при этом измениться цена игры

1.2. Вычисление оптимальных стратегий

Исследование игры обычно начинается с исключения в платежной матрице заведомо невыгодных и дублирующих стратегий. После этого упрощенную матрицу проверяют на наличие в ней седловой точки, если таковая имеется, это позволяет сразу же определить решение и цену игры.

Если седловой точки нет, то переходят к определению оптимальных смешанных стратегий.

1.2.1. Доминирование

Определение. Пусть дана матрица ; будем говорить, что i-я строка доминирует j-ю строку, если для всех и по крайней мере для одного

Аналогично, будем говорить, что k-й столбец доминирует l-й столбец, если для всех и по крайней мере для одного

Короче, говорят, что одна чистая стратегия (представленная своей строкой или столбцом) доминирует другую чистую стратегию, если выбор первой (доминирующей) стратегии по крайней мере не хуже выбора второй (доминируемой) стратегии, а в некоторых случаях и лучше. Отсюда следует, что игрок всегда может обойтись без доминируемых стратегий и использовать только недоминируемые стратегии. Более точно, справедлива следующая теорема.

Теорема. Пусть - платежная матрица игры, и пусть строки матрицы доминируются. Тогда игрок А имеет такую оптимальную стратегию , что ; кроме того, любая оптимальная стратегия для игры, получающейся в результате удаления доминируемых строк, будет так же оптимальной стратегией для исходной игры.

Аналогичная теорема справедлива и для доминирования столбцов; общий результат этих теорем состоит в том, что все доминируемые строки и столбцы могут быть отброшены, а это позволяет иметь дело с меньшей матрицей.

Пример 1.3

Рассмотрим игру с матрицей Ясно, что второй столбец доминирует четвертый. Отсюда следует, что игрок В никогда не будет использовать свою четвертую стратегию, а поэтому можно не обращать на нее внимания и рассматривать матрицу

В этой матрице третья строка доминирует первую. Удаляя первую строку, получаем а в этой матрице третий столбец доминируется вторым. Следовательно, исходная матрица сводится к матрице и нужно искать оптимальные стратегии только для малой матричной (22)-игры. Такие игры рассматриваются в следующем пункте.

Упражнение 1.7

Исследовать игры, заданные следующими матрицами:

1)

2)

3)

4)

Упражнение 1.8

Провести возможные упрощения платежной матрицы в следующих задачах:

1)

2)

3)

4)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]