Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория игр.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
371.71 Кб
Скачать

Глава п. Чистые и смешанные стратегии

§ 1. Основная теорема теории игр

Придерживаясь максимальной стратегии, игрок А при любом поведении игрока В гарантирует себе выигрыш, который равен нижней цене игры α. Возникает вопрос: нельзя ли гарантировать ему средний выигрыш, больший чем α, если применять не одну - единственную "чистую" стратегию, а чередовать случайным образом несколько стратегий?

Такие комбинированные стратегии, состояния применений нескольких чистых стратегий, чередующихся по случайному закону с определённым отношением частот, в теории игр называются смешанными стратегиями.

Очевидно, каждая чистая стратегия является частным случаем смешанной, в которой все стратегии, кроме одной, применяются с нулевыми частотами, а данная - с частотой 1.

Оказывается, что применяя не только чистые, но и смешанные стратегии, можно для каждой конечной игры получить решение, то есть пару таких (в общем случае, смешанных) стратегий, что при применений их обоими игроками выигрыш будет равен цене игры. А при любом одностороннем отклонении от оптимальной стратегии выигрыш может измениться только в сторону, не выгодную для отклоняющегося.

Высказанное утверждение составляет содержание так называемой основной теоремы теории игр. Эта теорема была впервые доказана фон Нейманом в 1928 г.

Основная теорема теории игр.

Каждая конечная игра имеет, по крайней мере, одно решение (возможно, в области смешанных стратегий).

Выигрыш, получаемый в результате решения, называется ценой игры.

Следствие. Каждая конечная игра имеет цену.

Очевидно, что цена игры v всегда лежит между нижней ценой игры α и верхней ценой игры β: α<v<β.

Введём специальное обозначение для смешанных стратегий. Если, например, наша смешанная стратегия состоит в применении стратегий А1, А2, А3 с частотами р1, р2, р3, причём р123=1, будем обозначать эту стратегию

.

Аналогично смешанную стратегию противника будем обозначать:

,

где q1, q2, q3 - частоты, в которых смешиваются стратегии В1, В2, В3; q1+q2+q3=1.

Оптимальные стратегии, образующие решения игры, будем обозначать SA*, SB*.

Определение. Стратегии, входящие в решение игры, называются активными.

Определение. Игра, в которой все стратегии обеих сторон являются активными, называется полностью усреднённой.

Решение игры обладает замечательным свойством.

Теорема. Если один из игроков придерживается своей оптимальной смешанной стратегией, то выигрыш остаётся неизменным и равным цене игры v независимо от того, что делает другой игрок, если только он не выходит за пределы своих активных стратегий.

§2. Элементарные методы решения игр. Игры 2x2 и 2хп.

Если игра mxn не имеет седловой точки, то нахождение решения есть вообще довольно трудная задача, особенно при больших т и п.

Эту задачу можно упростить, если уменьшить число стратегий, вычёркивая излишние стратегии: дублирующие и заведомо невыгодные.

Рассмотрим, например, игру с матрицей

В

А

В1

В2

В3

В4

А1

1

2

4

3

А2

0

2

3

2

А3

1

2

4

3

А4

4

3

1

0

Стратегия А3 в точности повторяет ("дублирует") стратегию А1 поэтому любую из этих двух стратегий можно вычеркнуть.

Сравнивая почленно строки А1 и A2, видим, что каждый элемент строки А2 меньше (или равен) соответствующего элемента строки А1. Очевидно, мы никогда не должны пользоваться стратегией А2; она заведомо является невыгодной. Вычёркивая А3 и А2, приводим матрицу к более простому виду.

Далее замечаем, что для противника стратегия В3 заведомо невыгодна; вычёркивая её, приводим матрицу к окончательному виду.

В

А

В1

В2

В4

А1

1

2

3

А4

4

3

0

Таким образом, игра 4x4 вычёркиванием дублирующих и заведомо невыгодных стратегий сведена к игре 2x3 .

Замечание. Процедура вычёркивания дублирующих и заведомо невыгодных стратегий всегда должна предшествовать решению игры.

Наиболее простыми типами конечных игр, которые всегда можно решить элементарными способами, являются игры 2x2 и 2хп.

Рассмотрим игру 2x2 с матрицей:

В

А

В1

В2

А1

а11

а12

А2

а21

а22

Здесь могут встретиться два случая:

1. игра имеет седловую точку;

2. игра не имеет седловую точку. Решение

Первый случай. Если игра 2x2 имеет седловую точку, то решение очевидно: это - пара чистых стратегий, пересекающихся в седловой точке.

Замечание. В игре 2x2 наличие седловой точки всегда соответствует существованию заведомо невыгодых стратегий, которые должны быть вычеркнуты при предварительном анализе.

Второй случай. Если седловой точки нет, то α≠β. Требуется найти оптимальную смешанную стратегию игрока А:

.

Она отличается тем свойством, что, каковы бы ни были действия противника (если только он не выходит за пределы своих «полезных стратегий»), выигрыш будет равен цене игры v.

В игре 2x2 обе стратегии противника являются «полезными», - иначе игра имела бы решение в области чистых стратегий (седловую точку).

Значит, если мы придерживаемся своей оптимальной стратегии

, то противник может пользоваться любой из своих чистых стратегий В1, В2, не изменяя среднего выигрыша v.

Отсюда имеем два уравнения:

. (1)

Из которых, принимая во внимание, что p1 + р2 = 1, получим:

. (2)

Цену игры v найдём, подставляя значение р1, р2 в любое уравнение (1). Если цена игры известна, то для определения оптимальной стратегии противника

достаточно одного уравнения, например: , откуда, учитывая, что q1+ q2 = 1, имеем

, q2 = 1- q1 . (3)

Пример. У нас (А) имеется два вида вооружения А1 и А2: у противника (В) -два вида помех: B1 и В2. Вероятность выполнения боевой задачи при различных комбинациях "вооружения" — "помехи" задана матрицей 2x2

В

А

В1

В2

Минимумы строк

А1

0,2

0,8

0,2

А2

0,7

0,3

0,3*

Максимумы столбцов

0,7*

0,8

Найти решение.

Решение

1. α = 0,3; β = 0,7. Игра не имеет седловой точки.

2. По формуле (2) находим:

=

р2 = 1 - p1=1-0,4=0,6

3. Цена игры

v=a11·р1+ a21·р2=0,2·0,4+0,7·0,6=0,5

4. По формуле (З) находим

; q2 = 1- q1=1-0,5=0,5

5. Оптимальные стратегии А и В будут:

S *A=

Вывод. А должен в 40% всех случаях применять вооружение А1, а в 60% -вооружения А2. В должен в половине всех случаев применять помехи В1, а в половине - помехи В2. Если обе стороны, или, по крайней мере, одна из них, будут применять свои оптимальные стратегии, то вероятность выполнения боевой задачи будет равна v = 0,5.