Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
В.И.Воловач. УМКД по дисц. Теория принятия реше...doc
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
19.53 Mб
Скачать

2.3. Матричные игры

2.3.1. Основные понятия теории игр

Книга Неймана и Моргенштерна «Теория игр и экономического поведения» вышла в 1944 году − это год рождения теории игр.

Теория игр занимается разработкой различного рода рекомендаций по принятию решений в условиях конфликтной ситуации. Такие игры называются антагонистическими. В математике конфликтные ситуации представляют упрощённой моделью как игру двух, трёх и более числа игроков. Игра − это действительный или формальный конфликт, в котором имеется несколько участников, каждый из которых стремится к достижению собственных целей. Математическая модель конфликтной ситуации называется также игрой; стороны, участвующие в конфликте, − игроками, а исход конфликта − выигрышем. Для каждой формализованной игры вводят правила, которые устанавливают допустимые действия каждого игрока в процессе игры.

Игра называется парной, если в ней участвуют два игрока, и множественной, если число игроков больше двух. Игра называется игрой с нулевой суммой, если сумма выигрышей всех игроков в каждой партии равна нулю.

Стратегией игрока называется совокупность правил, определяющих выбор его действия при каждом личном ходе в зависимости от сложившейся на данный момент времени ситуации. Если число стратегий у каждого из игроков конечно, игра называется конечной, если число стратегий − бесконечно, то бесконечной.

Далее будем рассматривать парные конечные игры. Для того чтобы решить игру, или найти решение игры, следует выбрать для каждого игрока стратегию, которая удовлетворяет условию оптимальности. Оптимальным называется такой результат игры, когда при многократном повторении игры один из игроков получает максимально возможный средний выигрыш, а второй придерживается любой своей стратегии.

Вместе с тем, при выполнении условия оптимальности игры второй игрок должен иметь при многократном повторении игры минимально возможный средний проигрыш, если первый игрок придерживается своей стратегии. Одновременно выиграть в антагонистической игре оба игрока не могут, поэтому в начале игры распределяют роли выигрывающего и проигрывающего игроков между участниками игры. Стратегии, обеспечивающие максимум выигрыша одного игрока или минимум проигрыша второго игрока, называются оптимальными.

Оптимальные стратегии должны также удовлетворять условию устойчивости, т. е. любому из игроков должен быть не выгоден отказ от своей оптимальной стратегии в игре.

Целью теории игр является определение оптимальной стратегии для каждого игрока.

Рассмотрим парную конечную игру с нулевой суммой. При нулевой сумме игры разница между абсолютными значениями выигрыша одного игрока и проигрыша другого полагается равной нулю. Пусть игрок А располагает m личными стратегиями, которые обозначим A1, А2, …, Аm, а игрок B имеет n личных стратегий − B1, B2, …, Bn. Причём выигрыш игрока А полагается равным проигрышу игрока B и наоборот. Такая игра имеет размерность m×n.

В результате выбора игроками пары стратегий из всех возможных для них стратегий, а именно

однозначно определяется исход игры, т. е. выигрыш aij игрока А и проигрыш (−aij) игрока В.

Если значения выигрышей aij известны для любой пары стратегий (Ai, Bj), то матрица P, составленная из этих выигрышей, называется платёжной матрицей, или матрицей игры:

Строки матрицы P соответствуют стратегиям первого игрока, а столбцы − стратегиям второго.

Игру, определяемую матрицей P, имеющей m строк и n столбцов, называют конечной игрой размерности n×m.

Игра, для которой можно составить матрицу игры, называется матричной.

Платёжную матрицу игры в дальнейшем, когда этого потребует необходимость, будем записывать и в виде расширенной таблицы (табл. 3.1).

Таблица 3.1

Стратегии

первого игрока

Стратегии второго игрока

B1

B2

Вn

A1

a11

a12

a1n

А2

a21

a22

a2n

Am

am1

am2

amn

Пример 3.1. Составить платёжную матрицу для следующей игры.

Игроки А и В одновременно и независимо друг от друга записывают числа 1, 2 или 3. Размер выигрыша определяется суммой названных чисел. При этом, если число чётное, выигрывает игрок А, нечётное − игрок В.

Решение. Если игроки записывают по единице, то сумма чётная и выигрыш игрока А равен 2, если один из игроков записывает единицу, а другой − двойку, то сумма нечётная и выигрыш игрока В составляет 3, а выигрыш игрока А является проигрышем в ту же сумму, т. е. его выигрыш равен (−3).

Рассуждая так же и далее, получаем следующую матрицу платежей для этой игры.

В1

В2

B3

A1

2

−3

4

A2

−3

4

−5

A3

4

−5

6

или

Пример 3.2. Составить платёжную матрицу для следующей парной игры.

Игроки А и В одновременно и независимо друг от друга произносят слова «сосна» и «орех». Если слова, сказанные игроками совпадают, то банк игры забирает игрок А, если игроки произносят отличающиеся друг от друга слова, то банк забирает игрок В.

Решение. У каждого игрока в этой игре по две стратегии. Если выигрыш банка обозначим платежом 1, а проигрыш − платежом (−1), то получим матрицу платежей

Пример 3.3. (Игра полковника Блотто).

Город А имеет двое ворот. В городе находится гарнизон, состоящий из 5 полков. На город нападает противник, имеющий 4 таких же полка. Защитники выигрывают борьбу за ворота, если количество их полков больше, чем количество нападающих на них полков. Выигрыш по одним воротам равен числу, на единицу большему количества нападающих полков (сохранены ворота, и противник «лишился» своих полков, поскольку они заняты нападением на эти ворота). Если количество полков защитников меньше, чем количество нападающих полков, то проигрыш защитников по одним воротам равен (−1) − ворота потеряны. Если количество полков защитников равно количеству нападающих, то выигрыш защитников по этим воротам равен нулю: ничья, ворота никому не достались. Общий выигрыш защитников города, записываемый в матрицу платежей, равен сумме выигрышей по двум воротам.

Так, при защите первых ворот одним полком, вторых − четырьмя, при нападении на первые ворота 1 полка, а на вторые − трёх полков получаем, что «выигрыш» на первых воротах равен 0, на вторых выигрыш равен и сумма выигрыша защитников равна 4.

Составить матрицу платежей игры полковника Блотто.

Решение. Рассмотрим возможные стратегии защитников и нападающих при заданном количестве полков. Стратегии защитников, распределяющих свои полки между двумя воротами города, составят следующие пары чисел: (0;5), (1;4), (2;3), (3;2), (4;1), (5;0). Всего получилось шесть стратегий. Стратегии противника распределения их полков по тем же воротам могут быть следующие: (0;4), (1;3), (2;2), (3;1), (4;0). Всего пять стратегий. Следовательно, матрица этой игры будет иметь шесть строк и пять столбцов. Её элемент а11 найдем как платеж при применении первой стратегии А1=(0;5) защитниками и первой стратегии В1=(0;4) нападающими. Так как 0=0, «выигрыш» на первых воротах равен 0, на вторых выигрыш равен , и сумма выигрыша защитников на двух воротах равна 5.

Элемент a12 равен платежу при применении стратегий А1=(0;5) и В2=(1;3). Так как 0<1, «выигрыш» на первых воротах равен (−1), на вторых выигрыш равен , следовательно, . Элемент a13 равен платежу при применении стратегий А1=(0;5) и В3= (2;2), то есть a13 = −1 + 2 + 1 = 2. Аналогично для пары стратегий А1=(0;5) и В4=(3;1) получаем a14 = −1 + 1 + 1 = 1, и для пары стратегий А1= (0;5) и В5=(4;0) платеж a15 = − 1 + 0 + 1 = 0.

Так же вычисляем значения элементов второй строки таблицы:

для стратегий А2=(1;4) и В1=(0;4) элемент a21 = 0 + 1 + 0 = 1;

для стратегий А2=(1;4) и В2=(1;3) элемент a22 = 0 + 3 + 1 = 4;

для стратегий А2=(1;4) и В3=(2;2) элемент a23 = −1 + 2 + 1 = 2;

для стратегий А2=(1;4) и В4= (3;1) элемент a24 = −1 + 1 + 1 = 1;

для стратегий А2=(1;4) и В5=(4;0) элемент a25 = − 1 + 0 + 1 = 0.

Аналогично получаем элементы третьей и всех последующих строк: a31 = 0 + 1 − 1 = 0; a32 = 1 + 1 + 0 = 2; a33 = 0 + 2 + 1 = 3; a34 = − 1 + 1 + 1 = 1; a35 = − 1 + 0 + 1 = 0; a41 = 0 + 1 − 1 = 0; a42 = 1 + 1 − 1 = 1; a43 = 2 + 1 + 0 = 3 и т. д. Результаты вычислений записываем в матрицу платежей (табл. 3.2).

Таблица 3.2

Стратегии защитников

Стратегии нападающих

В1=(0;4)

В2=(1;3)

В3=(2;2)

В4=(3;1)

В5=(4;0)

А1=(0;5)

5

3

2

1

0

А2=(1;4)

1

4

2

1

0

А3=(2;3)

0

2

3

1

0

А4=(3;2)

0

1

3

2

0

А5=(4;1)

0

1

2

4

1

А6=(5;0)

0

1

2

3

5