Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МУ к ПЗ (ММ и МИО).doc
Скачиваний:
1
Добавлен:
01.04.2025
Размер:
1.4 Mб
Скачать

3.2. Решение матричных антагонистических игр в смешанных стратегиях

В случае антагонистических игр без седловой точки используют смешанные стратегии.

Смешанная стратегия 1-го игрока

где xi – вероятность использования стратегии αi,

Смешанная стратегия 2-го игрока

где yj – вероятность использования стратегии βj,

Для данной смешанной стратегии активными называют те чистые стратегии, которые входят в эту смешанную стратегию с ненулевыми вероятностями.

Если в игре с платежной матрицей A 1-й игрок использует смешанную стратегию X, а 2-й – чистую стратегию βj, то математическое ожидание выигрыша 1-го игрока будет равно

Если 1-й игрок использует чистую стратегию αi, а 2-й – смешанную стратегию Y, то математическое ожидание проигрыша 2-го игрока будет равно

Если оба игрока используют смешанные стратегии X и Y, то математическое ожидание выигрыша 1-го игрока, равное математическому ожиданию проигрыша 2-го игрока, будет равно

Как и для игр с седловой точкой при выборе наилучшей смешанной стратегии используются принципы осторожности и уравновешенности.

Принцип осторожности приводит к понятию защитной смешанной стратегии. Для выбора защитной смешанной стратегии 1-й игрок использует критерий максимина, а 2-й игрок – критерий минимакса.

Смешанная стратегия X0= , максимизирующая средний гарантированный выигрыш 1-го игрока, т.е. выбранная в соответствии с максиминным критерием

называется защитной смешанной стратегией 1-го игрока.

Смешанная стратегия Y0= , минимизирующая средний гарантированный проигрыш 2-го игрока, т.е. выбранная в соответствии с минимаксным критерием

называется защитной смешанной стратегией 2-го игрока.

Достигаемый при использовании защитной стратегии X0 максимум гарантированного выигрыша 1-го игрока

называется нижней ценой игры (в классе смешанных стратегий).

Достигаемый при использовании защитной стратегии Y0 минимум гарантированного проигрыша 2-го игрока

называется верхней ценой игры (в классе смешанных стратегий).

Защитные смешанные стратегии существуют всегда. Их можно искать различными способами. Для игр размером 2×n или 2 пригоден графический метод.

Пусть задана игра с платежной матрицей размера 2×n

Алгоритм определения защитных смешанных стратегий графическим методом заключается в следующем:

1. На концах единичного отрезка восстанавливают два перпендикуляра (левый перпендикуляр соответствует стратегии α2, правый перпендикуляр – стратегии α1).

2. Для стратегии на левом перпендикуляре откладывают величину a2j, на правом перпендикуляре – величину a1j, полученные точки соединяют отрезком прямой. В результате получают n прямых, представляющих собой графики зависимостей

3. Находят нижнюю границу множества n прямых (обычно ее выделяют на графике штриховкой), т.е. .

4. Находят точку единичного отрезка, при которой нижняя граница достигает максимума, т.е. . Эта точка соответствует искомой смешанной стратегии X0, высота максимума дает при этом значение нижней цены игры u.

5. Определяют две чистых стратегии 2-го игрока βl и βk, являющиеся его активными стратегиями (это стратегии, для которых пересечение графиков зависимостей и определяет точку максимума нижней границы). Таким образом, игра 2×n сводится к игре 2×2.

6. От матрицы A размера 2×n переходят к матрице A размера 2×2 следующего вида:

где .

7. На концах единичного отрезка восстанавливают два перпендикуляра (левый перпендикуляр соответствует стратегии , правый перпендикуляр – стратегии ).

8. Строят графики зависимостей и .

9. Находят верхнюю границу этих прямых (ее также выделяют на графике штриховкой), т.е. .

10. Находят точку единичного отрезка, при которой верхняя граница достигает минимума, т.е. . Эта точка соответствует искомой смешанной стратегии Y0, высота минимума дает при этом значение верхней цены игры v.

По аналогичной методике может быть решена игра m×2: определяется защитная смешанная стратегия 2-го игрока, находятся активные стратегии 1-го игрока, игра m×2 сводится к игре 2×2, определяется защитная смешанная стратегия 1-го игрока.

Графический метод в общем случае позволяет найти лишь приближенное значение , i = 1,2; , j = 1,2, которые затем надо уточнить аналитически.

Аналитический метод определения защитных смешанных стратегий применим для игр размера 2×2. Для платежной матрицы A такой игры

максимум минимального (гарантированного) выигрыша для 1-го игрока достигается при выполнении . К этому соотношению добавляется еще условие нормировки . Таким образом, защитная смешанная стратегия X0 является решением системы уравнений

При этом .

Аналогично, для 2-го игрока защитная смешанная стратегия Y0 является решением системы уравнений

При этом

Для определения защитных смешанных стратегий в случае игр размерности m×n, где m >2, n >2, применяют метод, основанный на сведении игры к задаче ЛП.

Предварительно (в случае необходимости) платежная матрица A должна быть преобразована к виду, чтобы все ее элементы были положительны. Этого можно добиться, прибавляя ко всем элементам матрицы одно и то же положительное число K, т.е.

При этом цена игры увеличится на K, т.е.

а пара защитных смешанных стратегий не изменится.

Для 1-го игрока составляют задачу ЛП вида

(3.2)

где

Для 2-го игрока составляют задачу ЛП вида

(3.3)

где

Задачи (3.2) и (3.3) образуют двойственную пару задач ЛП. Симплекс-методом проще решать задачу (3.3) для 2-го игрока. По итоговой симплекс-таблице задачи (3.3) находят оптимальное решение W0 для 2-го игрока (в столбце свободных членов) и оптимальное решение T0 для 1-го игрока (в целевой строке). Оптимальное значение целевой функции L0 определяет цену игры Затем определяют защитную пару смешанных стратегий и цену u=v исходной игры

Алгоритм определения защитных смешанных стратегий методом ЛП заключается в следующем:

1. Платежную матрицу A (в случае необходимости) преобразовывают к виду, содержащему только положительные элементы.

2. Составляют задачу (3.2) для 1-го игрока и задачу (3.3) для 2-го игрока.

3. Решают симплекс-методом задачу (3.3).

4. По итоговой симплекс-таблице находят оптимальное решение W0 задачи (3.3), оптимальное решение T0 задачи (3.2) и

5. Определяют защитные смешанные стратегии и цену исходной игры u=v.

Пара смешанных стратегий называется уравновешенной, если для любых X и Y выполняется

Решением антагонистической игры в смешанных стратегиях называется уравновешенная пара стратегий.

Поскольку в классе смешанных стратегий защитная пара стратегий всегда является уравновешенной, то решением антагонистической игры в смешанных стратегиях является уравновешенная пара защитных стратегий.

В связи с вышеизложенным к алгоритму решения антагонистической игры, приведенному в параграфе 3.1, следует добавить п. 4.

4. Находят цену игры в смешанных стратегиях u=v и защитную пару смешанных стратегий, являющуюся решением игры в смешанных стратегиях.

Задачи

3.4. Каждый из двух игроков одновременно выбирает одно из чисел: 1 или 2. Если 1-й игрок выбрал 1 и числа совпали, он проигрывает 2 рубля; не совпали – игра завершается вничью. Если 1-й игрок выбрал 2 и числа совпали, он проигрывает 1 рубль; не совпали – он выигрывает 2 рубля. Составить игру в матричной форме и найти ее решение а) графическим методом, б) аналитическим методом.

3.5 У каждого из двух игроков по две монеты: 1 рубль и 2 рубля. Оба одновременно выкладывают по одной из них на стол. Если достоинство монет совпало, то выложенные деньги забирает 1-й игрок; если не совпало – 2-й игрок.

Составить игру в матричной форме и найти ее решение а) графическим методом, б) аналитическим методом, в) методом ЛП.

3.6. В игре на совпадение сторон монеты два игрока одновременно выбирают герб или цифру. Пусть результаты совпали: если 1-й игрок выбрал герб, то он выигрывает 2 рубля; если цифру, то он выигрывает 1 рубль. Пусть результаты не совпали: если 2-й игрок выбрал герб, то он выигрывает 1 рубль; если цифру, то он выигрывает 3 рубля.

Составить игру в матричной форме и найти ее решение а) графическим методом, б) аналитическим методом.