Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие по математике для магистров.doc
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
9.51 Mб
Скачать

20.3. Дифференциальная игра.

Дифференциальная игра - это динамическая система, управляемая двумя противниками, интересы которых противоположны. Примеры задач, приводящих к дифференциальным играм: посадка самолета в условиях ветрового возмущения; преследование одной управляемой ракеты другой.

Основной элемент решения - функция цены - вычисляется как набор большого числа (100-500) множеств уровня - "трубок" (1 трубка - 500 000 точек).

20.4. Платежная матрица. Цена игры. Принципы максимина и минимакса.

 

Пусть в игре участвуют два игрока А и В. Игра называется игрой с нулевой суммой (матричной игрой), если выигрыш игрока А в точности равен проигрышу игрока В (или наоборот). Игроки А и В производят ряд последовательных ходов, т.е. производят ряд последовательных действий, предусмотренных правилами игры.

Стратегия игрока – это совокупность правил, определяющих выбор варианта действий при каждом ходе в зависимости от ситуации, которая сложилась в ходе игры.

Теория игр дает указания игрокам при выборе ходов, т.е. рекомендует им лучшие стратегии.

Задание пары стратегий игроков А и В в игре двух лиц полностью определяет ее исход, т.е. выигрыш одного игрока и проигрыш другого. Игра называется конечной, если у каждого игрока имеется лишь конечное число стратегий. Если таких стратегий бесконечно много (пусть даже только у одного игрока), то игра называется бесконечной.

Рассмотрим конечную игру, в которой игрок А имеет m стратегий (А1, А2, …, Аm), а игрок Вn стратегий (В1, В2, …, Вn). Такая игра называется игрой m×n. Если игроки А и В используют только личные ходы, то выбор стратегий А и В однозначно определяет исход игры aij, т.е. число, характеризующее выигрыш игрока А и проигрыш игрока В. Причем aij может быть и положительным, и отрицательным. Будем считать, что при aij>0 игрок А выигрывает, а игрок В проигрывает величину aij. Если aij<0, то, наоборот, выигрывает игрок В и проигрывает игрок А. В этом случае вместо проигрыша часто говорят об отрицательном выигрыше игрока А.

Если в игре используются случайные ходы, то выигрыш при двух стратегиях Ai и Bj является случайным. В этом случае за оценку ожидаемого выигрыша берется его математическое ожидание.

Предположим, что нам известны все значения aij в игре (m×n). Эти значения удобно записать в виде таблицы платежной матрицы (табл. 20.1), где строки соответствуют стратегиям Ai, а столбцы – стратегиям Bj.

A B

В1

В2

Bj

Bn

βj

A1

a11

a12

a1j

a1n

 

A2

a21

a22

a2j

a2n

 

 

Ai

ai1

ai2

aij

ain

 

 

Am

am1

am2

amj

amn

 

 

 

 

 

 

 

 

β

Таблица 20.1.Платежная матрица.

Подход к игре, когда для выигрыша приходится использовать случайный выбор стратегий, называется подходом с использованием смешанных стратегий. Итак, смешанные стратегии получаются путем случайного чередования отдельных чистых стратегий при образовании смешанных стратегий.

Рассмотрим платежную матрицу общего вида (табл. 10.1) с тем, чтобы обобщить правила нахождения решения игры. Предположим сначала, что игра составлена таким образом, что существует ее решение в чистых стратегиях. Сначала определим наилучшую из стратегий игрока А, т.е. наилучшую из А1, А2, …, Аm с учетом того, что на любую стратегию Ai игрок B ответит стратегией Bj, для которой выигрыш игрока А окажется минимальным. Чтобы найти эту стратегию Bj, надо в строке платежной матрицы, соответствующей стратегии Ai (строке с номером i), найти минимальное из чисел aij. Обозначим его , т.е. где минимум определяется путем перебора всех номеров столбцов. При изменении стратегий игрока А соответствующее каждой из этих стратегий число тоже будет меняться. Естественно, что игроку А выгоднее всего остановиться на такой стратегии Ai, для которой значение будет максимальным. Обозначим это максимальное значение , т.е. или, учитывая выражение для , получим

Величину принято называть нижней ценой игры или максиминным выигрышем (сокращенно максимином). Стратегию игрока А, которой соответствует максимин , назовем максиминной стратегией.

Если игрок А будет придерживаться максиминной стратегии, то ему при любом поведении игрока В гарантирован выигрыш, во всяком случае не меньше, чем . Поэтому величину называют нижней ценой игры, т.е. это тот гарантированный минимум, который получит игрок А в данной игре.

Аналогично можно определить наилучшую из стратегий игрока В. Он стремится обратить выигрыш игрока А в минимум. Для этого игрок В старается для каждой своей стратегии Bj получить максимальное значение выигрыша при любой стратегии игрока А, т.е. он ищет значение βj такое, что

Однако игрок В не может рассчитывать на то, что игрок А позволит ему получить любой из выигрышей βj. Единственно, на что может рассчитывать игрок В, так это на то, что получит выигрыш, который будет не меньше, чем величина β, определяемая выражением

 

Эта величина β называется верхней ценой игры, или минимаксным выигрышем (минимаксом). Соответствующая минимаксу стратегия игрока В называется минимаксной стратегией. Это наиболее осторожная стратегия игрока В, обеспечивающая ему в любом случае проигрыш не больше β и, соответственно, выигрыш игроку А также не больше β.

В теории игр принцип осторожности, рекомендующий игрокам придерживаться максиминной и минимаксной стратегии, называется принципом минимакса. Он вытекает из предположения об осторожности игроков или из желания разрешить конфликтную ситуацию наилучшим для всех участвующих в ней сторон образом.

Если верхняя цена игры совпадает с нижней ценой, то их общее значение называется чистой ценой игры. Минимаксные стратегии, соответствующие чистой цене игры, являются оптимальными стратегиями, а их совокупность – оптимальным решением. Пара чистых стратегий дает оптимальное решение тогда и только тогда, когда соответствующий ей элемент aij является одновременно наибольшим в своем столбце и наименьшим в своей строке. В этом случае говорят, что игра имеет седловую точку.