Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТОУ Книга11.DOC
Скачиваний:
113
Добавлен:
03.05.2019
Размер:
2.73 Mб
Скачать

10.Дифференциальные игры

Многие задачи управления, экономики и техники формализуются в виде дифференциальных игр.

Состояние физического процесса или объекта характеризуется переменными состояния , изменение которых описывается системой обыкновенных дифференциальных уравнений

или векторным дифференциальным уравнением

,

где - точка мерного фазового пространства , которая определяет состояние процесса и которая принадлежит области ; и - управляющие параметры первого и второго игроков, которые принадлежат соответственно замкнутым ограниченным множествам и в евклидовых пространствах и :

;

действительная вектор-функция, определенная на прямом произведении .

Управляющие параметры и , которые выбираются в каждый момент времени в зависимости от состояния процесса , принято называть стратегиями игроков. Стратегии игроков и определены на , принимают значения соответственно из и и обычно выбираются из условия оптимизации некоторого критерия, который называется платой.

Решение системы обыкновенных дифференциальных уравнений (10.1) при выбранных стратегиях и с начальными условиями , где момент начала игры, называется траекторией или партией, которая начинается в точке и обозначается как . Развитие игры происходит в области , которой принадлежат все траектории. игра считается оконченной, когда точка достигает терминального многообразия .

Плата может быть задана для широкого класса игр в форме

,

где заданная функция, определенная на ; - функция конечного состояния, определенная на терминальном многообразии . Интегрирование производится вдоль траектории от момента начала игры до момента окончания , соответствующего моменту достижения точкой терминального многообразия . В случае плата называется интегральной, а при - терминальной.

Обычно в дифференциальных играх цели игроков считаются противоположными, а в качестве выбора стратегий и принимают принцип минимакса, т.е. первый игрок формирует стратегию , минимизирующую плату при условии максимизации платы вторым игроком

,

а второй игрок формирует стратегию , максимизирующую плату при условии минимизации платы первым игроком

.

Стратегии и называются оптимальными, если выполняется соотношение

= =

= .

Выполнение этого условия свидетельствует о наличии седловой точки игры, которая обладает тем свойством, что любое отклонение от оптимальной стратегии одним игроком приводит к потерям в плате при условии выбора оптимальной стратегии другим игроком

,

.

Плата , соответствующая оптимальным стратегиям и , называется ценой игры.

Основная задача дифференциальных игр заключается в определении цены игры, оптимальных стратегий игроков и траекторий, соответствующих оптимальным стратегиям. Данная постановка задачи относится к классу дифференциальных игр двух игроков с нулевой суммой, когда выигрыш одного игрока равен проигрышу другого. Дифференциальные игры являются наиболее общим классом оптимизационных задач. Например, задачи оптимального управления могут рассматриваться как частный случай дифференциальной игры с одним игроком. Это утверждение следует из непосредственного сравнения постановок задачи оптимального управления (9.1),(9.2), т.е.

и дифференциальной игры (10.1), т.е.

,

из которой исключаются управляющие параметры второго игрока. если учесть, что задачи оптимального управления, как показано выше, могут рассматриваться как обобщенное вариационное исчисление, то между дифференциальными играми, оптимальным управлением и вариационными задачами существует связь в отношении их математических моделей.

Дифференциальные игры являются наиболее универсальной моделью динамических оптимизационных задач, которые требуют применения наиболее сложных методов и средств моделирования.

На примере задачи перехода корабля из заданного начального состояния в конечное за минимальное время, которая рассматривалась выше, покажем связь задач оптимального управления и дифференциальных игр. Если о компонентах вектора скорости течения ничего неизвестно, кроме ограничений , , где и - известные граничные значений допустимой скорости течения, то задача оптимального управления переходит в класс дифференциальных игр. В качестве первого игрока может рассматриваться судоводитель, выбирающий оптимальный курс корабля , а второй игрок – это неизвестные воздействия и природных сил в виде течения, которому можно приписать целенаправленное поведение, максимизирующее время перехода корабля из начального положения в конечное. Если судоводитель будет выбирать оптимальный курс корабля из решения дифференциальной игры, то он гарантирует оптимальный по времени переход корабля в заданную конечную точку при любом законе изменения скорости течения вдоль траектории движения. Если закон изменения скорости течения известен, то оптимальный курс необходимо выбирать из решения задачи оптимального управления.