- •664074, Иркутск, ул. Лермонтова, 83
- •1.Основные определения вариационного исчисления
- •2.Необходимые условия экстремума функционала
- •3.Вариационные задачи с подвижными концами
- •4.Ломаные экстремали
- •5.Функционалы, зависящие от нескольких функций
- •6.Задачи с функционалом, содержащим производные высших порядков
- •7.Условный экстремум
- •8.Каноническая форма уравнений эйлера
- •9.Оптимальное управление
- •10.Дифференциальные игры
- •11.Методы решения. Прямые методы
- •12.Методы решения. Метод множителей лагранжа
- •13.Методы решения. Принцип максимума
- •14.Методы решения. Динамическое программирование
10.Дифференциальные игры
Многие задачи управления, экономики и техники формализуются в виде дифференциальных игр.
Состояние физического процесса или объекта характеризуется переменными состояния , изменение которых описывается системой обыкновенных дифференциальных уравнений
или векторным дифференциальным уравнением
,
где - точка мерного фазового пространства , которая определяет состояние процесса и которая принадлежит области ; и - управляющие параметры первого и второго игроков, которые принадлежат соответственно замкнутым ограниченным множествам и в евклидовых пространствах и :
;
действительная вектор-функция, определенная на прямом произведении .
Управляющие параметры и , которые выбираются в каждый момент времени в зависимости от состояния процесса , принято называть стратегиями игроков. Стратегии игроков и определены на , принимают значения соответственно из и и обычно выбираются из условия оптимизации некоторого критерия, который называется платой.
Решение системы обыкновенных дифференциальных уравнений (10.1) при выбранных стратегиях и с начальными условиями , где момент начала игры, называется траекторией или партией, которая начинается в точке и обозначается как . Развитие игры происходит в области , которой принадлежат все траектории. игра считается оконченной, когда точка достигает терминального многообразия .
Плата может быть задана для широкого класса игр в форме
,
где заданная функция, определенная на ; - функция конечного состояния, определенная на терминальном многообразии . Интегрирование производится вдоль траектории от момента начала игры до момента окончания , соответствующего моменту достижения точкой терминального многообразия . В случае плата называется интегральной, а при - терминальной.
Обычно в дифференциальных играх цели игроков считаются противоположными, а в качестве выбора стратегий и принимают принцип минимакса, т.е. первый игрок формирует стратегию , минимизирующую плату при условии максимизации платы вторым игроком
,
а второй игрок формирует стратегию , максимизирующую плату при условии минимизации платы первым игроком
.
Стратегии и называются оптимальными, если выполняется соотношение
= =
= .
Выполнение этого условия свидетельствует о наличии седловой точки игры, которая обладает тем свойством, что любое отклонение от оптимальной стратегии одним игроком приводит к потерям в плате при условии выбора оптимальной стратегии другим игроком
,
.
Плата , соответствующая оптимальным стратегиям и , называется ценой игры.
Основная задача дифференциальных игр заключается в определении цены игры, оптимальных стратегий игроков и траекторий, соответствующих оптимальным стратегиям. Данная постановка задачи относится к классу дифференциальных игр двух игроков с нулевой суммой, когда выигрыш одного игрока равен проигрышу другого. Дифференциальные игры являются наиболее общим классом оптимизационных задач. Например, задачи оптимального управления могут рассматриваться как частный случай дифференциальной игры с одним игроком. Это утверждение следует из непосредственного сравнения постановок задачи оптимального управления (9.1),(9.2), т.е.
и дифференциальной игры (10.1), т.е.
,
из которой исключаются управляющие параметры второго игрока. если учесть, что задачи оптимального управления, как показано выше, могут рассматриваться как обобщенное вариационное исчисление, то между дифференциальными играми, оптимальным управлением и вариационными задачами существует связь в отношении их математических моделей.
Дифференциальные игры являются наиболее универсальной моделью динамических оптимизационных задач, которые требуют применения наиболее сложных методов и средств моделирования.
На примере задачи перехода корабля из заданного начального состояния в конечное за минимальное время, которая рассматривалась выше, покажем связь задач оптимального управления и дифференциальных игр. Если о компонентах вектора скорости течения ничего неизвестно, кроме ограничений , , где и - известные граничные значений допустимой скорости течения, то задача оптимального управления переходит в класс дифференциальных игр. В качестве первого игрока может рассматриваться судоводитель, выбирающий оптимальный курс корабля , а второй игрок – это неизвестные воздействия и природных сил в виде течения, которому можно приписать целенаправленное поведение, максимизирующее время перехода корабля из начального положения в конечное. Если судоводитель будет выбирать оптимальный курс корабля из решения дифференциальной игры, то он гарантирует оптимальный по времени переход корабля в заданную конечную точку при любом законе изменения скорости течения вдоль траектории движения. Если закон изменения скорости течения известен, то оптимальный курс необходимо выбирать из решения задачи оптимального управления.