Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Иркутский национальный исследовательский технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ТОУ Книга11.DOC

Скачиваний:

113

Добавлен:

03.05.2019

Размер:

2.73 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 139 10 11 12 13 > Следующая >>>

10.Дифференциальные игры

Многие задачи управления, экономики и техники формализуются в виде дифференциальных игр.

Состояние физического процесса или объекта характеризуется переменными состояния , изменение которых описывается системой обыкновенных дифференциальных уравнений

или векторным дифференциальным уравнением

где - точка мерного фазового пространства , которая определяет состояние процесса и которая принадлежит области ; и - управляющие параметры первого и второго игроков, которые принадлежат соответственно замкнутым ограниченным множествам и в евклидовых пространствах и :

;

действительная вектор-функция, определенная на прямом произведении .

Управляющие параметры и , которые выбираются в каждый момент времени в зависимости от состояния процесса , принято называть стратегиями игроков. Стратегии игроков и определены на , принимают значения соответственно из и и обычно выбираются из условия оптимизации некоторого критерия, который называется платой.

Решение системы обыкновенных дифференциальных уравнений (10.1) при выбранных стратегиях и с начальными условиями , где момент начала игры, называется траекторией или партией, которая начинается в точке и обозначается как . Развитие игры происходит в области , которой принадлежат все траектории. игра считается оконченной, когда точка достигает терминального многообразия .

Плата может быть задана для широкого класса игр в форме

где заданная функция, определенная на ; - функция конечного состояния, определенная на терминальном многообразии . Интегрирование производится вдоль траектории от момента начала игры до момента окончания , соответствующего моменту достижения точкой терминального многообразия . В случае плата называется интегральной, а при - терминальной.

Обычно в дифференциальных играх цели игроков считаются противоположными, а в качестве выбора стратегий и принимают принцип минимакса, т.е. первый игрок формирует стратегию , минимизирующую плату при условии максимизации платы вторым игроком

а второй игрок формирует стратегию , максимизирующую плату при условии минимизации платы первым игроком

Стратегии и называются оптимальными, если выполняется соотношение

= =

= .

Выполнение этого условия свидетельствует о наличии седловой точки игры, которая обладает тем свойством, что любое отклонение от оптимальной стратегии одним игроком приводит к потерям в плате при условии выбора оптимальной стратегии другим игроком

Плата , соответствующая оптимальным стратегиям и , называется ценой игры.

Основная задача дифференциальных игр заключается в определении цены игры, оптимальных стратегий игроков и траекторий, соответствующих оптимальным стратегиям. Данная постановка задачи относится к классу дифференциальных игр двух игроков с нулевой суммой, когда выигрыш одного игрока равен проигрышу другого. Дифференциальные игры являются наиболее общим классом оптимизационных задач. Например, задачи оптимального управления могут рассматриваться как частный случай дифференциальной игры с одним игроком. Это утверждение следует из непосредственного сравнения постановок задачи оптимального управления (9.1),(9.2), т.е.

и дифференциальной игры (10.1), т.е.

из которой исключаются управляющие параметры второго игрока. если учесть, что задачи оптимального управления, как показано выше, могут рассматриваться как обобщенное вариационное исчисление, то между дифференциальными играми, оптимальным управлением и вариационными задачами существует связь в отношении их математических моделей.

Дифференциальные игры являются наиболее универсальной моделью динамических оптимизационных задач, которые требуют применения наиболее сложных методов и средств моделирования.

На примере задачи перехода корабля из заданного начального состояния в конечное за минимальное время, которая рассматривалась выше, покажем связь задач оптимального управления и дифференциальных игр. Если о компонентах вектора скорости течения ничего неизвестно, кроме ограничений , , где и - известные граничные значений допустимой скорости течения, то задача оптимального управления переходит в класс дифференциальных игр. В качестве первого игрока может рассматриваться судоводитель, выбирающий оптимальный курс корабля , а второй игрок – это неизвестные воздействия и природных сил в виде течения, которому можно приписать целенаправленное поведение, максимизирующее время перехода корабля из начального положения в конечное. Если судоводитель будет выбирать оптимальный курс корабля из решения дифференциальной игры, то он гарантирует оптимальный по времени переход корабля в заданную конечную точку при любом законе изменения скорости течения вдоль траектории движения. Если закон изменения скорости течения известен, то оптимальный курс необходимо выбирать из решения задачи оптимального управления.

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 139 10 11 12 13 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
11.11.20192.23 Mб62ТестыМОРИ-МехМол.doc
#
26.03.2016887.3 Кб255Технологическая схема ТЭС.doc
#
09.11.20181.41 Mб59Технология конструкционных материалов.doc
#
21.09.2019236.36 Кб19Титул_и_задание_на_КП.docx
#
26.03.2016186.89 Кб32ТММ вопросы № 85 - 88.docx
#
03.05.20192.73 Mб113ТОУ Книга11.DOC
#
26.09.20191.45 Mб211ТПС конспект.doc
#
19.08.20191.19 Mб5Требование к оформлению курсовой работы СМ.doc
#
09.11.20181.36 Mб6Требование к оформлению курсовой работы.doc
#
26.03.2016154.62 Кб8требования к курсовой строителям.doc
#
24.11.2018246.78 Кб5требования к курсовой строителям.doc