- •Учебно-исследовательская работа на тему: «Исследование траектории повторной атаки истребителя-бомбардировщика»
- •1. Постановка задачи
- •2. Формализация задачи
- •3.2. Вспомогательные построения и термины
- •3.3. Теорема «Принцип максимума»
- •4. Применение теоремы «Принцип максимума» для решения задачи
- •5. Исследование фазовых траекторий на участках постоянства управления
- •6. Исследование полных оптимальных фазовых траекторий
- •7. Анализ пространства начальных условий повторной атаки
- •8. Исследование оптимального закона управления с обратной связью
3.2. Вспомогательные построения и термины
1. Зависящий от времени вектор сопряжённых координат (вектор-функция множителей Лагранжа):
λ(t)=[ λ1(t), λ2(t), … , λn(t)]T; (3.2.1)
2. Постоянный вектор множителей Лагранжа:
ν=[ ν1, ν2, … , νt]T; (3.2.2)
3. Вспомогательные скалярные функции:
- гамильтониан задачи:
H[y(t), u(t), t]=fo(y, u, t)+λTf(y, u, t); (3.2.3)
- функция Лагранжа:
L[y(to), to, y(T), T, ν]=g[y(to), to, y(T), T]+ νTω[y(to), to, y(T), T]; (3.2.4)
4. Система дифференциальных уравнений, сопряжённая к уравнению (3.1.1) и
определяющая изменение вектора λ(t):
(3.2.5)
5. С помощью функции H исходная система (3.1.1) записывается в виде:
(3.2.6)
Система уравнений (3.1.5) и (3.1.6) называется канонической или гамильтоновой системой дифференциальных уравнений, связанной с основной задачей.
3.3. Теорема «Принцип максимума»
Сформулируем теорему: пусть uo(t), t [to, T] – такое допустимое управление, что соответствующая траектория y0(t) системы удовлетворяет (3.1.1) удовлетворяет краевым условиям (3.1.2).
Для оптимальности, в смысле, минимума критерия (3.1.3), управления u0(t) и траектории y0(t) необходимо существование такого ненулевого переменного вектора λ(t) и такого постоянного вектора ν, что выполняются следующие условия:
1) вектор функции u0(t), y0(t), λ(t) удовлетворяют гамильтоновой системе:
(3.3.1)
)
функция H(t,
y,
u,
)
переменного u(t)
Ωu
при каждом t
[t0,
T]
(при фиксированных yo,
)
достигает
при u
= u0(t)
минимума:
H[t, yo(t), uo(t), (t)] = min H[t, yo(t), uo(t), (t)], (3.3.2)
то есть оптимальное управление определяется как:
u0(t) = u0 [t, y(t), (t)] = arg min H[t, y(t), u(t), (t)]; u Ωu ; (3.3.3)
3)
сопряженные переменные
и функция Гамильтона H[t,
yo,
uo,
]
непрерывны вдоль оптимальной траектории;
4)
при произвольных вариациях концевых
точек to,
y
(to),
T,
(T)
выполняются обобщенные условия
трансверсальности:
[H
–
T
]
(3.3.4)
где
dL=
+
+
+
Совокупность соотношений теоремы дают необходимые условия оптимальности
программного управления, которые позволяют из множества допустимых управлений и фазовых траекторий выделить те из них, которые могут быть оптимальными. Принцип максимума сводит исходную вариационную задачу к двухточечной краевой задаче для гамильтоновой системы. Применим теорему Л. М. Пантрягина для решения задачи оптимального программного управления n0(t).
4. Применение теоремы «Принцип максимума» для решения задачи
Запишем исходную систему в виде:
(4.1)
Для
определённости применим критерий п. 4
раздела 3.3 в виде I=
f0
dt.
Тогда
можем записать выражение для гамильтониана
задачи в следующем виде:
H[x(t),
y(t),
(t),
ny(t),
(t),
t]
= 1+
1Vsin
+
2Vsin
+
.
(4.2)
Лагранжиан задачи будет иметь следующий вид:
L
= ν1(x2(T)
+
y2(T)
–
+ ν2
(4.3)
Запишем систему, сопряжённую по отношению к исходной системе (4.1):
(4.4)
Запишем условия трансверсальности, являющимися краевыми условиями для гамильтоновой системы:
(4.5)
Запишем условия оптимального управления принципа максимума:
=
arg min H(x, y,
1,
2,
3,
t)
= ny
sign(
)
(4.6)
Рис. 2.
Учитывая, что управление входит в гамильтониан линейно, и ограничения на каждую составляющую управления наложены отдельно, решение задачи нелинейного программирования можно записать в следующем виде:
n
(4.7)
где
- управление в особом режиме.
Для
нахождения
необходимо рассмотреть необходимые
условия существования особого режима
I
и II
порядков. Необходимые условия I
порядка – это условие тождественного
обращения в 0 всех производных функции
переключения
:
(4.8)
В
дальнейшем в дифференцировании нет
необходимости, поскольку
явно зависит от
.
Заметим,
что соотношения (4.8) должны выполняться
совместно только при
1=
2=
3=0.
Последнее выражение системы (4.8) может
равняться 0, либо в случае, когда выражение
в скобках равно, либо когда
= 0. Первое невозможно, так как принцип
максимума требует существования
ненулевого вектора
.
Поэтому, из (4.8) следует, что = 0. С учётом этого и (4.7) получим:
n (4.9)
Перейдём к рассмотрению необходимых условий существования особого режима второго порядка.
Он имеет вид:
(-1)p
(
)
0,
(4.10)
где P – порядок вырожденности задачи, в данном случае P = 1.
Из сказанного выше следует, что (4.10) может выполняться только в случае строгого знака неравенства, иначе оно будет противоречить условиям первого порядка. Поэтому окончательно (4.9) можно переписать в следующем виде:
n (4.11)
Используя принцип максимума исходная вариационная задача сводится к следующей двухточечной краевой задаче гамильтоновой системы:
(4.12)
Дальнейшее решение краевой задачи возможно численными методами (на этом возможности принципа максимума заканчиваются).
Учитывая особенности рассмотренной задачи оптимальное управление является кусочно-постоянным. Попробуем решить задачу аналитически, для чего исследуем движение системы на участках постоянства управления.
