afanasev_v_n_optimalnye_sistemy_upravleniya_ana
.pdfdT k { |
K(x(T),T) |
L(x,u,T) |
|
|
|
|
|
||||
|
|
|
|
|
|
||||||
1 |
|
|
T |
|
|
|
|
|
|
(1.54) |
|
|
|
|
|
|
|
|
|
|
|||
|
|
q |
|
|
|
|
|
|
|
||
[ J (T) i i(T)]T f (x,u,T)}, |
|
|
|
|
|
||||||
|
|
i 1 |
|
|
|
|
|
|
|
||
|
|
|
L(x,u,t) |
q |
|
f (x,u,t) |
|
T |
|
||
|
|
|
|
|
|||||||
u(t) k |
[ J (t) i |
i(t)]T |
, |
(1.55) |
|||||||
2 |
|
||||||||||
|
u(t) |
||||||||||
|
|
|
u(t) |
|
i 1 |
|
|
|
|
где k1,k2 - положительные скалярные величины.
Тогда выражение (1.53) с учетом (1.54) и (1.55) будет иметь вид
q
*
dJ(x,u) idJi (xi (t))
i 1
k1{ K(x(T),T) L(x,u,T)
T
q
[ J (T) i i(T)]T f (x,u,T)}2
i 1
T |
|
L(x,u,t) |
q |
f (x,u,t) |
|
k2 |
|
[ J (t) i i(t)]T |
|||
u(t) |
u(t) |
||||
t0 |
|
i 1 |
|||
|
|
|
|
(1.56)
2
dt.
Это выражение строго отрицательно, если квадратичные формы не равны нулю, т.е. условия стационарности критерия качества J(x,u) определяются с точностью до параметров следующими уравнениями:
K(x(T),T) |
L(x,u,T) |
|
|||||
|
|
||||||
T |
|
|
|
|
|
(1.57) |
|
|
|
q |
|
|
|
||
[ J (T) i i(T)]T |
f (x,u,T) 0, |
|
|||||
|
i 1 |
|
|
|
|
||
L(x,u,t) |
|
q |
|
f (x,u,t) |
|
|
|
[ J (t) i i(t)]T |
0. |
(1.58) |
|||||
u(t) |
|
||||||
|
i 1 |
|
u(t) |
|
Для того чтобы найти значения i ,i 1,...,q, при которых вариации по управлению u(t) и времени окончания переходного процесса dT удовлетворяют заданным ограничениям на правом конце (xi (T),i 1,...,q - задано), подставим (1.54) и (1.55) в (1.50). Получим:
dJ*i (xi (T)) dxi (T)
k1[ i(T)]T f (x,u,T) K(x(T),T) L(x,u,T)
T
q |
|
|
|
[ J (T) j j(T)]T f (x,u,T) |
|
||
|
|||
j 1 |
|
|
T |
i |
T f (x,u,t) |
|
L(x,u,t) |
q |
j |
T f (x,u,t) |
T |
|
||
k2 [ |
|
(t)] |
|
{ |
|
j |
|
(t)] |
|
} |
dt 0 |
|
u(t) |
u(t) |
|
u(t) |
|||||||
t0 |
|
|
|
j 1 |
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
или, произведя перегруппировку,
23
k1[ i(T)]T f (x,u,T){ |
K(x(T),T) |
|
||||||||||
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
T |
|||
L(x,u,T) [ J (T)]T f (x,u,T)} |
||||||||||||
|
T |
|
|
f (x,u,t) |
|
L(x,u,t) |
|
|||||
k2 |
[ i(t)]T |
{ |
|
|||||||||
|
|
|||||||||||
|
t0 |
|
|
u(t) |
|
|
u(t) |
|||||
|
|
|
|
|
|
(1.59) |
||||||
|
J |
T f (x,u,t) |
T |
|||||||||
[ |
|
(t)] |
|
} |
|
dt |
||||||
|
|
|
u(t)
q
jk1[ i(T)]T f (x,u,T)f (x,u,T)T j(T)
i 1
T |
|
f (x,u,t) |
|
|
k2 [ i(t)]T |
f (x,u,t) |
{ |
}T j(t)dt 0. |
|
u(t) |
|
|||
|
|
u(t) |
||
t0 |
|
|
|
Введем обозначения:
ri |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
i |
|
|
T |
|
|
|
|
|
K(x(T),T) |
|
|
|
|
J |
|
T |
|
|
|
|
||||||||||||
[ |
|
(T)] |
|
|
f (x,u,T) |
|
|
|
|
|
|
|
|
|
L(x,u,T) [ |
|
(T)] |
|
f |
(x,u,T) , |
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
T |
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
T |
|
|
|
|
T f (x,u,t) L(x,u,t) |
|
|
|
|
|
|
|
T |
|
|
|
||||||||||||||||
|
gi [ |
i |
|
|
|
|
J |
T f (x,u,t) |
|
|
|
|||||||||||||||||||||||||
|
|
(t)] |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
[ |
|
(t)] |
|
|
|
|
|
dt, |
|
|
|||||||||
|
|
|
u(t) |
|
|
|
|
|
u(t) |
|
u(t) |
|
|
|
||||||||||||||||||||||
|
|
|
|
t0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
Sij [ i(T)]T |
f (x,u,T)f (x,u,T)T j(T), |
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
T |
|
i |
|
|
T f (x,u,t) f (x,u,t) T |
j |
|
|
|
|
|
|
|
|
|
||||||||||||||||
Qij [ |
|
|
(t)] |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(t)dt. |
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
u(t) |
|
|
|
|
u(t) |
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
t0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
Тогда выражение (1.59) можно переписать в виде |
|
|
|
|
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
q |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
k1ri k2 gi |
j[k1Qi j k2Si j ] 0 |
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
j 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
или в векторной форме: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
k1r k2 g [k1S k2Q] 0, |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
откуда |
[k S k |
|
Q] |
1[k r k |
|
g]. |
|
|
|
|
|
|
|
|
|
|
(1.60) |
|||||||||||||||||||
|
2 |
2 |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
1 |
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Существование |
обратной |
матрицы [k S k |
Q] 1 |
вытекает из |
||||||||||||||||||||||||||||||||
предположения об управляемости системы. |
|
|
|
1 |
2 |
|
|
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||
Введем в рассмотрение функцию (t), определенную соотношением: |
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
q |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(t) J (t) i i (t). |
|
|
|
|
|
|
|
|
|
|
(1.61) |
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Тогда из (1.45), (1.51) и (1.46), (1.52) будем иметь: |
|
|
||||||||||||||||||||||||||||||||||
|
d |
|
|
|
|
|
|
|
H(x,u, ,t) T |
|
|
|
|
|
|
|
|
|
|
(1.62) |
||||||||||||||||
|
|
|
(t) |
|
|
|
|
|
|
|
|
|
|
, |
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
x(t) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
dt |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
24
|
|
|
|
|
|
|
|
|
|
|
|
j |
j 1,...,q, |
|
|
|
|
|
|
|
|
|
(1.63) |
j (T) |
|
|
|
|
|
||
|
K(x(T),Т) |
j q 1,...,n, |
|
||||
|
|
|
|
|
, |
|
|
|
|
|
|
||||
|
|
|
xj (T) |
|
|
||
где |
|
|
|
|
|
|
|
|
H(x,u, ,t) L(x,u,t) T (t) f (x,u,t). |
(1.64) |
|||||
Условия стационарности (1.57), (1.58) с учетом введенных обозначений |
|||||||
можно переписать в виде |
|
|
|||||
|
K(x(T),T) |
H(x,u, ,T) 0, |
(1.65) |
||||
|
|
||||||
|
T |
|
|
|
|
|
|
|
H(x,u, ,t) |
0. |
|
(1.66) |
|||
|
|
|
|||||
|
u(t) |
|
|
|
|
|
|
Таким образом, необходимые условия минимума функционала (1.39) с объектом (1.2) при фиксированных значениях некоторых переменных состояния в неопределенный момент окончания переходного процесса сформулированы в виде двухточечной краевой задачи и условия выбора коэффициентов (1.60).
Уравнение (1.65) можно получить следующим образом. Найдем приращение функционала качества J(x,u), вызванное вариациями времени окончания переходного процесса. При малых вариациях dT будет справедливо соотношение
dJ |
|
t T |
(x,u) { |
J(x,u) |
|
J(x,u) |
f (x,u,T)}dT, |
|
|
|
|||||
|
|
|
|
T |
|
x(T) |
откуда
dJ(x,u) |
|
t T |
|
|
|
|
|
|
|
||||
K(x(T),T) |
|
K(x(T),T) |
||||
|
|
|
|
|
|
|
T |
|
x(T) |
||||
|
|
|
f (x,u,T) L(x,u,T) dT.
Учитывая (1.45) и (1.51), а также (1.64),
будем иметь
|
|
|
K(x(T),T) |
|
|
dJ(x,u) |
|
t T |
|
|
H(x,u, ,T) dT. |
|
T |
||||
|
|
|
|
|
Так как dT 0, то из последнего соотношения следует, что
K(x(T),T) |
H(x,u, ,T) 0. |
(1.67) |
|
||
T |
|
Уравнение (1.65) или (1.67) можно использовать для определения времени окончания переходного процесса.
Ограничения на конечное состояние системы может задаваться в виде функций, т.е. в момент окончания переходного процесса состояние системы должно отвечать следующему уравнению:
(x(T),T) 0, |
Rq. |
(1.68) |
25
Вспомогательный функционал качества, как и в разделе 1.3, можно записать в виде
J(x,u) K(x(T),T) T (x(T),T)
T
{L(x,u,t) T (t)[f (x,u,t) d x(t)]}dt.
dt
t0
Приращения вспомогательного критерия качества, вызванные вариациями по управлению u(t) и времени окончания переходного процесса dT, имеют вид
dJ(x,u) |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
{ |
Ф(x, ,T) |
L(x,u,T)}dT |
Ф(x, ,T) |
dx(T) |
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
T |
|
|
|
|
x(T) |
|
|
|
|
(1.69) |
|||||||||||
|
T |
|
|
H(x,u, ,t) |
|
|
|
|
|
||||||||||||||||||
{ |
H(x,u, ,t) |
x(t) |
u(t) |
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
x(t) |
|
|
|
u(t) |
|
|
|
|
|
|||||||||||
|
t0 |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
T(t) |
d |
x(t)}dt, |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
dt |
|
|
|
|
|
|
|
|
|
|
|
|||||||||
где |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
Ф(x, ,T) K(x(T),T) T (x(T),T), |
|
|
|
|
(1.70) |
||||||||||||||||||||||
H(x,u, ,t) L(x,u,t) T (t)f (x,u,t). |
|
|
|
|
(1.71) |
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|||
Интегрируя по частям T (t)x(t)и принимая во внимание, что |
|
||||||||||||||||||||||||||
x(T) dx(T) |
d |
|
x(T)dT, |
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
dT |
|
|
|
|
|
|
|
|
|
|
|
||||
получаем: |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
d |
|
|
(x,u) { |
Ф(x, ,T) |
L(x,u,T) T(T)f (x,u,T)}dT |
|
|||||||||||||||||||||
J |
|
||||||||||||||||||||||||||
|
|
|
|
|
|||||||||||||||||||||||
|
|
Ф(x, ,T) |
|
|
T |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
{ |
T(T)}dx(T) T(t ) x(t |
) |
(1.72) |
||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
x(T) |
|
|
0 |
0 |
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
T |
d |
|
|
|
|
|
H(x,u, ,t) |
|
|
||||||||||||||||||
{[ |
H(x,u, ,t) |
|
T(t)] x(t) |
u(t)}dt. |
|
||||||||||||||||||||||
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
x(t) |
dt |
|
|
|
|
|
u(t) |
|
||||||||||||
t0 |
|
|
|
|
|
|
|
|
|
|
|
Выберем функцию (t) так, чтобы коэффициенты при обращались в нуль. Будем иметь
d |
|
H(x,u, ,t) T |
|||||
|
(t) |
|
|
|
|
, |
|
dt |
x(t) |
|
|||||
|
|
|
|
|
|||
|
Ф(x, ,T) T |
|
|||||
(T) |
|
|
|
, |
|
|
|
x(T) |
|
|
|||||
|
|
|
|
|
|
Ф(x, ,T) L(x,u,T) T (T) f (x,u,T) 0.
T
Учитывая (1.73), а также
dФ(x, ,T) Ф(x, ,T) Ф(x, ,T) dx(T), dT T x(T) dT
x(t),dx(T) и dT
(1.73)
(1.74)
(1.75)
26
выражение (1.75) можно переписать в виде
|
dФ(x, ,T) |
L(x,u,T) 0. |
(1.76) |
||||||
|
|
|
|
||||||
|
|
|
dT |
|
|||||
В результате такого выбора (t)выражение (1.72) можно переписать: |
|||||||||
|
|
|
T |
|
|||||
d |
|
(x,u) |
H(x,u, ,t) |
u(t)}dt, |
(1.77) |
||||
J |
|||||||||
|
|
||||||||
|
|
|
|
|
|
u(t) |
|
||
|
|
|
t0 |
|
|||||
где x(t0 ) 0, так как x(t0 )- задано. |
|
||||||||
Для того, чтобы функционал J(x,u) |
принимал стационарное значение, |
||||||||
необходимо выполнение условия: |
|
||||||||
|
H(x,u, ,t) |
0. |
(1.78) |
||||||
|
|
||||||||
|
|
|
u(t) |
|
Элементы вектора должны выбираться так, чтобы удовлетворялись ограничения (1.67), наложенные на состояние объекта в момент окончания переходного процесса.
В заключение данного раздела рассмотрим задачу с функционалом качества:
T |
(1.79) |
J dt T t0 , |
|
t0 |
|
которую обычно называют задачей быстродействия.
Функционал (1.79) нетрудно получить из функционала Больца, положив K(x(T),T) 0, L(x,u,t) 1. Тогда необходимые условия минимума функционала (1.79) будут иметь вид
d x(t) f (x,u,t) dt
n - дифференциальных уравнений,
d |
f (x,u,t) T |
||||
|
(t) |
|
|
(t) |
|
dt |
x(t) |
||||
|
|
|
n – дифференциальных уравнений. Краевые условия:
x(t0 ) x0
n – условий на левом конце,
|
|
|
j |
, j 1,...q |
|
j(T) |
0 |
j q 1,...n |
|
|
|
|
n – условий на правом конце.
Оптимальное управление находится из уравнения
T (t) f (x,u,t) 0.
u(t)
Отметим, что управление должно входить в правую часть уравнения объекта нелинейным образом.
Гамильтониан имеет вид
H(x,u, ,t) 1 T (t)f (x,u,t).
Уравнение, определяющее время переходного процесса, имеет вид:
27
1 T (T)f (x,u,T) 0,
откуда:
T (T)f (x,u,T) 1
или
q
i fi (x,u,T) 1.
i 1
Из последнего выражения видно, что рассматриваемая задача с функционалом (1.79) имеет смысл, если задана хотя бы одна из фазовых координат при t T.
§ 1.5. Задача с фиксированными значениями некоторых переменных состояния во внутренних точках траектории
В настоящем разделе рассмотрим задачу, в которой на траектории выделено несколько участков и на каждом из этих участков задается свой функционал качества, и на каждом из этих участков задаются некоторые переменные состояния. Кроме того, и сам объект от участка к участку может меняться. Другими словами, объект описывается в данной задаче следующим типом дифференциальных уравнений
|
d |
x(t) f (i) (x,u,t), ti 1 < t < ti , i 1,...,N. |
|
(1.80) |
|
|
|
|
|||
|
dt |
|
|
|
|
Заданы также многоточечные краевые условия |
|
|
|||
( j)[x(t0 ),x(t0 ),...,x(tN ),x(tN ); t0,...,tN ] 0, |
|
(1.81) |
|||
|
j 0,...,N. |
|
|||
|
|
|
|||
Здесь x(ti ) - значение вектора состояния перед |
t ti (слева от |
ti ), а x(ti ) - |
|||
значение вектора состояния сразу после t ti (справа от ti ). |
|
||||
Запишем функционал качества: |
|
|
|||
|
J(x,u) K[x(t0 ),x(t0 ),...,x(tN ),x(N );t0,...,tN ] |
|
|
||
|
|
N |
t i |
|
(1.82) |
|
|
|
|
||
L(i)(x,u,t)dt. |
|
|
i 1 t i
Задача заключается в построении u(t), доставляющего минимум функционалу (1.82) на объекте (1.80) при ограничениях (1.81).
Для получения необходимых условий минимума образуем вспомогательный функционал:
J(x,u) K[x(t0 ),x(t0 ),...,x(tN ),x(N );t0 ,...,tN ]
N |
|
|
|
|
[ |
( j)]T ( j)[x(t0 ),x(t0 ),...,x(tN ),x(tN )] |
(1.83) |
||
j 1 |
|
|
|
|
N t i |
|
d |
|
|
{L(i) (x,u,t) T (t)[f (i) (x,u,t) |
x(t)])dt. |
|
||
|
|
|||
i 1 t i |
|
dt |
|
|
Введем обозначения: |
(1.84) |
|||
Ф K [ ( j) ]T ( j) |
||||
H(i) (x,u, ,t) L(i) (x,u,t) T (t)f (i) (x,u,t). |
(1.85) |
28
Тогда первая вариация функционала (1.82) будет иметь вид
|
|
|
|
|
|
|
|
|
N |
|
Ф |
|
|
|
|
|
|
|
|
|
Ф |
|
|
|
|
Ф |
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||
dJ(x,u) { |
|
|
|
|
|
dti |
|
|
dx(ti |
) |
|
|
|
|
dx(ti |
)} |
||||||||||||||||||||||||||||||
t |
i |
x(t |
) |
t |
||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
i |
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|||||||
|
|
N |
|
|
|
|
|
|
|
|
|
|
d |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
d |
|
|
|
|
|
|
|||||||
{[H(i) T |
x} |
|
t t ]dti [H(i) T |
|
|
x] |
|
t t |
dti 1} |
|||||||||||||||||||||||||||||||||||||
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
dt |
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
dt |
|
|
i 1 |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
N |
|
|
|
|
ttii 1 |
|
|
|
N t i |
|
|
|
|
|
|
(i) |
d T(t)] x H |
(i) |
||||||||||||||||||||||||||
T x |
{[ H |
|
|
u}dt. |
||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
i 1 |
|
|
|
|
|
|
|
|
|
i 1 |
|
|
|
|
|
|
|
|
x |
|
dt |
|
|
|
|
|
|
|
|
|
|
|
|
u |
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
t i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Используя соотношения |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
dx(ti ) x(ti ) x(ti )dti , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
dx(ti ) x(ti ) x(ti )dti , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||
исключим x(ti ), x(ti ) из выражения (1.86): |
||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
N |
Ф |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
d |
|
(x,u) [ |
H(i)(ti ) H(i 1)(ti )]dti |
|
||||||||||||||||||||||||||||||||||||||||||
J |
||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
i 0 |
|
ti |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
N |
Ф |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
N |
|
|
Ф |
|
|
|
|
|
|||||||||||||
[ |
|
|
T(ti )]dx(ti ) [ |
|
T(ti )]dx(ti ) |
|||||||||||||||||||||||||||||||||||||||||
|
|
|
) |
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||
|
|
i 1 |
x(ti |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i 1 x(ti ) |
|
|
|||||||||||||||||||
|
|
|
|
N |
t i |
|
H |
(i) |
|
|
|
|
d |
|
|
|
|
|
|
|
|
|
|
H |
(i) |
|
|
|
|
|
||||||||||||||||
{[ |
|
|
|
|
|
|
T (t)] x |
|
|
|
u}dt. |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||
|
|
|
i 1 t i |
|
|
x |
|
|
|
|
|
dt |
|
|
|
|
|
u |
|
|
|
|
|
|||||||||||||||||||||||
Отметим, что H(0) H(N 1) |
0. |
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||
Выберем (t) |
|
так, чтобы удовлетворялись уравнения |
||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
d |
|
|
|
|
|
|
|
|
|
|
|
|
|
H(i) (x,u, ,t) T |
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
(t) |
|
|
|
|
|
|
|
|
|
|
|
|
|
, |
|
|
|||||||||||||||||||||
|
|
|
|
|
|
dt |
|
|
x(t) |
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
ti 1 |
< t |
|
|
< ti , |
|
i 1,...,N, |
|
|
|
|
|
||||||||||||||||||||||||||||||
(t ) |
|
|
|
|
Ф |
|
|
|
|
T |
|
|
|
|
|
|
|
i 1,...,N, |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
, |
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||
|
x(ti ) |
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
(t ) |
|
|
|
|
Ф |
|
|
|
|
T |
|
|
|
|
|
|
|
i 1,...,N. |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
, |
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||
|
x(ti ) |
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(1.86)
(1.87)
(1.88)
(1.89)
(1.90)
(1.91)
Моменты ti |
определяются из соотношения: |
|
||||
|
Ф |
H(i) (ti ) H(i) (ti ) 0, |
i 1,...,N. |
(1.92) |
||
|
|
|||||
|
ti |
|
|
|
|
|
В задачах, в которых моменты ti |
заданы, условия (1.92) |
не являются |
||||
необходимыми, так как в этом случае dti |
0 в уравнениях (1.88). Так же, если |
|||||
x(t0 ) задано, то |
dx(t0 } 0 |
в (1.88) |
и уравнение (1.91) |
не является |
||
необходимым. |
|
|
|
|
Множители ( j) определяются так, чтобы удовлетворять ограничениям
(1.81).
Отметим, что вариации u(t) в уравнении для первой вариации
29
|
|
N t |
i |
H |
(i) |
|
|
d |
J |
(x,u) |
|
|
|
udt |
|
|
u |
||||||
|
|
i 1 |
t |
|
|||
|
|
|
i |
|
|
|
не являются произвольными, а должны быть такими, чтобы (вместе с
вариациями dx(ti ),dx(ti ),dti ) |
не нарушать заданных граничных условий. Эти |
||||||||
условия можно записать в виде |
|||||||||
|
|
N |
|
(i) |
|
(i) |
|||
d (i) [ |
|
dti |
|
|
|
dx(ti ) |
|||
|
|
|
) |
||||||
|
|
i |
ti |
|
x(ti |
|
|||
|
(i) |
|
|
|
|
|
(1.93) |
||
|
|
|
|
|
|
|
|
||
|
|
dx(t )] 0, |
i 1,...,N. |
||||||
|
|||||||||
|
x(ti ) |
i |
|
|
|
|
|
|
Уравнения (1.89)-(1.91) представляют собой многоточечную краевую задачу и вместе с условием стационарности функционала представляют собой необходимые условия Эйлера – Лагранжа. Условия (1.92) являются условиями трансверсальности.
§ 1.6. Задачи оптимизации при наличии ограничений на траекторию
1.6.1.Интегральные ограничения
Взадачах, рассмотренных в предыдущих параграфах настоящей главы, ограничения накладывались в конечной точке траекторий. В этих задачах в конечный момент времени задавались функции от фазовых координат, а в начальный момент – значения всех фазовых координат. Добавим к этим ограничениям еще одно. Потребуем, чтобы некоторый интеграл вдоль оптимальной траектории принимал заранее заданное значение. Таким образом, пусть
T |
|
xn 1(T) N(x,u,t)dt , |
(1.94) |
t0 |
|
где N - заданная скалярная функция, |
xn 1(T)- заданное число. |
Присоединим к исходной системе уравнений уравнение состояния
|
d |
xn (t) N(x,u,t)dt |
(1.95) |
|
|
|
|||
|
dt |
|
|
|
с граничными условиями |
|
|||
|
xn 1(t0 ) 0, |
xn 1(T) задано. |
(1.96) |
|
Пусть |
множитель Лагранжа. Гамильтониан расширенной системы |
|||
имеет вид |
|
|
||
|
H(x,u, , ,t) L(x,u,t) T (t) f (x,u,t) N(x,u,t). |
(1.97) |
Необходимые условия оптимальности будут записываться в виде двухточечной краевой задачи
30
|
d |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
||
|
|
x(t) f (x,u,t), |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
dt |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
d |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
(t) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
dt |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
T |
|
N(x,u,t) |
T |
L(x,u,t) |
T |
|
|||||||||||
|
|
|
|
f (x,u,t) |
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
(t) |
|
|
|
|
|
(t) |
|
|
|
|
, |
|
|||||||||
x(t) |
x(t) |
|
x(t) |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
x(t0 ) x0 , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
K(x(T)) |
T |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
(T) |
|
|
|
|
|
|
|
, |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
x(T) |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
H(x,u, , ,t) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
u(t) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
T (t) |
f (x,u,t) |
|
L(x,u,t) |
|
N(x,u,t) |
0. |
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
u(t) |
u(t) |
|
u(t) |
|
|
|
|
|
|
|||||||||
|
d |
(t) |
N(x,u,t) |
, |
откуда |
const . |
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|||||||||||||||||||||
dt |
|
|
|
|
xn (t) |
|
|
|
|
|
|
|
|
|
|
|
|
|
(1.98)
(1.99)
(1.100)
(1.101)
Таким образом, в задачах с ограничениями типа (1.94) величина N(x,u,t) присоединяется к гамильтониану исходной системы с постоянным множителем Лагранжа , который является коэффициентом чувствительности критерия качества J(x,u) к изменению xn 1(t), т.е.
J(x,u) .
xn 1(t)
1.6.2.Ограничения в виде равенства на управляющие переменные
Кпостановке задач об оптимальном управлении, рассматриваемых в данной главе, добавим дополнительное ограничение на управляющие воздействия в виде равенства
C(u,t) 0, |
(1.102) |
где u(t) Rr , r 2, C(u,t)- скалярная функция. Условие |
r 2 необходимо для |
того, чтобы задача поиска оптимального управления не была бы тривиальной (при r 1 ограничение (1.102) полностью определяет функцию u(t) и проблемы оптимизации не возникает).
Образуем гамильтониан
H(x,u, , ,t)
(1.103)
L(x,u,t) T(t)f (x,u,t) С(u,t).
Такая форма гамильтониана вносит изменения только в условие оптимальности
H(x,u, , ,t)
u(t) |
|
|
(1.104) |
|||
T(t) |
f (x,u,t) |
|
L(x,u,t) |
(t) |
С(u,t) |
0. |
u(t) |
u(t) |
|
||||
|
|
|
u(t) |
31
Это условие вместе с (1.103) определяет r компонент вектора управления u(t) и скалярную функцию (t).
1.6.3. Ограничения в виде равенства на функции управления и фазовые координаты
К |
общей |
постановке задачи |
|
оптимизации |
добавим |
ограничения |
||||||||||||||||
C(x,u,t) 0, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(1.105) |
|||||
причем для любого u(t) |
должно выполняться условие: |
|
C(x,u,t) |
|
0. |
|||||||||||||||||
|
u(t) |
|||||||||||||||||||||
Образуем гамильтониан |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
H(x,u, , ,t) L(x,u,t) T (t)f (x,u,t) С(x,u,t). |
|
|
|
(1.106) |
|||||||||||||||||
Условия оптимальности в этом случае имеют вид (1.104) |
|
|||||||||||||||||||||
|
H(x,u, , ,t) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
u(t) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(1.107) |
|
T(t) |
f (x,u,t) |
|
L(x,u,t) |
|
|
С(x,u,t) |
|
|
|
|
|
|||||||||||
|
(t) |
0, |
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
u(t) |
u(t) |
|
|
u(t) |
|
|
|
|
|
||||||||
а уравнение Эйлера – Лагранжа должны быть модифицированы |
|
|||||||||||||||||||||
|
d |
(t) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
dt |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(1.108) |
|
|
|
|
f (x,u,t) T |
L(x,u,t) T |
C(x,u,t) T |
|
|
|
||||||||||||||
|
|
|
|
(t) |
|
|
|
|
|
(t). |
|
|
|
|
||||||||
x(t) |
x(t) |
x(t) |
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Необходимое условие (1.107) и ограничения (1.105) составляют систему r 1 уравнений с r 1 неизвестными величинами u(t) и (t).
1.6.4. Ограничения в виде равенства на функции координат
Если функция, задающая ограничения, явно не зависит от управляющих воздействий, то в этом случае возникают дополнительные осложнения. Пусть задано ограничение
S(x,t) 0, |
t [t0 ,T]. |
|
(1.109) |
|||||
Тогда |
|
|
|
|
|
|||
|
dS(x,t) |
|
S(x,t) |
|
S(x,t) |
f (x,u,t) 0 . |
(1.110) |
|
|
|
|
x(t) |
|||||
|
dt |
t |
|
|
|
Выражение (1.110) может оказаться либо явно зависящим от u(t), либо снова не зависящим от u(t). Если это выражение зависит от u(t), то оно играет роль совместного ограничения на управляющие воздействия и фазовые переменные, аналогично равенству (1.105). Однако в отличие от задачи (1.6.3) следует либо исключить одну компоненту вектора x(t), выразив ее с помощью (1.109) через остальные (n 1) компонент, либо присоединить (1.109) в качестве граничного условия в точках t t0 или t T .
Если же выражение (1.110) не содержит явно u(t), то его можно еще раз
продифференцировать и подставить d x(t) f (x,u,t); эта процедура может d
32