6251
.pdf
|
)+ [cɺ(tf |
|
)] |
∂F |
|
|
|
|
|
∂F |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
||||
F(tf |
)− xɺ(tf |
|
|
|
|
δtf |
− η(t0 ) |
∂ xɺ |
|
|
= 0 . |
(4.2.23) |
||
∂ xɺ |
|
|
|
|
||||||||||
|
|
|
|
|
t f |
|
|
|
|
t0 |
|
|
||
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Из первого условия, как и ранее, следует уравнение Эйлера-Лагранжа (4.2.16).
Второе слагаемое в условии (4.2.23) равно нулю, если величина ∂F
∂ xɺ t0
ограничена, поэтому равно нулю должно быть выражение в фигурных скобках соотношения (4.2.23). Отсюда следует уравнение
∂F |
|
|
F(tf )= [xɺ(tf )− cɺ(tf )]∂ xɺ |
. |
(4.2.24) |
|
t f |
|
Соотношение (4.2.24) называется условием трансверсальности. Нелишне отметить, что уравнение (4.2.16) в начальный момент времени (то есть при t = t0 ) может и не выполняться, поскольку η(t0 )= 0 и тогда условие (4.2.22) справедливо. Важно лишь, чтобы в начальный мо-
мент времени x(t) была бы непрерывна, а |
∂F – конечна. |
|
∂ xɺ |
Если речь идёт о системе регулирования, когда осуществляется переход от одного существенного режима работы к другому, то есть от одного значения x к другому значению, конечная кривая x = c(t) является горизонтальной прямой и cɺ(tf )= 0 . В этом случае условие трансверсальности (4.2.24) упрощается и принимает вид
221
∂F |
|
|
F(tf )= xɺ(tf )∂ xɺ |
. |
(4.2.25) |
|
t f |
|
Можно показать, что в случае, когда функция F явно не зависит от времени, соотношения (4.2.16) и (4.2.25) сводятся к одному, а именно:
F(x, xɺ)= xɺ |
∂F |
|
∂ xɺ . |
(4.2.26) |
Действительно, дифференцируя обе части последнего выражения по t как сложную функцию, после упрощения получаем
|
∂F |
|
d ∂F |
|
||||
xɺ |
|
|
− |
|
|
|
|
= 0 . |
|
|
|
||||||
|
∂ x |
|
dt |
|
ɺ |
|
|
|
|
|
|
|
∂ x |
|
|
||
|
|
|
|
|
|
|
|
Обычно в процессе управления производная xɺ не обращается в нуль, поэтому нулю должно равняться выражение в квадратных скобках, а это левая часть уравнения Эйлера-Лагранжа (4.2.16).
Таким образом, оптимальную систему регулирования, осуществляющую переход от одного рабочего режима к другому за время (t0 ,tf ),
определяет единственное условие (4.2.26).
4 . 2 . 3 . Оптим ально е упр авление по м иним ум у интегр ально го кр итер ия
Теперь рассмотрим применение вариационного исчисления к задаче оптимального управления с интегральным критерием.
Пусть динамика объекта задана уравнением 222
xɺ(t)= f (x,u), |
(4.2.27) |
где x – выход объекта, u – управляющее воздействие при заданном начальном значении
x(t0 )= x0 . |
(4.2.28) |
Требуется сформировать управление u(t), минимизирующее интегральный критерий
t f |
|
I = ∫ F(x,u)dt . |
(4.2.29) |
t0 |
|
Функция F в критерии (4.2.29) может описывать отклонение от желаемого состояния, потребление энергии, стоимость САУ и т.п.
Обозначая функции, доставляющие минимум критерия (4.2.29) через x(t) и u(t), а некоторые близкие к ним – через x(t)и u(t) соответственно, можно записать
x = x + εη, |
(4.2.30) |
u = u + εξ, |
где η и ξ – в достаточной мере произвольные функции времени, определённые на интервале (t0 ,tf ), а ε – малый параметр.
Подставляя выражения (4.2.30) в критерий (4.2.29) вместо x(t) и u(t), получим
223
I(ε)= ∫f F(x + εη,u + εξ)dt .
t0
Разложив в последней формуле подынтегральную функцию в ряд Тейлора вблизи оптимальной траектории, получим
|
f |
|
|
η |
∂F |
+ ξ |
∂F |
|
+ членыс ε2 |
, ε3 |
|
I(ε)= ∫ |
F(x,u)+ ε |
|
|
|
,... dt . (4.2.31) |
||||||
t |
0 |
|
|
|
∂ x |
|
∂u |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Необходимое условие экстремума функции (4.2.31) – равенство
∂I(ε) |
|
|
|
= 0 . |
|
∂ε |
|
ε=0 |
|
Взяв производную по ε от правой части выражения (4.2.31) и поменяв местами порядок дифференцирования по ε и интегрирования по t, приравняем полученное выражение нулю при ε=0
t f |
|
∂F |
|
∂F |
|
∫ |
|
|
|
|
|
|
η |
|
+ ξ |
dt . |
(4.2.32) |
t0 |
|
∂ x |
|
∂ u |
|
Вернёмся к уравнению динамики объекта (4.2.27) и заменим x(t) и u(t) на x(t)и u(t) соответственно. Получим
xɺ(t)+ εηɺ = f (x + εηɺ,u + εξ).
224
Разложив правую часть последнего выражения в ряд Тейлора вблизи оптимальной траектории по малым значениям ε, и ограничиваясь линейными членами, получим
x(t)+ εη = |
|
η |
∂f |
+ ξ |
∂f |
|
|
f (x,u)+ ε |
|
|
. |
||||
ɺ |
ɺ |
|
|
∂x |
|
∂u |
|
|
|
|
|
С учётом уравнения (4.2.27) последнее соотношение превратится в уравнение
ɺ |
∂f |
+ ξ |
∂f |
(4.2.33) |
η = η |
∂x |
∂u |
с начальными условиями η(t0 )= 0 .
Решая уравнение (4.2.33) относительно ξ, подставим это значение в уравнение (4.2.32)
|
|
|
|
|
t f |
|
∂F |
|
η − η |
∫ |
η |
|
+ |
|
|
|
∂x |
|
ɺ |
t0 |
|
|
|
|
|
|
|
|
|
∂F
∂f ∂u dt = 0 . (4.2.34) ∂x ∂f
∂u
Слагаемое, связанное с производной ηɺ в выражении (4.2.34), найдем, интегрируя по частям
t f |
∂F |
|
|
∂F |
|
t f |
|||
|
|
|
|||||||
|
|
|
|
|
|
|
|
||
∂u |
|
|
∂u |
|
|
|
|||
ɺ |
|
|
|
|
|
|
|||
∫η |
∂f |
dt = η |
|
∂f |
|
|
|
||
t0 |
|
|
|
|
|||||
∂u |
|
|
∂u |
|
t0 |
||||
|
|
|
|
|
|||||
|
|
|
|
|
|
|
∂F |
|
||||
t f |
d |
|
∂u |
|
|
|
|
− ∫η |
|
|
|
|
|
dt . |
(4.2.35) |
|
|
∂f |
|
||||
t0 |
dt |
|
|
|
|||
∂u |
|
|
|||||
|
|
|
|
|
|
225
Поскольку в начальной точке η(t0 )= 0 , то первое слагаемое в последнем выражении будет равно нулю, если положить в конечной точке
∂F |
|
|
|
|
|
|
|
∂ u |
|
= 0 . |
(4.2.36) |
∂f |
|
||
|
|
|
∂ u t f
Тогда из выражений (4.2.34) и (4.2.35) следует, что
|
|
|
∂F |
|
∂f |
|
− |
∂F |
|
∂f |
|
|
|
|
∂F |
|||
t f |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
∂ x |
|
|
∂ u |
∂ x |
|
|
|
∂ u |
||||||||||
∫ |
η |
|
∂ u |
|
|
− |
d |
|
|
dt = 0 . |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
t |
|
|
|
|
|
∂f |
|
|
|
|
|
dt |
∂f |
|
|
|||
|
0 |
|
|
|
|
∂ u |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
∂ u |
Так как последнее уравнение должно выполняться при произвольных функциях η, нулю должно равняться выражение в квадратных скобках. Таким образом, уравнение Эйлера-Лагранжа для данной задачи оптимального управления примет вид
∂F |
|
∂f |
|
− |
∂F |
|
∂f |
|
|
|
∂F |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|||||||
∂ x |
|
∂ u |
|
|
∂ u |
|
∂ x |
− |
d |
∂u |
= 0 . |
(4.2.37) |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
∂f |
|
|
|
|
dt |
∂f |
||||||
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∂u |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
∂u |
|
|
Решая последнее уравнение с учётом граничных условий (4.2.28) и (4.2.36), определяем оптимальное управление u(t). Это классическая задача вариационного исчисления с заданными условиями на концах интервала.
226
Аналитическое решение двухточечной краевой задачи возможно только в исключительных случаях, поэтому, как правило, приходится прибегать к методу последовательных приближений. Этот метод состоит в выборе наугад некоторого конечного значения x(tf )= xf и численном
решении уравнения Эйлера-Лагранжа при выбранном значении xf и заданной величине x0. Затем вычисляем разность между полученным
∂F |
|
|
|
|
|
∂u |
и заданным конечными условиями. Поскольку эта разность с пер- |
|
∂f |
||
|
∂u t f
вого раза не будет равна нулю, процесс продолжаем до тех пор, пока эта разность не станет меньше заданной достаточно малой величины.
Можно получить и многомерный аналог уравнения Эйлера-Лагранжа (4.2.37).
4 . 2 . 4 . Учёт о граничений с по мощью м ето да м но жителей Лагр анжа .
До сих пор рассматривались задачи оптимального управления при отсутствии каких-либо ограничений на переменные состояния или на управляющие воздействия. Но на практике всегда имеются некоторые физические ограничения, как на управляемый процесс, так и на управляющие воздействия. Обычно учёт ограничений проводят при помощи множителей Лагранжа. Этот метод даёт изящный подход к решению задачи отыскания экстремума функционала, подчинённого одному или нескольким ограничивающим зависимостям, когда последние настолько сложны, что их трудно использовать для исключения свободных пара-
227
метров. Метод множителей Лагранжа делает не нужным решение уравнений, задающих ограничения с целью исключения свободных параметров.
Обозначим функцию, экстремум которой требуется найти, через
P(u)= P(u1,u2 ,...ur ).
Пусть на управление u накладываются ограничения вида |
|
Q(u)= Q(u1,u2 ,...ur )≤ c , |
(4.2.38) |
где c = [c1 c2 ... cr ]T – r-мерный вектор-столбец.
Тогда вектор u, доставляющий максимум или минимум функции P, можно найти, определив условия максимума или минимума промежуточ-
ной функции |
|
G(u)= P(u)+ λT Q(u), |
(4.2.39) |
где λ = [λ1 λ2 ... λr ]T – r-мерный вектор-столбец, именуемый векторным множителем Лагранжа.
Определив экстремум этой новой функции, получим вектор u как функцию векторного множителя Лагранжа λ. Подставив найденный век-
тор |
|
u(λ)= u(λ1,λ2 ,...λr ) |
(4.2.40) |
в систему ограничительных соотношений (4.2.38), получим r уравнений относительно r компонент вектора λ = [λ1 λ2 ... λr ]T . Решая полу-
228
ченные уравнения, определяем компоненты вектора λ и, подставив эти значения в соотношение (4.2.40), получим вектор оптимального управления.
Пример 4.2.4. Пусть уравнения динамики объекта являются линейными. В общем случае эти уравнения записываются в матричном виде
|
|
|
|
x(t)= Ax(t)+ Bu(t), |
(4.2.41) |
|
|
|
|
ɺ |
|
где x = [x1 |
x2 |
... |
xn ]T |
– как обычно, n-мерный вектор состояния объ- |
|
екта, u = [u1 |
u2 |
... |
ur ]T |
– r-мерный вектор управления, а A и B – мат- |
|
рицы соответствующих размерностей. |
|
Пусть требуется за время Т перевести объект из заданного начального
состояния x(0)= x |
0 |
в конечное состояние1 |
|
|
|
|
|
|
|
x(T )= 0 . |
(4.2.42) |
Найдём вектор оптимального управления u (t), доставляющий минимум интегрального квадратичного критерия
I(u)= T∫uT Hudt , |
(4.2.43) |
0 |
|
где матрица квадратичной формы H является положительно определённой и симметрической.
1 Управление, целью которого является перевод объекта в заданное конечное состояние в заданный момент времени, называется терминальным управлением.
229
Конечное состояние (4.2.42) можно принять за систему ограничительных соотношений.
Согласно методу множителей Лагранжа преобразуем вначале ограничительные соотношения (4.2.42) в интегральную форму, поскольку критерий оптимальности (4.2.43) задан в интегральном виде.
Как известно [1], решение уравнений состояния имеет вид
x(t)= Φ(t)x0 + ∫t Φ(t − τ)Bu(τ)dτ ,
0
где Φ(t)= eAt – переходная матрица.
В конечной точке t=T вектор состояния равен
x(T )= Φ(T )x0 + T∫Φ(T − τ)Bu(τ)dτ .
0
С учётом соотношений (4.2.42) последнее уравнение превратится в уравнение
Φ(T )x0 + T∫Φ(T − τ)Bu(τ)dτ = 0 .
0
Решая это уравнение относительно x0 , и учитывая свойства переходной матрицы, получим
x0 = −T∫Φ−1(t)Bu(t)dt = 0 . |
(4.2.44) |
0 |
|
230