Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

6251

.pdf
Скачиваний:
2
Добавлен:
13.02.2021
Размер:
1.43 Mб
Скачать

 

)+ [cɺ(tf

 

)]

F

 

 

 

 

 

F

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F(tf

)xɺ(tf

 

 

 

 

δtf

− η(t0 )

xɺ

 

 

= 0 .

(4.2.23)

xɺ

 

 

 

 

 

 

 

 

 

t f

 

 

 

 

t0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из первого условия, как и ранее, следует уравнение Эйлера-Лагранжа (4.2.16).

Второе слагаемое в условии (4.2.23) равно нулю, если величина F

xɺ t0

ограничена, поэтому равно нулю должно быть выражение в фигурных скобках соотношения (4.2.23). Отсюда следует уравнение

F

 

 

F(tf )= [xɺ(tf )cɺ(tf )]xɺ

.

(4.2.24)

 

t f

 

Соотношение (4.2.24) называется условием трансверсальности. Нелишне отметить, что уравнение (4.2.16) в начальный момент времени (то есть при t = t0 ) может и не выполняться, поскольку η(t0 )= 0 и тогда условие (4.2.22) справедливо. Важно лишь, чтобы в начальный мо-

мент времени x(t) была бы непрерывна, а

F – конечна.

 

xɺ

Если речь идёт о системе регулирования, когда осуществляется переход от одного существенного режима работы к другому, то есть от одного значения x к другому значению, конечная кривая x = c(t) является горизонтальной прямой и cɺ(tf )= 0 . В этом случае условие трансверсальности (4.2.24) упрощается и принимает вид

221

F

 

 

F(tf )= xɺ(tf )xɺ

.

(4.2.25)

 

t f

 

Можно показать, что в случае, когда функция F явно не зависит от времени, соотношения (4.2.16) и (4.2.25) сводятся к одному, а именно:

F(x, xɺ)= xɺ

F

 

xɺ .

(4.2.26)

Действительно, дифференцируя обе части последнего выражения по t как сложную функцию, после упрощения получаем

 

F

 

d F

 

xɺ

 

 

 

 

 

 

= 0 .

 

 

 

 

x

 

dt

 

ɺ

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

Обычно в процессе управления производная xɺ не обращается в нуль, поэтому нулю должно равняться выражение в квадратных скобках, а это левая часть уравнения Эйлера-Лагранжа (4.2.16).

Таким образом, оптимальную систему регулирования, осуществляющую переход от одного рабочего режима к другому за время (t0 ,tf ),

определяет единственное условие (4.2.26).

4 . 2 . 3 . Оптим ально е упр авление по м иним ум у интегр ально го кр итер ия

Теперь рассмотрим применение вариационного исчисления к задаче оптимального управления с интегральным критерием.

Пусть динамика объекта задана уравнением 222

xɺ(t)= f (x,u),

(4.2.27)

где x – выход объекта, u – управляющее воздействие при заданном начальном значении

x(t0 )= x0 .

(4.2.28)

Требуется сформировать управление u(t), минимизирующее интегральный критерий

t f

 

I = F(x,u)dt .

(4.2.29)

t0

 

Функция F в критерии (4.2.29) может описывать отклонение от желаемого состояния, потребление энергии, стоимость САУ и т.п.

Обозначая функции, доставляющие минимум критерия (4.2.29) через x(t) и u(t), а некоторые близкие к ним – через x(t)и u(t) соответственно, можно записать

x = x + εη,

(4.2.30)

u = u + εξ,

где η и ξ – в достаточной мере произвольные функции времени, определённые на интервале (t0 ,tf ), а ε – малый параметр.

Подставляя выражения (4.2.30) в критерий (4.2.29) вместо x(t) и u(t), получим

223

I(ε)= f F(x + εη,u + εξ)dt .

t0

Разложив в последней формуле подынтегральную функцию в ряд Тейлора вблизи оптимальной траектории, получим

 

f

 

 

η

F

+ ξ

F

 

+ членыс ε2

, ε3

 

I(ε)=

F(x,u)+ ε

 

 

 

,... dt . (4.2.31)

t

0

 

 

 

x

 

u

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Необходимое условие экстремума функции (4.2.31) – равенство

I(ε)

 

 

= 0 .

∂ε

 

ε=0

 

Взяв производную по ε от правой части выражения (4.2.31) и поменяв местами порядок дифференцирования по ε и интегрирования по t, приравняем полученное выражение нулю при ε=0

t f

 

F

 

F

 

 

 

 

 

 

 

η

 

+ ξ

dt .

(4.2.32)

t0

 

x

 

u

 

Вернёмся к уравнению динамики объекта (4.2.27) и заменим x(t) и u(t) на x(t)и u(t) соответственно. Получим

xɺ(t)+ εηɺ = f (x + εηɺ,u + εξ).

224

Разложив правую часть последнего выражения в ряд Тейлора вблизи оптимальной траектории по малым значениям ε, и ограничиваясь линейными членами, получим

x(t)+ εη =

 

η

f

+ ξ

f

 

f (x,u)+ ε

 

 

.

ɺ

ɺ

 

 

x

 

u

 

 

 

 

С учётом уравнения (4.2.27) последнее соотношение превратится в уравнение

ɺ

f

+ ξ

f

(4.2.33)

η = η

x

u

с начальными условиями η(t0 )= 0 .

Решая уравнение (4.2.33) относительно ξ, подставим это значение в уравнение (4.2.32)

 

 

 

 

 

t f

 

F

 

η − η

η

 

+

 

 

x

 

ɺ

t0

 

 

 

 

 

 

 

 

F

f u dt = 0 . (4.2.34) x f

u

Слагаемое, связанное с производной ηɺ в выражении (4.2.34), найдем, интегрируя по частям

t f

F

 

 

F

 

t f

 

 

 

 

 

 

 

 

 

 

 

u

 

 

u

 

 

 

ɺ

 

 

 

 

 

 

η

f

dt = η

 

f

 

 

 

t0

 

 

 

 

u

 

 

u

 

t0

 

 

 

 

 

 

 

 

 

 

 

 

F

 

t f

d

 

u

 

 

 

η

 

 

 

 

 

dt .

(4.2.35)

 

 

f

 

t0

dt

 

 

 

u

 

 

 

 

 

 

 

 

225

Поскольку в начальной точке η(t0 )= 0 , то первое слагаемое в последнем выражении будет равно нулю, если положить в конечной точке

F

 

 

 

 

 

 

 

u

 

= 0 .

(4.2.36)

f

 

 

 

 

u t f

Тогда из выражений (4.2.34) и (4.2.35) следует, что

 

 

 

F

 

f

 

F

 

f

 

 

 

 

F

t f

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

u

x

 

 

 

u

η

 

u

 

 

d

 

 

dt = 0 .

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

f

 

 

 

 

 

dt

f

 

 

 

0

 

 

 

 

u

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u

Так как последнее уравнение должно выполняться при произвольных функциях η, нулю должно равняться выражение в квадратных скобках. Таким образом, уравнение Эйлера-Лагранжа для данной задачи оптимального управления примет вид

F

 

f

 

F

 

f

 

 

 

F

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

u

 

 

u

 

x

d

u

= 0 .

(4.2.37)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f

 

 

 

 

dt

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u

 

 

Решая последнее уравнение с учётом граничных условий (4.2.28) и (4.2.36), определяем оптимальное управление u(t). Это классическая задача вариационного исчисления с заданными условиями на концах интервала.

226

Аналитическое решение двухточечной краевой задачи возможно только в исключительных случаях, поэтому, как правило, приходится прибегать к методу последовательных приближений. Этот метод состоит в выборе наугад некоторого конечного значения x(tf )= xf и численном

решении уравнения Эйлера-Лагранжа при выбранном значении xf и заданной величине x0. Затем вычисляем разность между полученным

F

 

 

 

u

и заданным конечными условиями. Поскольку эта разность с пер-

f

 

u t f

вого раза не будет равна нулю, процесс продолжаем до тех пор, пока эта разность не станет меньше заданной достаточно малой величины.

Можно получить и многомерный аналог уравнения Эйлера-Лагранжа (4.2.37).

4 . 2 . 4 . Учёт о граничений с по мощью м ето да м но жителей Лагр анжа .

До сих пор рассматривались задачи оптимального управления при отсутствии каких-либо ограничений на переменные состояния или на управляющие воздействия. Но на практике всегда имеются некоторые физические ограничения, как на управляемый процесс, так и на управляющие воздействия. Обычно учёт ограничений проводят при помощи множителей Лагранжа. Этот метод даёт изящный подход к решению задачи отыскания экстремума функционала, подчинённого одному или нескольким ограничивающим зависимостям, когда последние настолько сложны, что их трудно использовать для исключения свободных пара-

227

метров. Метод множителей Лагранжа делает не нужным решение уравнений, задающих ограничения с целью исключения свободных параметров.

Обозначим функцию, экстремум которой требуется найти, через

P(u)= P(u1,u2 ,...ur ).

Пусть на управление u накладываются ограничения вида

 

Q(u)= Q(u1,u2 ,...ur )c ,

(4.2.38)

где c = [c1 c2 ... cr ]T r-мерный вектор-столбец.

Тогда вектор u, доставляющий максимум или минимум функции P, можно найти, определив условия максимума или минимума промежуточ-

ной функции

 

G(u)= P(u)+ λT Q(u),

(4.2.39)

где λ = [λ1 λ2 ... λr ]T r-мерный вектор-столбец, именуемый векторным множителем Лагранжа.

Определив экстремум этой новой функции, получим вектор u как функцию векторного множителя Лагранжа λ. Подставив найденный век-

тор

 

u(λ)= u(λ1,λ2 ,...λr )

(4.2.40)

в систему ограничительных соотношений (4.2.38), получим r уравнений относительно r компонент вектора λ = [λ1 λ2 ... λr ]T . Решая полу-

228

ченные уравнения, определяем компоненты вектора λ и, подставив эти значения в соотношение (4.2.40), получим вектор оптимального управления.

Пример 4.2.4. Пусть уравнения динамики объекта являются линейными. В общем случае эти уравнения записываются в матричном виде

 

 

 

 

x(t)= Ax(t)+ Bu(t),

(4.2.41)

 

 

 

 

ɺ

 

где x = [x1

x2

...

xn ]T

– как обычно, n-мерный вектор состояния объ-

екта, u = [u1

u2

...

ur ]T

r-мерный вектор управления, а A и B – мат-

рицы соответствующих размерностей.

 

Пусть требуется за время Т перевести объект из заданного начального

состояния x(0)= x

0

в конечное состояние1

 

 

 

 

 

 

x(T )= 0 .

(4.2.42)

Найдём вектор оптимального управления u (t), доставляющий минимум интегрального квадратичного критерия

I(u)= TuT Hudt ,

(4.2.43)

0

 

где матрица квадратичной формы H является положительно определённой и симметрической.

1 Управление, целью которого является перевод объекта в заданное конечное состояние в заданный момент времени, называется терминальным управлением.

229

Конечное состояние (4.2.42) можно принять за систему ограничительных соотношений.

Согласно методу множителей Лагранжа преобразуем вначале ограничительные соотношения (4.2.42) в интегральную форму, поскольку критерий оптимальности (4.2.43) задан в интегральном виде.

Как известно [1], решение уравнений состояния имеет вид

x(t)= Φ(t)x0 + t Φ(t − τ)Bu(τ)dτ ,

0

где Φ(t)= eAt – переходная матрица.

В конечной точке t=T вектор состояния равен

x(T )= Φ(T )x0 + TΦ(T − τ)Bu(τ)dτ .

0

С учётом соотношений (4.2.42) последнее уравнение превратится в уравнение

Φ(T )x0 + TΦ(T − τ)Bu(τ)dτ = 0 .

0

Решая это уравнение относительно x0 , и учитывая свойства переходной матрицы, получим

x0 = −TΦ1(t)Bu(t)dt = 0 .

(4.2.44)

0

 

230

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]