Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
7
Добавлен:
16.04.2015
Размер:
103.55 Кб
Скачать

Лекция 15. Постановка задачи оптимальной стабилизации в линейных системах. Пример оптимальной стабилизации.

Построение оптимального управления в линейной системе с квадратичным функционалом.

Изучая проблему построения стабилизирующего управления, зачастую следует учитывать практические соображения, которые отвечают реалистичности построенного управления. Например, требуется, чтобы затраты на отработку управления были минимальными. Такого рода постановки задач можно реализовать с помощью оптимизации критерия качества - функционала, сформированного исходя из тех или иных характеристик реализуемого управления. В данной лекции будет рассмотрена проблема построения стабилизирующего управления в линейных системах с учетом того, что управление должно быть оптимальным (в том или ином смысле) или, более коротко, будет рассмотрена задачи оптимальной стабилизации.

Приведем пример оптимальной стабилизации. Рассмотрим систему

x = ax + bu;

в которой x - скалярная переменная, u - скалярное управление, a è b - константы. Управление ищется в виде синтеза

u = mx;

ãäå m - постоянная величина. Задан функционал, описывающий затраты на отработку управления, в виде

Z1

J(u) = u2dt:

t0

Этот функционал и предполагается минимизировать на классе стабилизирующих управлений. Подставим допустимое управление в управляемую систему

x = (a + bm)x = dx:

Для того, чтобы управление было стабилизирующим, необходимо и достаточно, чтобы

a + bm < 0:

Решение x(t) и управление u = u(t) имеют вид

x = x0ed(t¡t0); ) u = mx0ed(t¡t0);

подставляя последнее равенство в функционал J(u) имеем

J(u) = J(m; x0) = m2x02 tZ0

e2d(t¡t0)dt =

1

 

71

m2x0 µ

2d

¶¯¯t0

= ¡2(a + bm):

2

e2d(t¡t0)

1

 

m2x02

 

 

¯

 

 

 

 

 

¯

 

 

 

В случае, когда a < 0, оптимальным будет управление при m = 0. Это видно также из

того, что нулевое решение управляемой системы при a < 0 является асимптотически

устойчивым и отработка управления не имеет смысла при минимизации функционале, учитывающим затраты на управление. В случае, когда a > 0, у функционала

J(m; x0) существует гладкий экстремум по m, для его нахождения возьмем частную производную функционала J(m; x0) ïî m и приравняем ее нулю

@J m; x

0)

 

x2

µ

2m

 

 

m2b

= 0

(

= ¡

0

 

¡

 

 

@m

 

2

a + bm

(a + bm)2

откуда

m = ¡2ba:

Покажем, что в точке m = ¡

2a

функционал J(m; x0) достигает минимума. Для это

b

требуется показать что

 

 

¯

¡

 

 

 

 

@2J(m; x )

 

 

 

 

¯

 

 

 

 

 

 

0

¯m=

2a

> 0:

 

 

@m2

 

 

 

 

b

 

Действительно,

 

 

¯

 

 

 

@m2

0

¯m=

¡

2ba

= ¡ 20 µa + bm ¡ (a + bm)2

¡ (a + bm)2

+ (a + bm)3

¶¯m=

¡

2ba

=

@2J(m; x )

¯

 

 

 

x2

2

 

2mb

 

2mb

 

2m2b2

¯

 

 

 

 

¯

 

 

 

 

 

 

 

 

 

 

 

 

 

¯

 

 

 

 

 

¯

 

 

 

 

 

 

 

 

 

 

 

 

 

¯

 

 

 

=x20 > 0; a

что и требовалось показать. Таким8образом, оптимальное управление имеет вид

< ¡2ba x; ïðè a > 0; uopt = : 0; ïðè a < 0:

Отметим, что при a = 0 имеет место просто устойчивость при u = 0. С другой

стороны видно, что оптимального управления не существует. Действительно, при b > 0 требуется чтобы m было отрицательной величиной (при b < 0 требуется m > 0),

и при выбранном управлении

u1 = m1x;

всегда найдется управление u2 = m2x, такое что jm2j < jm1j и соответственной более оптимальное по отношению к критерию качества. Таким образом, случай когда a = 0 является примером, когда построение оптимального управления не возможно.

72

Перед решением задачи оптимальной стабилизации, приведем соображение в виде леммы, которое показывает что если построено стабилизирующее управление, то оно задает целое семейство стабилизирующих управлений.

Лемма. О семействе допустимых стабилизирующих управлений. Если для управляемой системы

x = A(t)x + B(t)u;

управление вида

u = C(t)x

является стабилизирующим, то тогда управление

u = (C(t) + "C1(t))x

также будет стабилизирующим при достаточно малом ".

Доказательство. Т. к. управление u = Cx является стабилизирующим, исходя

из соображений второго метода Ляпунова, существует две положительноопределенные квадратичные формы v(t; x) = xòV (t; x)x è v1(t; x) = xòV1(t; x)x, такие что

v(t; x) = ¡v1(t; x):

С помощью замены переменных можно получитьV1(t; x) = E и в этом случае матрица V (t; x) должна удовлетворять уравнению Ляпунова

V_ (t; x) + (A(t) + B(t)C(t))òV (t; x) + V (t; x)(A(t) + B(t)C(t)) = ¡E:

Покажем, что квадратичная форма v(t; x) будет функцией Ляпунова также и для системы

x = (A(t) + B(t)C(t))x + "B(t)C1(t)x:

Распишем dv(t;x)

 

 

 

 

 

 

dt

â âèäå

 

 

dv(t; x) @v

+ (gradxv(t; x)); (A(t) + B(t)C(t))x + "B(t)C1

(t)x) =

 

 

 

 

 

 

dt

 

 

@t

¡jjxjj2 + (gradxv(t; x); "B(t)C1(t)x) · ¡jjxjj2 + 2jjV jj jjxjj j"j jjB(t)C1(t)jj jjxjj =

¡jjxjj2(1 ¡ 2j"j jjV jj jjB(t)C1(t)jj):

Таким образом, при выполнении неравенства

1 ¡ 2j"j jjV jj jjB(t)C1(t)jj > 0;

квадратичная форма v(t; x) остается функцией Ляпунова для управляемой системы с управлением

73

u = (C(t) + "C1(t))x:

¥

Оптимальная стабилизация в линейных системах. Задача линейно-квадратичной оптимизации. Рассмотрим одну распространенную модель, в рамках которой решается задача оптимальной стабилизации. Это задача линейно-квадратичной оптимизации (ЛК-оптимизации). В рамках это задачи рассматривается линейная система

x = A(t)x + B(t)u;

t 2 [t0; T ]; x(t0) = x0; x 2 Rn; u 2 Rr;

(1)

с квадратичным критерием качества

 

 

J(x; u) = xò(T )N1x(T ) + ZT

xò(t)N2(t)x(t) + uò(t)N3(t)u(t)

dt ! min :

(2)

t0

£

¤

 

Требуется построить стабилизирующее управление, т. е. управление, обеспечивающее асимптотическую устойчивость нулевому решению системы (1) и доставляющее минимум функционалу (2). Оптимальное управление строится на основе достаточ- ных условий оптимальности, которые описываются уравнением Беллмана, и имеет вид

u = ¡N3¡1(t)Bò(t)£(t)x;

ãäå N3(t) è B(t) - известные матрицы, а £(t) является решение дифференциального матричного уравнения Риккати

£_ (t) + N2(t) + Aò(t)£(t) + £(t)A(t) ¡ £(t)B(t)N3¡1(t)Bò(t)£(t) = 0;

при краевом условии

£(T ) = N1:

Вывод матричного уравнения Риккати с помощью достаточных условий оптимальности будет представлен в лекции 26. В следующей лекции будет предложен другой подход для вывода уравнения Риккати.

74

Соседние файлы в папке Лекции по ТУ