Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
6
Добавлен:
16.04.2015
Размер:
89.91 Кб
Скачать

Лекция 16. Матричное уравнение Риккати.

Рассмотрим общий материал, посвященный построению оптимального управления в управляемых системах, в общем случае нелинейных, и используем этот материал для построения оптимального управления в рамках задачи ЛК-оптимизации.

Управляемая нелинейная система имеет вид

x = f(t; x; u); t 2 [t0; T ]; x(t0) = x0; x 2 Rn; u 2 Rr;

(1)

с критерием качества

f0(t; x; u)dt ! min

 

J(u) = '(x(T )) + tZ0

(2)

T

 

 

такого рода постановку задачи принято называть "задача со свободным правым концом", т. к. нет условия на конечное значение траектории x(T ). По устоявшейся

классификации постановок задач, эта постановка имеет название "задача Больца". Общая классификация постановок задач в теории оптимального управления будет приведена позднее.

Приведем формулировку теоремы, посвященной необходимому условию оптимальности управления для случая так называемого "гладкого экстремума". Эти условия могут быть получены с помощью вариации функционала методами вариационного исчисления. Мы запишем эти условия в форме, напоминающей принцип максимума.

Более сильный результат - принцип максимума Л. С. Понтрягина, будет приведен с доказательством в следующих лекциях. Отличие от формулировки теоремы, посвященной принципу максимума,rбудет. заключаться в том, что для управления не задана конкретная область и u 2 R

Для формулировки необходимых условий оптимальности введем вектор переменных

Ã= (Ã1; Ã2; : : : ; Ãn);

èобразуем функцию от (2n + r + 1) переменных

H = H(t; x; u; Ã) = Ãòf(t; x; u) ¡ f0(t; x; u):

Отметим, что пару (x¤(t); u¤(t)), ãäå u¤(t) - оптимальное управление, а x¤(t) - соответствующая ему оптимальная траектория, принято называть управляемым процессом.

Теорема 1. Необходимое условие оптимальности. Для того, чтобы в зада- че (1)-(2) управляемый процесс (x¤(t); u¤(t)), был оптимальным, необходимо, чтобы

существовал вектор Ã = (Ã1; Ã2; : : : ; Ãn), такой что

 

 

_

@H

 

 

¤

¤

 

 

 

 

 

à = ¡

@x

(t; x

(t); u

(t); Ã) =

 

 

= ¡Ã

@f

(t; x¤(t); u¤(t)) +

@f0

(t; x¤(t); u¤(t)); ä(T ) = ¡

@'(x(t))

;

@x

 

@x

 

@x

è ïðè ýòîì

75

max H((t; x¤(t); u(t); ä) = H((t; x¤(t); u¤(t); ä):

u

Таким образом, необходимые условия оптимальности управляемого процесса (x¤(t); u¤(t)) с учетом u 2 Rr, можно записать в виде уравнений

x¤(t) = f(t; x¤; u¤); t 2 [t0; T ]; x¤(t0) = x0;

_

@H

 

 

 

@'(x(T ))

 

à = ¡

 

 

; Ã(T ) = ¡

 

;

@x

@x

 

@H

¯

 

 

 

 

 

 

 

¯

= 0

 

 

 

 

 

¯

 

 

 

@u ¯(u¤(t);x¤(t))

 

(3)

(4)

(5)

Алгоритм построения оптимального управления можно сформулировать следующими пунктами:

1. Решаем уравнение (5) относительно u и определяют u = u(t; x; Ã).

2. Подставляем полученное выражение u = u(t; x; Ã) в уравнения (3) и (4). В результате получаем краевую задачу относительно неизвестных x¤(t) è Ã(t).

3. Решая полученную краевую задачу получаем функции x¤(t) è Ã(t).

4. Подставляя найденные выражения для x¤(t) è Ã(t) в выражение для u = u(t; x; Ã) (найденное в пункте 1), получаем вид программного управления u = u(t).

Сложность реализации этого алгоритма связана с рядом проблем, такими как нелинейность управляемой системы, проблема разрешимости краевой задачи и т. д. Применим этот алгоритм в случае, когда управляемая система линейная, а критерий качества квадратичный, т. е. к задаче ЛК-оптимизации. В рамках этой задачи управляемая линейная система имеет вид

x = A(t)x + B(t)u;

t 2 [t0; T ]; x(t0) = x0; x 2 Rn; u 2 Rr;

(6)

с квадратичным критерием качества

 

 

J(x; u) = xò(T )N1x(T ) + ZT

xò(t)N2(t)x(t) + uò(t)N3(t)u(t)

dt ! min :

(7)

t0

£

¤

 

Требуется построить стабилизирующее управление, т. е. управление, обеспечивающее асимптотическую устойчивость нулевому решению системы (6) и доставляющее минимум функционалу (7).

Запишем необходимые условия оптимальности (3)-(5) для системы (6)-(7) и реализуем алгоритм построения оптимального управления. Уравнения (3)-(5) в случае задачи ЛК-оптимизации принимают вид

 

 

x¤(t) = A(t)x + B(t)u t 2 [t0; T ]; x¤(t0) = x0;

(8)

_

@H

= ¡2N2(t)x ¡ Aò(t)Ã(t); Ã(T ) = ¡

@'(x(T ))

 

(9)

à = ¡

 

 

= ¡2N1x(T );

@x

@x

76

 

@u

¯(u¤

(t);x¤(t))

= Bò(t)Ã(t) ¡ 2N3(t)u = 0

 

(10)

@H

¯

 

 

 

 

 

 

 

 

 

 

 

 

¯

 

 

 

 

 

 

 

 

 

 

ãäå

 

¯

 

 

 

 

 

 

 

 

 

 

H = H(t; x; u; Ã) = ¡xò(t)N2(t)x(t) ¡ uò(t)N3(t)u(t) + Ãò(t)(A(t)x + B(t)u):

 

Начнем реализовывать алгоритм.

 

 

 

 

 

 

1. Из (10) следует вид оптимального управления

 

 

 

 

 

u¤(t) =

1

N¡1

(t)Bò(t)Ã(t)

 

(11)

 

 

 

2

 

 

 

 

 

 

 

 

 

3

 

 

 

2. Подставляем выражение (11) в (6)-(7). Получаем краевую задачу для x è Ã

 

x¤(t) = A(t)x¤ +

1

B(t)N3¡1(t)BòÃ(t); x¤(t0) = x0;

(12)

 

 

 

 

 

2

 

 

 

 

 

 

 

_

 

 

ò

 

 

 

 

 

¤

(

T );

(13)

Ã(t) = ¡A

 

à + 2N2(t)x

(t); Ã(t) = ¡2N1x

 

3. Для решения краевой задачи (12)-(13) будем искать функцию Ã(t) â âèäå

 

 

 

 

 

Ã(t) = ¡2£(t)x¤(t)

 

(14)

где матрица £ подлежим определению. Продифференцируем (14) по t и подставим выражения для Ã_(t) è x¤(t) из (12)-(13). В результате получаем

³ ´

£_ (t) + N2(t) + Aò(t)£(t) + £(t)A(t) ¡ £(t)B(t)N3¡1(t)Bò(t)£(t) x¤(t) = 0

при краевом условии

 

 

£(T )x¤(T ) = N!x¤(t)

 

 

 

 

èëè

 

 

 

 

 

 

_

ò

¡1

(t)B

ò

(t)£(t) = 0

(15)

£(t) + N2

(t) + A

(t)£(t) + £(t)A(t) ¡ £(t)B(t)N3

 

 

при краевом условии

 

 

 

 

 

 

 

£(T ) = N1

 

 

 

(16)

Уравнение (15) называется матричное уравнение Риккати [1].

4. Разрешая систему (15)-(16) относительно £(t) получаем вид оптимального управления для системы (6)-(7)

u¤ = u¤(t; x) = ¡N3¡1(t)Bò(t)£(t)x:

(17)

Управление вида (17) представляет из себя синтез оптимального управления для всех начальных данных x(t0) = x0. Также отметим, что матрица £(t) в уравнении

(17) не зависит от оптимальной траектории x¤(t), а зависит только от известных функций времени A(t), B(t), N2(t), N3(t) и от постоянной матрицы N1.

77

Соседние файлы в папке Лекции по ТУ