Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

afanasev_v_n_optimalnye_sistemy_upravleniya_ana

.pdf
Скачиваний:
20
Добавлен:
29.03.2016
Размер:
1.77 Mб
Скачать

d V(e,x) dt

eT (t)Q(t)e(t) xT (t) Q(t) L(t)B(t)R 1(t)BT (t)L(t) x(t)

xT (t)L(t)S(t)CT (t)R1 1(t)C(t)e(t)

eТ (t)CT (t)R1 1(t)C(t)L(t)S(t)x(t) 0.

Это неравенство будет заведомо выполняться, если потребовать для любой пары x(t) и e(t) при t [t0 ,T] выполнения условия

 

 

Q(t)

L(t)S(t)CT (t)R1 1(t)C(t)

 

(5.157)

CT (t)R 1

(t)C(t)L(t)S(t)

Q(t) L(t)B(t)R 1(t)BT (t)L(t)

0.

 

1

 

 

 

 

Условие (5.157) может быть использовано для соответствующего выбора (назначения) матрицы R (t).

Наблюдатель минимальной сложности Этот наблюдатель называют достаточно часто наблюдателем Люенбергера.

Объект описывается уравнениями (5.125). Введем в рассмотрение вектор z(t)

размерности n-m:

 

z(t)=T(t)x(t).

(5.158)

Если бы матрица T(t) была известна, то

y(t)

C(t)

 

 

 

 

x(t),

 

 

 

 

z(t)

T(t)

 

откуда

C(t) 1

y(t)

y(t)

P(t)z(t) V(t)y(t).

(5.159)

x(t)

 

 

 

V(t) P(t)

 

 

 

 

 

 

 

 

 

T(t)

z(t)

z(t)

 

 

Очевидно, что использовать уравнение (5.159) не представляется возможным, т.к. z(t) не известно.

Будем искать оценку z(t) как решение дифференциального уравнения

 

d

zˆ(t) D(t)z(t) E(t)y(t) G(t)u(t)

(5.160)

 

 

 

dt

 

и оценку процесса x(t) в виде

 

 

x(t) P(t)z(t) V(t)y(t).

(5.161)

Введем в рассмотрение ошибку (t):

 

(t) z(t) z(t) z(t) T(t)x(t).

(5.162)

Продифференцировав (5.162) и учитывая (5.125) и (5.160), получим

 

d

 

 

 

(t) D(t)z(t)

E(t)C(t)

dt

 

 

G(t) T(t)B(t) u(t).

 

d

 

 

 

 

T(t) T(t)A(t) x(t)

(5.163)

dt

 

 

Учитывая (5.162) и назначив G(t) в виде

 

G(t) T(t)B(t),

(5.164)

будем иметь из (5.162)

113

d (t) D(t) (t) dt

D(t)T(t) E(t)C(t)

(5.165)

dt T(t) T(t)A(t) x(t).

Назначим матрицы D(t) и E(t) так, чтобы выполнялось условие

D(t)T(t) E(t)C(t) d T(t) T(t)A(t) 0 dt

или

D(t)T(t) T(t)A(t)

d

T(t) E(t)C(t).

(5.166)

 

 

dt

 

Матрицы G(t), D(t), E(t) называют параметрами Люенбергера. Введем в рассмотрение e(t):

e(t) x(t) x(t).

Тогда, учитывая (5.161), выражение (5.167) запишем в виде e(t) P(t)z(t) V(t)C(t)x(t) x(t).

Из (5.162) нетрудно получить

P(t)z(t) P(t) (t) P(t)T(t)x(t).

Подставляя (5.169) в (5.168), будем иметь e(t) P(t) (t) [P(t)T(t) V(t)C(t) In ]x(t),

где P(t)T(t) V(t)C(t) – единичная матрица размерностью n x n, т.е.

e(t) P(t) (t).

Из (5.159) имеем

 

 

C(t)

1

 

 

V(t) P(t)

 

,

 

 

 

 

 

 

 

T(t)

 

Откуда

 

 

 

C(t)

V(t) P(t) I

 

 

 

 

 

n

 

 

 

 

 

 

T(t)

 

 

 

 

C(t) V(t)

C(t) P(t)

I

m

0

 

 

 

 

 

 

 

 

0

 

T(t) V(t)

T(t) P(t)

 

In m

и

V(t)C(t) P(t)T(t) In 0.

Из (5.171) имеем

C(t)P(t) 0, T(t)V(t) 0,

C(t)V(t) Im , T(t)P(t) In m .

(5.167)

(5.168)

(5.169)

(5.170)

(5.171)

(5.172)

(5.173)

Используя (5.172), (5.173), найдем матрицы D(t) и E(t). справа на P(t), получим

d

 

D(t)

 

T(t) P(t) T(t)A(t)P(t).

 

dt

 

Умножив (5.166)

(5.174)

Умножив (5.166) справа на V(t), получим

114

d

 

 

E(t)

 

T(t) V(t) T(t)A(t)V(t).

(5.175)

 

dt

 

 

Таким образом, если

1.x(t0) – известно, то z(t0)=T(t0)x(t0) и (t) 0 t t0 ;

2.x(t0) – неизвестно полностью, т.е. y(t0)=C(t0)x(t0), то выбирается zˆ(t0 ), а

zˆ(t) является решением уравнения (5.160) с выбранным краевым условием и вычисленными матрицами G(t), D(t) и E(t) по формулам (5.164), (5.174) и (5.175) соответственно. Естественно, до этого строятся и вычисляются матрицы T(t) и dT(t)/dt, V(t), P(t). Оценка состояния x(t) строится по формуле (5.161).

115

Глава 6. Особые решения в задачах оптимального управления

§6.1. Постановка задачи

Вряде задач оптимизации встречаются участки экстремалей (Hu=0), на которых матрица Huu оказывается вырожденной. На этих участках выполняется условие выпуклости Huu 0, но не выполняется усиленное

условие Huu 0, т.е. матрица Huu является только полуопределенной. Эти участки называются особыми. Для того чтобы установить, является ли особый участок оптимальным, необходимы дополнительные исследования.

В общем случае решение вырожденных задач более сложно, чем решение нормальных задач оптимизации. Трудности возникают из-за того,

что необходимые условия не дают информации относительно связи u0(t) с x0(t) и 0 (t).

Достаточно часто особые участки встречаются в задачах, когда гамильтониан является линейной функцией по одной или нескольким переменным управляющего воздействия u(t), но является нелинейной по одной или нескольким фазовым переменным состояния. x(t). В этом случае необходимые условия оптимальности - Hu=0 (для задач без ограничений на управления) или H(x0 ,u0 , 0 ,t) H(x0 ,u, 0 ,t)(задачи с ограничениями на управления) не позволяют определить управление вдоль особого участка как функцию фазовых и сопряженных переменных. Напомним, что задача вырождается (в случае наличия ограничений на управление), если аргумент sign/ / тождественно равен нулю на конечном интервале времени (§ 3.5, 3.6).

Для особых участков не разработаны условия, аналогичные условиям отсутствия сопряженных точек (§ 2.3), поэтому отсутствуют и достаточные условия оптимальности особых участков.

§ 6.2. Линейные динамические системы с квадратичным критерием качества

Рассмотрим

задачу

терминального

управления

линейным

динамическим объектом

 

 

 

 

 

 

 

d

x(t) Ax(t) Bu(t),

x(t0 ) x0.

 

(6.1)

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Здесь

x(t) Rn , u(t) Rr ,

 

 

на

управление ограничений не

наложено.

Функционал имеет вид

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

1

T

 

 

(6.2)

 

J(x,u)

xT (T)Fx(T)

xT (t)Q(t)x(t)dt,

 

 

 

 

 

 

 

2

 

 

2

t0

 

 

 

где матрицы F и Q(t)

 

 

 

 

 

 

положительно полуопределены.

 

Выпишем гамильтониан

 

 

 

H(x,u, ,t)

1

xT (t)Q(t)x(t) T (t) Ax(t) Bu(t)

 

(6.3)

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

откуда

116

d

(t) Q(t)x(t) AT (t),

(6.4)

 

dt

(6.5)

(T) Fx(T).

Как видим, гамильтониан (6.3) линеен относительно u(t) и необходимое условие оптимальности не дает информации относительно связи u0(t) с x0(t) и

0 (t):

 

 

H(x,u, ,t)

T (t)B.

(6.6)

u(t)

Если u(t) ограничено, то минимум H(x,u, ,t) может достигаться на границе. В этом случае необходимые условия сводятся к тому, что для всех допустимых вариаций u(t)

T (t)B u(t) 0.

Однако может случиться, что найдутся интервалы времени, где функции u(t), значения которой не лежат на границах, соответствуют такие (t), что

H(x,u, ,t)

T (t)B 0.

(6.7)

 

u(t)

 

Участки траектории, соответствующие этим интервалам, называются особыми. Максимум на этих интервалах может как достигаться, так и не достигаться. Гамильтониан при (6.7) принимает вид

H(x,u, ,t)

1

xT (t)Q(t)x(t) T (t)Ax(t),

(6.8)

 

2

 

 

т.е. на особом участке гамильтониан не содержит управления (коэффициент при управлении равен нулю), поэтому условие экстремума (6.7) не позволяет определить управление вдоль особого участка как функцию x0(t) и 0 (t).

Если на управление не наложено ограничений, то с помощью управления, содержащего импульсы, систему (6.1) можно мгновенно перевести в любое другое состояние, в том числе и в состояние x(T)=0. Такое управление будет минимизировать функционал J(x), поскольку J(x)=0!

Такое управление следует отнести скорее к гипотетическому, чем к реально осуществимому, так как управление в виде дельта-функции требует не только неограниченных ресурсов регулятора, но и соответствующих физических характеристик объекта.

Чаще всего импульс в управлении можно использовать для перемещения системы на минимизирующий участок, двигаться по этому участку до тех пор, пока не будет достигнуто состояние, из которого другим импульсом система переводится в точку x(t)=0 или в состояние x(T), при котором xT(T)Fx(T)=0.

Отметим, что пока изложенное выше не дает непосредственной информации для определения как участков различных управлений, так и самого управления на особом участке.

117

Так как на всем интервале гамильтониан имеет вид (6.8), т.е. на всем особом участке коэффициент при управлении в гамильтониане (6.3) равен нулю, то на этом участке должно выполняться и условие

 

d H(x,u, ,t) T

 

T .

(6.9)

 

 

 

 

 

B

(t)

 

 

u(t)

 

dt

 

 

 

 

или, с учетом (6.4),

 

 

 

 

 

BT Q(t)x(t) AT (t) 0.

(6.10)

Отметим, что условие (6.10) является условием нахождения системы на особом участке. Однако и это условие не позволяет найти управление.

Повторяя вышеприведенные рассуждения, найдем

d2

H(x,u, ,t) T

 

T

.

T

.

 

 

 

 

 

 

 

B

Q(t)x(t) A

 

(t)

0

dt

2

u(t)

 

 

 

 

 

 

 

 

 

 

 

или, учитывая (6.1) и (6.4), будем иметь

BT Q(t)Ax(t) Q(t)Bu(t) ATQ(t) AT AT (t) 0,

(6.11)

откуда

BT Q(t)A ATQ(t) x(t) AT AT (t) .

 

1

(6.12)

u(t) BTQ(t)B

Управление (6.12) задает линейный закон управления на особом участке.

Отметим, что матрица BTQ(t)B должна быть невырожденной и, если это так, то эта матрица положительно определенная, что предопределяет выполнение достаточных условий достижения, по крайней мере, локального минимума функционала (6.2). Действительно, при положительно определенной матрице Q(t) выполняется обобщенное условие выпуклости (усиленное условие Лежандра - Клебша):

 

d2

H(x,u, ,t) T

T

Q(t)B 0.

 

 

 

 

 

 

B

 

 

 

u(t)

 

u(t) dt2

 

 

 

 

 

 

 

 

 

 

 

 

 

Стратегия управления заключается в том, что если не выполняется условие (6.10), то на объект (6.1) воздействуют импульсом до выполнения условия (6.10), затем включается управление (6.12), и в тот момент, когда вновь не будет выполняться условие (6.10), на объект следует подать импульсное воздействие и перевести состояние системы в xT(T)Fx(T)=0.

Решение задачи импульсно-линейного управления можно реализовать в замкнутой форме:

u(t) BTQ(t)B 1 BT Q(t)A ATQ(t) AT AT K(t) x(t),

где K(t) – положительно определенная матрица, являющаяся решением уравнения типа Риккати:

d K(t) K(t) A B BT Q(t)B 1 BT Q(t)A AT Q(t) AT K(t) dt

K(t)B BT Q(t)B 1 BT AT AT K(t) Q(t) 0,

K(T) F.

118

Условие, которое определяет нахождение системы на особом участке, записывается в следующем виде:

BT Q(t) AT K(t) x(t) 0.

§ 6.3. Особые решения в задачах оптимизации нелинейных систем

Пусть объект описывается следующим дифференциальным уравнением:

 

d

x(t) f (x) B(x)u(t),

x(t) Rn ,

u(t) R1, t [t0 ,T].(6.13)

 

 

 

dt

 

 

 

Заданы краевые условия:

 

 

 

 

x(t0 ) x0 , x(T) 0,

где Rq.

(6.14)

Требуется построить управление, минимизирующее функционал

 

J(x) K x(T) ,

 

 

(6.15)

на объекте (6.13) при заданных ограничениях (6.14).

Предполагается также, что на управление ограничений не наложено, а вектор - столбцы f(x) и B(x) допускают дифференцирование по x(t).

Гамильтониан имеет вид

 

H(x,u, ) T (t) f (x) B(x)u(t) .

 

 

(6.16)

Необходимые

условия

стационарности

решения

включают

соотношения

 

 

 

 

 

H(x,u, )

T (t)B(x) 0,

 

 

(6.17)

 

 

 

 

 

u(t)

 

 

 

 

где

d

T

T

f (x)

 

B(x)

 

,

 

 

 

(t) (t)

 

 

 

u(t)

 

 

x(t)

x(t)

dt

 

 

 

 

 

 

 

K x(T)

 

x(T)

 

T (T)

T

.

x(T)

 

x(T)

 

 

 

Управление u(x, ) непосредственно из (6.17) определить нельзя. полную производную по времени выражения (6.17):

dH(x,u, ) T

dt u(t)

 

d

.

 

B(x)

T

 

BT (x) (t) x T (t)

 

(t)

dt

x(t)

 

 

 

 

 

.

BT (x) (t) 0

(6.18)

(6.19)

Найдем

или, учитывая (6.13) и (6.18), будем иметь

d H(x,u, ) T

 

d

B

T

(x) (t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u(t)

 

dt

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

T

B(x) T

 

 

T

 

 

f (t) T

(6.20)

f

 

(x)

 

 

 

B

 

(x)

 

 

(t)

 

 

 

 

 

 

 

x(t)

 

 

 

 

 

 

 

 

x(t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

gT (x) (t) 0,

где

119

 

T

B(x)

f (x)

g

 

(x)

 

f (x)

 

B(x).

 

 

 

 

 

 

x(t)

 

x(t)

Отметим, что полученное выражение вновь не содержит управления. Продифференцировав выражение (6.20) по t еще раз, получим

d2

H(x,u, )

d2

 

T

(t)B(x)

 

 

 

 

 

 

 

dt2

u(t)

dt2

 

 

 

 

 

 

 

T

g(x)

f (x)

 

 

 

 

 

 

(t)

 

 

 

f (x)

 

 

 

 

g(x)

 

 

 

 

 

 

 

 

 

 

 

 

x(t)

 

x(t)

 

 

 

 

 

 

T

g(x)

B(x)

 

 

 

 

 

 

(t)

 

 

 

 

B(x)

 

 

 

 

 

g(x) u(t) 0.

 

 

 

 

 

 

 

 

 

 

 

x(t)

 

x(t)

 

 

 

 

 

 

Отсюда, если

T

g(x)

B(x)

(t)

 

 

 

B(x)

 

 

 

g(x)

 

 

 

 

 

 

 

 

 

 

 

x(t)

x(t)

 

 

T

g(x)

 

 

 

f (x)

 

 

(t)

 

 

 

f (x)

 

 

 

 

g(x)

 

 

 

 

 

 

 

u(t)

 

 

 

x(t)

 

 

 

x(t)

 

 

T

g(x)

 

 

 

B(x)

 

 

 

 

 

 

(t)

 

 

 

 

B(x)

 

 

 

 

g(x)

 

 

 

 

 

 

 

 

 

 

 

 

 

x(t)

 

 

 

x(t)

 

0, получаем

(6.21)

В том случае, если соотношения (6.17) и (6.20) выполнялись вначале (или в конце) особого участка, закон управления (6.21) реализует условие стационарности (6.17). Отметим, что особые участки (со скалярным управлением) для всех точек 2n-мерного пространства (x, )невозможны. В силу (6.17), (6.20) они ограничены гиперповерхностью размерности 2n-2, которая называется особой гиперповерхностью. Для стационарных систем с незаданным временем переходного процесса размерность особой гиперповерхности 2n-3, поскольку гамильтониан равен нулю на всем интервале управления

H(x,u, ) T (t) f (x) B(x)u(t) 0

или с учетом (6.17)

H(x,u, ) T (t)f (x) 0.

 

(6.22)

Для стационарных систем со свободным временем и n=3 (6.17), (6.20) и

(6.22) являются линейными по

1(t),

2 (t), 3 (t). Это приводит к

соотношению, определяющему особую гиперповерхность в пространстве фазовых координат.

Поиск особой экстремали можно осуществить несколько иным способом, используя аппарат скобок Пуассона.

Скобки Пуассона. Пусть v=v(x,p), w=w(x,p) – две скалярные функции от n-вектора х и n-вектора р, по которым они непрерывны и имеется достаточное количество непрерывных производных.

Скобкой Пуассона от этих двух функций называется выражение

v,w

v T w

v T

w

.

(6.23)

 

 

 

 

 

 

 

 

 

p

 

x

 

 

x

 

p

 

 

120

Скобки Пуассона обладают следующими свойствами:

v,w w,v ,

v,v 0,

(6.24)

v,w1 w2 v,w1 v,w2 ,

 

где w1 и w2 –функции того же типа, что и v,w,

(6.25)

u, v,w v, w,u w, u,v 0.

Последнее выражение называется тождеством Якоби.

Пусть

S=S(x,p)

-некоторая гладкая функция переменных х, р. Полная производная по времени dS/dt вдоль траекторий x(t), p(t,), удовлетворяющих системам

dx(t) dt

H(x,u,

H(x,u, p) T

 

dp(t)

H(x,u, p) T

 

 

 

 

 

,

 

 

 

 

,

(6.26)

p(t)

dt

x(t)

 

 

 

 

 

 

p) pT (t) f (x) B(x)u(t) ,

с помощью скобок Пуассона записывается следующим образом:

 

dS(x, p)

S,H .

(6.27)

 

 

 

dt

 

Здесь H(x,u,p) – функция Понтрягина, которую представим в виде

 

H(x,u, p) H0 (x, p) H1(x, p)u(t),

 

H0 (x, p) pT (t)f (x),

(6.28)

 

H1(x, p) pT (t)B(x).

Если на управление не наложено ограничений, то вдоль траекторий x(t), p(t), где t [t0 ,T], соответствующих управлению u(t), выполняется тождество

 

dH(x,u, p)

H1(x, p) 0,

t [t0 ,T].

 

 

(6.29)

 

 

 

 

 

 

du(t)

 

 

 

 

 

 

 

Поэтому на отрезке [t0,T] выполняется тождество

 

 

d

H

(x,u) 0.

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

Используя формулу (6.27) и свойство (6.24), получим

 

 

d

H

(x, p) H

,H H

 

,H

H

,H

u(t).

(6.30)

 

dt

 

 

1

1

 

0

1

1

1

 

 

Коэффициент при u(t) в выражении (6.30) равен нулю тождественно по x(t), p(t). Следовательно, в производной dH1(x,p)/dt управление явно появиться не может. Таким образом,

d

dt H1(x, p) H0 ,H1 .

Но в силу (6.29), (6.30) должно выполняться тождество

d2

H

(x, p)

d

H

,H

0,

dt2

 

1

 

dt 0

1

 

которое с помощью (6.27) запишем в виде

121

d2

H

(x, p) H

,H

,H

(6.31)

dt2

1

0

1

 

H0 , H0 ,H1 H1, H0 ,H1 u(t) 0.

Здесь коэффициент при u(t) не равен нулю. Поэтому для точек t [t0 ,T], где этот коэффициент не равен нулю, получаем

u(t)

H0 , H0 ,H1

 

 

(6.32)

 

.

 

 

H1, H0 ,H1

 

 

Если коэффициент при управлении u(t)

в

(6.31) равен нулю

на отрезке

1 [t0 ,T], то формула (6.32) имеет смысл только на множестве 1

[t0 ,T]. Для

получения формулы особой экстремали

на

отрезке 1 [t0 ,T]

продолжим

вычислять полные производные по времени от функции H1(x,p). При этом оказывается, что управление u(t) может появляться только в производных четного порядка 2k, имеющих вид

d2k

2k

 

 

 

 

 

H1(x, p) 1

 

H0

, H0 ,.... H

0 ,H1 ..... ,H

dt2k

 

 

 

 

 

 

 

 

 

2k 1

 

H

0 , H0 ,.... H0 ,H1

..... H1, H0

,.... H0 ,H1 ..... u(t) 0.

 

 

 

 

 

 

2k

 

 

 

2k 1

Таким образом, при последовательном вычислении полных производных по времени от функции H1(x,p) особое управление будет определяться выражением

2k

u(t)

H0 , H0.... H0 ,H1 ....

(6.33)

H1

, H0 ,... H0 ,H1 ....

 

 

 

 

 

 

 

2k 1

 

на множестве точек t [t0 ,T], на которых выражение

H H , H ,.... H ,H ..... ,

2 1 0 0 1

2k 1

подсчитанное вдоль особых траекторий x(t) и p(t), отлично от нуля. Если вдоль особой экстремали выполняется следующее условие:

( 1)k

d2k

 

H(x,u, p)

0,

 

 

 

 

u(t) dt2k

 

 

 

u(t)

то необходимое условие существования оптимального управления, выраженное с применением функции Понтрягина, имеет вид

( 1)k

 

 

d2k

 

 

 

H(x,u, p)

0.

(6.34)

u(t) dt2k

 

 

 

 

 

 

 

u(t)

 

Выражение (6.34) при использовании гамильтониана имеет вид

 

( 1)k

 

 

d2k

 

 

 

H(x,u, )

0.

(6.35)

u(t) dt2k

 

 

 

 

 

 

 

u(t)

 

При рассмотрении сопряжения неособого участка с особым и наоборот можно получить дополнительное необходимое условие, по виду аналогичное

(6.35).

122

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]