Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Власов_Методы оптимизации и оптимального управления_2013

.pdf
Скачиваний:
133
Добавлен:
27.03.2016
Размер:
710.95 Кб
Скачать

7.5. Способы решения уравнения Риккати

1. Метод прямого интегрирования (метод обратного времени).

Он заключается в применении численного интегрирования с использованием начального условия и основан на применении соот-

ношения Pр(t1

 

) = Pр(t1 ) Pр (t1 ) .

Матрица Pр (t1 ) может быть вычислена с помощью правой части

уравнения (7.3.3).

Аналогичным способом может быть найдена матрица Pр (t1 2 ) . Процесс вычисления продолжается до момента време-

ни t0 .

2. Метод Ньютона – Рафсона предназначен для решения стационарной задачи. Концепцию метода можно проиллюстрировать на примере численного решения обычного квадратного уравнения

x2 + ax +b = 0 . Пусть x0 – приближенное значение корня xk уравнения. Понятно, что xk = x0 + ε0 , где ε0 – малая ошибка. Тогда (x0 +ε)2 +a(x0 +ε) +b =0 , и, пренебрегая квадратом ошибки, получим линейное уравнение для ε0 . Решение этого уравнения дает приближенное значение ε0 ошибки, но теперь можно определить значение x1 = x0 + ε0 , которое, наверное, будет ближе к xk , нежели x0 . Продолжая итерационный процесс, будем приближаться к ис-

тинному значению корня.

Такой подход можно применить к решению матричного уравне-

ния R1 + Pk SPk + Pk +1 (A SPk ) +(AT Pk S)Pk +1 = 0 , где S = BR21BT .

3. Метод диагонализации предназначен для решения стационарной задачи.

Пусть матрица Z , определяющая (см. систему (5.9)) решение стационарной задачи АКОР, имеет различные действительные собственные значения. Структура матрицы Z такова, что корни характеристического уравнения (собственные значения) обладают следующим свойством. Если λ корень характеристического уравнения, то λ также является корнем характеристического уравнения. Это означает, что матрица Z может быть представлена в виде

71

Z =W λ; 0 W 1 , где W – матрица, составленная из собственных

0;λ

векторов, λ = diag(λ1 ,..., λn ) – диагональная матрица, образованная

с помощью положительных собственных значений, λ диагональная матрица, образованная с помощью отрицательных собственных значений.

Введем замену переменных в системе (5.9)

z

 

 

x

. То-

1

=W 1

 

 

 

 

z2

 

p

 

 

z

 

x

 

 

 

 

 

 

гда 1

=W 1

. Замена переменных приводит к диагональному

z2

p

 

 

 

 

 

 

виду системы

дифференциальных уравнений

z1

 

λ;0

z1

 

 

 

=

 

 

.

 

 

 

z 2

0;

λ

z2

 

Введем

обозначение

 

 

 

 

V ;V

 

Тогда

W 1 =V = 11

12

.

 

 

 

 

 

 

 

 

V21;V22

 

z1 (t) =V11 x(t) +V12 p(t) .

Ранее

была

 

установлена

связь

p(t) = Pр (t)x(t) ,

поэтому

z1 (t) = (V11 +V12 Pр )x(t)

и x(t) 0 , то

z (t) 0

. Поскольку z (t) =eλ(tt0 ) z (t

) , то это возможно только

1

 

1

 

1

0

 

 

 

 

 

 

 

при условии V11 +V12 Pр = 0 , так как

x(t0 ) 0 . Это приводит к ре-

зультату

P = −V 1V .

 

 

 

 

 

 

 

 

 

 

 

12

11

 

 

 

 

 

 

 

 

 

 

7.6. Пример решения задачи АКОР

 

 

 

 

 

 

Рассмотрим систему первого

порядка

 

dx

= ax +bu ,

x(0) = x ,

 

 

 

 

 

 

 

 

 

 

dt

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

 

 

 

t [0,T ]

и критерий оптимальности

J = (x 2 +cu2 )dt + x(T )Px(T ) ,

так что A = a, B = b, R1 =1,

R2 = c, P1 = P .

0

 

 

 

 

 

 

 

 

 

 

 

72

Система дифференциальных уравнений (5.9) для рассматривае-

 

x

 

 

 

 

b

2

 

x

 

 

мого случая имеет вид

=

a;

 

 

, т.е.

c

 

 

 

 

 

 

 

 

 

p

 

 

 

1;a

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dx

= ax

 

b2

p,

 

 

 

 

dt

 

 

c

(7.5.1)

 

 

 

 

 

 

 

 

 

 

 

 

 

dp

 

 

 

 

 

 

 

 

 

 

 

= −x ap.

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для решения этой системы запишем характеристическое урав-

нение и найдем его корни: | λE An |=

λ a;

 

b2

= 0 .

Последнее

 

c

 

 

 

 

 

 

 

 

 

 

1;

 

λ+ a

 

 

 

 

 

уравнение является квадратным:

λ2 a2

b2

 

= 0 , и имеет два кор-

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ня: λ = a2

+

b2

, λ

 

= −

a2 +

b2

. Решение системы дифференци-

 

2

 

1

 

c

 

 

 

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x(t)

k1 exp(λ1t)

альных уравнений при

λ = λ1 ищем в виде

p(t)

 

= k

2

exp(λ t)

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

Поскольку

x = k1λ1 exp(λ1t), p = k2 λ1 exp(λ1t) ,

то после

соответст-

вующей подстановки получим однородную систему линейных уравнений для k1 , k2 :

k1 1 a) + bc2 k2 = 0,

k1 +1 + a)k2 = 0.

Определитель этой системы равен нулю (он совпадает с левой частью характеристического уравнения при λ = λ1 ), поэтому по-

следние два уравнения линейно зависимы. Полагая k1 =1 , получим

73

k

 

= −

1

 

 

 

 

. Решение

системы

(7.5.1)

при λ = λ

 

 

 

имеет вид

2

λ + a

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x(t)

 

 

 

 

 

exp(λ1t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

exp(λ t) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

λ

+ a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p(t) 1

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

при λ = λ2 и

 

 

Аналогично находится решение системы (7.5.1)

 

 

 

 

 

 

 

 

 

 

 

x(t)

 

 

 

 

 

 

 

exp(λ2t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оно имеет вид

 

=

 

 

 

 

 

 

 

. Общее решение системы

 

 

 

 

 

 

 

 

 

 

p(t)

2

 

 

 

 

 

exp(λ2t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

λ

 

+ a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(7.5.1) записывается в форме

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x(t)

=C

 

 

 

exp(λ1t)

 

 

 

 

 

 

 

 

exp(λ2t)

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

+C

 

 

1

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

exp(λ t)

 

 

2

 

 

 

 

exp(λ

t)

 

 

 

 

 

 

 

 

 

 

 

 

+ a

 

 

 

 

 

+ a

 

 

 

 

 

 

 

 

 

p(t)

 

 

λ

 

 

 

 

 

1

 

 

 

λ

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для определения значений произвольных констант используем

начальное и граничное условия

 

x(0) = x0

 

и

p(T ) = Px(T ) , которые

приводят к уравнениям: C1 +C2 = x0 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C1

 

 

 

exp(λ T )

 

C2

 

 

exp(λ

T ) = P[C exp(λ t) +C

2

exp(λ

T )] .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

λ1 + a

 

 

 

 

1

 

λ2

+ a

 

 

 

2

 

 

 

 

1

 

 

 

1

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Исключая C2

= x0 C1 , получим выражение для C1 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x exp(λ T )(1+

 

 

1

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C1 =

 

 

 

 

 

 

 

0

 

 

 

 

2

 

 

 

 

λ2 + a

 

 

 

 

 

 

 

.

 

 

 

 

(7.5.2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

 

 

 

+ P)exp(λ T ) (

 

 

 

+ P)exp(λ T )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

λ2 + a

 

 

 

 

 

 

2

 

 

 

 

λ1

+ a

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассмотрим асимптотические свойства решения рассматриваемой задачи. Следует рассмотреть асимптотический результат при T →∞ . Учитывая, что λ1 > 0 и λ2 < 0 , получим C1 0 (столкнем-

ся с ситуацией 0 0). При этом C2 x0 , и зависимость решения задачи АКОР от матрицы P1 = P пропадает.

74

Это соответствует общим асимптотическим свойствам решения, поскольку при C1 0 x(t) не может стремиться к нулю, так как

λ1 > 0 .

При T = ∞ задача АКОР становится стационарной. Это следует непосредственно из аналитического вида решения

 

x(t)

 

 

 

 

 

exp(λ2t)

 

 

 

 

 

 

 

 

 

 

 

= x

 

 

 

1

 

, поскольку имеют

место

равенства

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p(t)

 

 

 

λ

2

+ a exp(λ2t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x(t)

= −

 

+ a) и u(t) = −R1

(t)BT (t) p(t) = −1 bp(t) =

 

b

 

x(t) .

 

 

2

 

 

 

 

p(t)

 

 

 

 

 

 

 

 

2

 

 

c

 

c2 + a)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поэтому справедлива связь

 

 

b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u(t) =βx(t), β =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

(7.5.3)

 

 

 

 

 

 

 

 

 

c2 + a)

 

 

 

Коэффициент β является постоянным (не зависящим от време-

ни). Таким образом, оптимальное управление можно осуществить с помощью стационарной обратной связи.

Можно заметить, что β < 0 , так как λ2

+ a = − a2 +

b2

+ a < 0 ,

c

 

 

 

т.е. обратная связь является отрицательной.

7.7. Метод диагонализации

Рассмотрим динамическую систему, описываемую уравнением

 

dx

= ax +bu , x(0) = x

, подлежащую управлению на бесконечном

 

 

 

dt

0

 

 

 

 

 

 

 

 

 

 

интервале времени, и критерий оптимальности

J = (x2 +u2 )dt ,

 

 

 

 

 

 

 

0

так что система (7.5.1) имеет вид

x

 

1;1 x

 

=

 

.

 

 

 

 

p

1;1 p

75

Имеются два собственных значения, которые получаются с по-

мощью решения

уравнения

 

λ1;

 

1

 

 

 

= λ2 11 = 0 ,

равные

 

 

 

 

 

 

 

 

 

 

 

 

1 ; λ +1

 

 

 

 

 

 

 

 

 

 

 

 

λ1 = 2, λ2 = −

2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найдем собственные векторы. Пусть λ =

2 , тогда следует ре-

шить систему

1;1 x

 

=

2

x

 

эквивалентную следующей

 

 

 

1

 

1

,

 

1;1 x2

 

 

x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

вырожденной

однородной

системе:

 

x

x

 

=

2x

 

 

 

 

 

1

 

 

2

 

 

1

. Полагая

 

 

 

 

 

 

 

 

 

 

 

 

x

 

x

=

2x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

 

2

 

 

 

x1 =1 , получим x2

=1

2 . Таким образом,

найден первый собст-

венный вектор

x1c

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

. Аналогично находится второй собст-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

венный вектор, линейно независящий от первого: x2c

=

 

1

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

Составим матрицу из собственных векторов

 

 

 

 

1

;

1

 

 

 

W =

2;1 +

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

W

1

V11;V12

 

 

 

 

 

1

1+

 

2;

1

 

 

Обратная матрица равна

 

=

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

. Матри-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V21;V22

 

2 2

2

1; 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ца Риккати P = −V 1V

=1+

 

2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

 

12 11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Матрицу Риккати можно было бы найти и с помощью решения стационарного уравнения РиккатиR1 PрBR21BT Pр + AT Pр + Pр A =0 , которое в данном случае является обычным квадратным уравнени-

ем P 2

2P 1 = 0 . Из дальнейших рассуждений последует, что

р

р

необходимо выбрать положительный корень, так как это приведет к использованию отрицательной обратной связи, поэтому

Pр =1+ 2 .

76

Учтем соотношения u(t) = −F(t)x(t) и F(t) = R1 (t)BT (t)P (t) ,

2

р

которые в данном случае принимают вид F(t) =1+

2 (данное вы-

ражение не зависит от времени). Таким образом, оптимальное управление можно реализовать с помощью стационарной обратной связи.

Контрольные вопросы

1.Что такое матрица Коши?

2.Каков вид критерия оптимальности в задачах аналитического конструирования регуляторов?

3.Используется ли равенство нулю вариации функционала при решении задач аналитического конструирования регуляторов?

4.С какой целью рассматривается уравнение Риккатти?

5.В каком случае задача аналитического конструирования регуляторов является стационарной?

ГЛАВА 8. СЛУЧАЙНЫЕ ПРОЦЕССЫ В СИСТЕМАХ УПРАВЛЕНИЯ

8.1. Описание случайных процессов

Случайным процессом ξ(t) называется случайная величина, за-

висящая от параметра t .

Параметр t на практике может быть, например, временем или расстоянием и т. д.

Полным описанием случайного процесса является совместный закон распределения случайных величин ξ(t1 ),..., ξ(tn ) при произ-

вольных значениях n,t1 ,...,tn .

На практике используют метод моментов (первого и второго порядков), т.е. зависимость математического ожидания M[ξ(t)] = m(t) от времени и зависимость ковариационного момента

77

K(t1,t2 ) = M[ξ(t1 )ξ(t2 )] от двух произвольных моментов времени.

Точка означает знак центрирования.

Наиболее распространенным является гауссовский случайный процесс, когда совокупность величин ξ(t1 ),..., ξ(tn ) подчиняется

многомерному нормальному закону распределения, плотность распределения которого имеет вид

p(x1,..., xn ) =C exp{12 Q[(x1 m1 ),...,(xn mn )} ,

где: mi = M[ξ(ti )] , Q – квадратичная форма, задаваемая матрицей,

обратной к ковариационной, C – нормировочный множитель. Гауссовский случайный процесс полностью описывается функ-

циями m(t) и K (t1 ,t2 ) .

Наиболее часто используют стационарный в широком смысле гауссовский случайный процесс, для которого математическое ожидание не зависит от времени (является постоянным) и

K (t1 ,t2 ) = K (τ), τ = t2 t1 .

Наряду с ковариационной функцией используется спектральная плотность, которая является преобразованием Фурье от ковариационной функции. Чтобы понять смысл спектральной плотности, следует рассмотреть некоторые примеры.

Пример 8.1.1. Рассмотрим случайный процесс ξ(t) =V cosωt +U sinωt , где некоррелированные случайные вели-

чины, имеющие нулевые математические ожидания, и одинаковые

дисперсии σ2 . Установим, что этот процесс является стационарным в широком смысле.

Ясно, что M[ξ(t)] = M[V ]cosωt + M[U ]sinωt = 0 . Далее,

K (t1,t2 ) = M[{(V cosωt1 +U sinωt1 )(V cosωt2 +U sinωt2 )}] =

=σ2 (cosωt1 cosωt2 +sinωt1 sinωt2 ),

ипоэтому K(t1 ,t2 ) = σ2 cosω(t2 t1 ) =σ2 cosωτ .

Таким образом, рассмотренный случайный процесс является стационарным в широком смысле. Кроме того, имеет место равен-

ство σ2[ξ(t)] = K(t,t) = K(0) =σ2 .

78

Пример

8.1.2.

Рассмотрим

случайный

процесс

n

 

 

 

 

ξ(t) = (Vi

cosωit +Ui

sinωit) , где все

Vi ,Ui являются некоррели-

i=1

рованными, имеют нулевые математические ожидания и их дис-

персии равны σ2 (V ) = σ2 (U

) = σ2

. Повторяя рассуждения, приве-

 

 

 

 

 

i

i

i

 

M[ξ(t)] = 0 и

денные

в первом

примере,

получим, что

K(t ,t

 

) = K(τ) =

n

σ2 cosωτ

. Таким образом,

рассматриваемый

2

1

 

 

i

i

 

 

 

i=1

случайный процесс является стационарным в широком смысле.

n

Кроме того, имеет место равенство σ2 [ξ(t)] = σi2 .

i=1

Спектральной плотностью S(ω) называется преобразование

Фурье от ковариационной функции, т. е. S(ω) = 2 [K (τ)cosωτ]dτ

π 0

и соответственно K(τ) = [S(ω) cosωτ]dω . Понятно, что

0

σ2[ξ(t)] = S(ω)dω .

0

Спектральная плотность характеризует вклад в дисперсию случайного процесса дисперсий гармоник различных частот.

Кроме гауссовского случайного процесса большое применение находит специфический случайный процесс, называемый белым шумом. Математическое ожидание такого процесса равна нулю, а его спектральная плотность является постоянной величиной S(ω) = C . Обратное преобразование Фурье (корреляционная функ-

ция) от такой спектральной плотности выражается с помощью δ(τ)

– функции, т.е. K(τ) =Cδ(τ) . Для многомерного белого шума [8] вместо константы C используется положительно определенная функция Q(t1 ) , которая называется матрицей интенсивностей, так что K (t1 ,t2 ) = Q(t1 )δ(t2 t1 ) .

79

8.2. Стохастические дифференциальные уравнения

Стохастическое дифференциальное уравнение – это такое уравнение, в котором управляющим воздействием является случайный процесс, т.е. оно имеет вид

x = A(t)x(t) + B(t)ξ(t) ,

(8.2.1)

где ξ(t) – векторный случайный процесс.

Решением стохастического уравнения является выходной случайный процесс. Решить стохастическое дифференциальное уравнение – значит найти описание этого выходного случайного процесса.

Если входной случайный процесс является белым шумом, то говорят, что рассматривается система, возбуждаемая белым шумом.

Поскольку [8,13] стационарный случайный процесс с известной спектральной плотностью может быть сформирован с помощью белого входного шума и определенной линейной динамической системы, то обычно и рассматриваются системы, возбуждаемые белым шумом. Более того, если считать, что выходной случайный процесс является гауссовским, то решение стохастического дифференциального уравнения предполагает поиск зависимости математического ожидания выходного процесса от времени и его корреляционной функции.

Пусть имеется динамический объект, описываемый стохастическим дифференциальным уравнением (8.2.1), возбуждаемый белым шумом и находящийся в начальный момент времени t0 в состоянии

x0 , которое является нормально распределенным случайным вектором с известным математическим ожиданием m0 и известной ковариационной матрицей Q0 . Тогда выходной случайный процесс

имеет следующие математическое ожидание и корреляционную функцию [8]:

M [x(t)]) = Ф(t,t0 )m0 ,

80