Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Vlasov_Metody_optimizacii_i_optimalnogo_upravle...doc
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
2.03 Mб
Скачать

7.4. Общие свойства решения уравнения Риккати

Сначала сформулируем [8] некоторые общие асимптотические свойства уравнения Риккати при t1 →∞ .

  1. P(t ) Py (t ) , причем Py (t ) не зависит от P1 .

  1. Если все матрицы, входящие в постановку задачи, постоянны, то Py (t ) также является постоянной и удовлетворяет уравнению

R1 Py BR21 B T Py + AT Py + Py A = 0 .

3. Если все матрицы, входящие в постановку задачи, постоянны, но t1 – конечная величина, то матрица Риккати зависит от времени,

т.е. при управлении с помощью обратной связи последняя зависит от времени и задача управления является нестационарной.

4. Минимальное значение критерия оптимальности равно

JM = x T ( t 0 ) Py (t 0 ) x (t0 ) .

70

7.5. Способы решения уравнения Риккати

1. Метод прямого интегрирования (метод обратного времени).

Он заключается в применении численного интегрирования с ис-пользованием начального условия и основан на применении соот-

ношения Pр (t1

) = Pр (t1 ) − Pр (t1 ) .

Матрица Pр ( t1 ) может быть вычислена с помощью правой части

уравнения (7.3.3).

Аналогичным способом может быть найдена матрица Pр (t1 2 ) . Процесс вычисления продолжается до момента време-

ни t0 .

2. Метод Ньютона Рафсона предназначен для решения ста-ционарной задачи. Концепцию метода можно проиллюстрировать на примере численного решения обычного квадратного уравнения

x 2 + ax + b = 0 . Пусть x0 приближенное значение корня xk урав-нения. Понятно, что x k = x0 + ε0 , где ε0 – малая ошибка. Тогда (x0 + ε )2 + a (x0 + ε ) + b = 0 , и, пренебрегая квадратом ошибки, полу-чим линейное уравнение для ε0 . Решение этого уравнения дает приближенное значение ε0 ошибки, но теперь можно определить значение x1 = x0 + ε0 , которое, наверное, будет ближе к xk , нежели x0 . Продолжая итерационный процесс, будем приближаться к ис-

тинному значению корня.

Такой подход можно применить к решению матричного уравне-

ния R1 + Pk SPk + Pk +1 ( ASPk ) + ( ATPk S)Pk +1 = 0 , где S = BR21 BT .

3. Метод диагонализации предназначен для решения стацио-нарной задачи.

Пусть матрица Z , определяющая (см. систему (5.9)) решение стационарной задачи АКОР, имеет различные действительные соб-ственные значения. Структура матрицы Z такова, что корни ха-рактеристического уравнения (собственные значения) обладают следующим свойством. Если λ корень характеристического урав-нения, то −λ также является корнем характеристического уравне-ния. Это означает, что матрица Z может быть представлена в виде

71

Z =W λ ; 0 W 1 , где W матрица, составленная из собственных

0; −λ

векторов, λ = diag(λ1 ,..., λn ) – диагональная матрица, образованная

с помощью положительных собственных значений, − λ диагональ-ная матрица, образованная с помощью отрицательных собственных значений.

Введем замену переменных в системе (5.9)

z

x

. То-

1

=W 1

z 2

p

z

x

гда 1

=W 1

. Замена переменных приводит к диагональному

z 2

p

виду системы

дифференциальных уравнений

z1

λ ;0

z1

=

.

z 2

0;

λ

z 2

Введем

обозначение

V ;V

Тогда

W 1 = V = 11

12

.

V21 ;V22

z1 ( t ) = V11 x ( t ) +V12 p ( t ) .

Ранее

была

установлена

связь

p(t ) = Pр (t )x (t) ,

поэтому

z1 (t ) = (V11 +V12 Pр )x (t)

и x ( t) → 0 , то

z ( t) 0

. Поскольку z (t ) = e λ( t t0 ) z (t

) , то это возможно только

1

1

1

0

при условии V11 +V12 Pр = 0 , так как

x ( t0 ) 0 . Это приводит к ре-

зультату

P = −V 1V .

12

11

7.6. Пример решения задачи АКОР

Рассмотрим систему первого

порядка

dx

= ax +bu ,

x(0) = x ,

dt

0

T

t ∈[0,T ]

и критерий оптимальности

J = (x 2 + cu 2 )dt + x (T )Px (T ) ,

так что A = a , B = b , R1 = 1,

R2 = c , P1 = P .

0

72

Система дифференциальных уравнений (5.9)

x

b

2

x

мого случая имеет вид

=

a ;

, т.е.

c

p

−1;

a

p

dx = axb2 p, dt c

dpdt = − xap.

для рассматривае-

(7.5.1)

Для решения этой системы запишем характеристическое урав-

нение и найдем его корни: | λEAn |=

λ − a;

b2

= 0 .

Последнее

c

1;

λ + a

уравнение является квадратным:

λ2a2

b 2

= 0 , и имеет два кор-

c

ня: λ = a 2

+

b 2

, λ

= −

a2 +

b2

. Решение системы дифференци-

2

1

c

c

x ( t)

k1 exp(λ1t)

альных уравнений при

λ = λ1 ищем в виде

p (t )

= k

2

exp(λ t)

.

1

Поскольку

x = k1 λ1 exp(λ1t ), p = k 2 λ1 exp(λ1t) ,

то после

соответст-

в ующей подстановки получим однородную систему линейных уравнений для k1 , k2 :

k1 1 a ) + bc2 k2 = 0,

k1 + ( λ1 + a ) k2 = 0.

Определитель этой системы равен нулю (он совпадает с левой частью характеристического уравнения при λ = λ1 ), поэтому по-

следние два уравнения линейно зависимы. Полагая k1 =1 , получим

73

k

= −

1

. Решение

системы

(7.5.1)

при λ = λ

имеет вид

2

λ + a

1

1

x (t)

exp(λ1t)

=

−1

exp(λ t) .

λ

+ a

p (t) 1

1

1

при λ = λ2 и

Аналогично находится решение системы (7.5.1)

x ( t)

exp(λ2t)

−1

оно имеет вид

=

. Общее решение системы

p (t)

2

exp(λ2t)

λ

+ a

2

(7.5.1) записывается в форме

x (t)

= C

exp(λ1t )

exp(λ2t)

−1

+ C

−1

.

1

exp(λ t )

2

exp(λ

t)

+ a

+ a

p (t)

λ

1

λ

2

2

1

Для определения значений произвольных констант используем

начальное и граничное условия

x(0) = x0

и

p(T ) = Px (T ) , которые

приводят к уравнениям: C1 + C 2 = x0 ,

C1

exp(λ T ) −

C2

exp(λ

T ) = P[C exp(λ t) + C

2

exp(λ

T )] .

λ1 + a

1

λ2

+ a

2

1

1

2

Исключая C 2

= x0C1 , получим выражение для C1 :

x exp(λ T )(1 +

1

)

C1 =

0

2

λ2 + a

.

(7.5.2)

1

1

(

+ P )exp(λ T ) − (

+ P )exp(λ T )

λ2 + a

2

λ1

+ a

1

Рассмотрим асимптотические свойства решения рассматривае-мой задачи. Следует рассмотреть асимптотический результат при T →∞ . Учитывая, что λ1 > 0 и λ2 < 0 , получим C1 0 (столкнем-

ся с ситуацией 0 0 ). При этом C 2x0 , и зависимость решения задачи АКОР от матрицы P1 = P пропадает.

74

Это соответствует общим асимптотическим свойствам решения, поскольку при C1 ≠ 0 – x(t ) не может стремиться к нулю, так как

λ1 > 0 .

При T = ∞ задача АКОР становится стационарной. Это следу-ет непосредственно из аналитического вида решения

x ( t)

exp(λ2t)

= x

−1

, поскольку имеют

место

равенства

0

p ( t)

λ

2

+ a exp(λ2t)

x (t)

= − ( λ

+ a) и u (t ) = −R 1

(t )B T (t ) p (t ) = − 1 bp ( t ) =

b

x ( t) .

2

p ( t)

2

c

c 2 + a)

Поэтому справедлива связь

b

u (t ) = β x (t), β =

.

(7.5.3)

c 2 + a)

Коэффициент β является постоянным (не зависящим от време-

ни). Таким образом, оптимальное управление можно осуществить с помощью стационарной обратной связи.

Можно заметить, что β < 0 , так как λ2

+ a = − a 2 +

b 2

+ a < 0 ,

c

т.е. обратная связь является отрицательной.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]