
- •Глава 1. Оптимизация статических объектов 6
- •Глава 2. Основы линейного программирования 22
- •Глава 3. Способы описания динамических систем 34
- •Глава 4. Применение вариационных методов для поиска
- •Глава 1. Оптимизация статических объектов
- •1.1. Понятие статических и динамических объектов
- •1.2. Задача нелинейного программирования
- •Задачи на условный экстремум, неопределенные множители Лагранжа
- •1.4. Пример применения метода неопределенных множителей Лагранжа для поиска наибольших значений функций
- •1.5. Общая постановка задачи линейного оценивания параметров
- •Глава 2. Основы линейного программирования
- •2.1. Постановка задачи
- •2.2. Основные геометрические фигуры в линейном программировании
- •Экстремальные точки
- •2.4. Основные теоремы об экстремальных точках
- •2.5. Симплексный метод решения задач линейного программирования
- •2.6. Учет ограничений типа неравенств
- •2.7. Поиск начальной экстремальной точки
- •Глава 3. Способы описания динамических систем
- •3.1. Передаточные функции
- •3.2. Описание в форме Коши
- •3.3. Управляемость, наблюдаемость, стабилизируемость, обнаруживаемость
- •3.4. Понятие фильтра и общая задача регулирования
- •Глава 4. Применение вариационных методов для поиска оптимальных управлений
- •4.1. Понятие линейного пространства
- •4.2. Функционал и его вариация
- •4.3. Вычисление вариации функционала
- •4.4. Задача Эйлера
- •4.5. Применение уравнения Эйлера для поиска оптимального закона управления
- •4.6. Уравнение Эйлера – Пуассона и его применение
- •4.8. Неопределенные множители Лагранжа в вариационном исчислении
- •Глава 5. Вариационные задачи с подвижными границами
- •5.1.Основные виды задач с подвижными границами
- •5.2. Скольжение граничных точек по заданным траекториям
- •Глава 6. Принцип максимума
- •Постановка задачи поиска оптимального управления
- •Пояснения к получению принципа максимума
- •6.3. Динамическое программирование
- •Примеры применения динамического программирования
- •Глава 7. Аналитическое конструирование регуляторов (акор)
- •7.1. Постановка задачи
- •7.2. Решение задачи акор
- •7.3. Уравнение Риккати
- •7.4. Общие свойства решения уравнения Риккати
- •7.5. Способы решения уравнения Риккати
- •7.7. Метод диагонализации
- •Глава 8. Случайные процессы в системах управления
- •8.1. Описание случайных процессов
- •8.2. Стохастические дифференциальные уравнения
- •8.3. Прогнозирование (оценивание) значений случайных величин с использованием закона распределения
- •8.4. Линейное оценивание значений случайных величин
- •Глава 9. Фильтр калмана
- •9.1. Постановка задачи
- •9.2. Основные принципы получения формул дискретного фильтра Калмана
- •9.3. Получение формул фильтра Калмана
7.3. Уравнение Риккати
Имеется неудобство решения уравнения системы (7.2.9), по-скольку приходится использовать краевые условия наряду с на-чальными условиями. Поэтому существует способ поиска решения оптимальной задачи с применением уравнения Риккати.
В теории обыкновенных дифференциальных уравнений уравне-нием Риккати называют нелинейное уравнение вида:
dydx = a (x ) y 2 (x ) + b (x ) y (x ) + c (x) .
Оказывается, что с помощью математических преобразований можно заменить решение системы (7.2.9) решением матричного дифференциального уравнения, которое внешне похоже на уравне-ние Риккати. Для получения матричного уравнения Риккати рас-смотрим матрицу Коши, соответствующую системе (7.2.9) и запи-
|
θ (t , t );θ (t , t ) |
, так что имеет |
|
|||||
шем ее в блочном виде θ(t ,t1 ) = |
111121 |
|
||||||
|
θ 21 (t , t1 );θ22 (t , t1 ) |
|
|
|||||
место соотношение |
x ( t) |
x (t ) |
. Поэтому имеют место |
|
||||
|
|
= θ(t ,t1 ) |
1 |
|
||||
|
p (t ) |
p (t1 ) |
|
|
равенства:
x(t ) = θ11 (t , t1 ) x (t1 ) +θ12 ( t , t1 ) p (t1 ), p(t ) = θ 21 (t , t1 ) x (t1 ) +θ22 (t , t1 ) p (t1 ).
Учитывая, что p ( t1 ) = P1 x (t1 ) , получим
68
x(t ) =[θ11 (t , t1 ) + θ12 (t , t1 ) P1 ] x ( t1 ), p(t ) = [θ21 ( t , t1 ) +θ22 (t , t1 ) P1 ] x (t1 ).
На основе последних соотношений (выразим из первого соот-ношения x( t1 ) и подставим его во второе уравнение) получим связь
между векторами p(t ) и x(t ) :
p(t ) = [θ21 (t , t1 ) + θ 22 (t , t1 )P1 ][θ11 (t , t1 ) +θ12 (t , t1 )P1 ]−1 x (t) .
Введем матрицу Риккати Pр ( t ) :
P ( t ) = [ θ |
21 |
(t , t ) + θ |
22 |
(t , t ) P ][θ (t , t ) + θ |
( t , t ) P ]−1 |
, |
(7.3.1) |
|
||||||
р |
|
1 |
1 |
1 |
11 |
1 |
12 |
1 |
1 |
|
|
|
||
так что |
p(t ) = Pр ( t ) x (t ) , |
тогда |
с |
учетом |
(5.7) |
получим |
|
|||||||
u (t ) = −F (t ) x (t ) , где F (t ) = R −1 (t ) B T (t ) P ( t ) . |
|
|
|
|
|
|||||||||
|
|
|
|
|
|
2 |
|
р |
|
|
|
|
|
|
Таким образом, если известна матрица Риккати, то оптимальное управление можно осуществить с помощью обратной связи.
Оказывается, что для поиска матрицы Риккати следует решить матричное дифференциальное уравнение первого порядка. Это уравнение получается путем дифференцирования выражения для матрицы Pр ( t ) .
Поскольку при дифференцировании выражения (7.3.1) придется дифференцировать обратную матрицу, то сначала следует устано-вить правило дифференцирования обратной матрицы. Для этого продифференцируем обе части очевидного матричного равенства M (t )M −1 (t ) = E , получим
|
dM (t ) |
M −1 (t ) + M (t ) |
dM −1 (t ) |
= 0 . |
|
|
||||||||
|
|
dt |
|
|
|
|||||||||
|
|
|
|
|
|
|
dt |
|
|
|
|
|
|
|
Откуда следует |
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
dM −1 ( t ) |
= −M |
−1 |
(t ) |
dM (t ) |
M |
−1 |
(t ) . |
(7.3.2) |
|
|||
|
|
dt |
|
|
|
dt |
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Согласно выражению (7.3.2) производная от обратной матрицы может быть выражена через блоки матрицы M (t ) и производные
от этих блоков.
Получим более сильное утверждение, пользуясь свойствами матрицы Коши. Поскольку имеет место матричное дифференци-альное уравнение
69
-
A(t ); −B (t ) R
−1
(t ) B
T
(t )
θ (t );θ (t )
θ (t );θ (t )
=
,
11
12
2
11
12
θ
(t );θ
(t )
− R
( t ); −AT ( t )
θ21 (t );θ22 (t )
21
22
1
то производные от блоков матрицы могут быть выражены через сами блоки, например, θ11 (t ) = A(t )θ11 (t ) − B (t )R2−1 (t )B T (t )θ21 (t) .
Подстановка выражений производных от блоков, зависящих от самих блоков, в выражение для производной от Pр ( t ), полученной
с помощью формулы (7.3.1), и использование при преобразованиях обычных алгебраических матричных операций приводит к сле-дующему уравнению [8]:
|
−1 |
(t )B |
T |
(t )Pр (t) + |
|
|
− Pр (t ) = R1 |
(t ) − Pр (t )B (t )R2 |
|
|
|
||
+ P (t ) A( t ) + AT (t )P (t). |
|
|
|
(7.3.3) |
|
|
|
|
|
|
|
||
р |
р |
|
|
|
|
|
Уравнение (7.3.3) называется уравнением Риккати. |
|
|||||
Для матрицы |
Pр ( t ) можно |
получить начальное условие: |
|
Pр ( t1 ) = P1 , подставляя t = t1 в выражение (7.3.1), где P1 – матрица, входящая в постановку задачи АКОР.