
- •Глава 1. Оптимизация статических объектов 6
- •Глава 2. Основы линейного программирования 22
- •Глава 3. Способы описания динамических систем 34
- •Глава 4. Применение вариационных методов для поиска
- •Глава 1. Оптимизация статических объектов
- •1.1. Понятие статических и динамических объектов
- •1.2. Задача нелинейного программирования
- •Задачи на условный экстремум, неопределенные множители Лагранжа
- •1.4. Пример применения метода неопределенных множителей Лагранжа для поиска наибольших значений функций
- •1.5. Общая постановка задачи линейного оценивания параметров
- •Глава 2. Основы линейного программирования
- •2.1. Постановка задачи
- •2.2. Основные геометрические фигуры в линейном программировании
- •Экстремальные точки
- •2.4. Основные теоремы об экстремальных точках
- •2.5. Симплексный метод решения задач линейного программирования
- •2.6. Учет ограничений типа неравенств
- •2.7. Поиск начальной экстремальной точки
- •Глава 3. Способы описания динамических систем
- •3.1. Передаточные функции
- •3.2. Описание в форме Коши
- •3.3. Управляемость, наблюдаемость, стабилизируемость, обнаруживаемость
- •3.4. Понятие фильтра и общая задача регулирования
- •Глава 4. Применение вариационных методов для поиска оптимальных управлений
- •4.1. Понятие линейного пространства
- •4.2. Функционал и его вариация
- •4.3. Вычисление вариации функционала
- •4.4. Задача Эйлера
- •4.5. Применение уравнения Эйлера для поиска оптимального закона управления
- •4.6. Уравнение Эйлера – Пуассона и его применение
- •4.8. Неопределенные множители Лагранжа в вариационном исчислении
- •Глава 5. Вариационные задачи с подвижными границами
- •5.1.Основные виды задач с подвижными границами
- •5.2. Скольжение граничных точек по заданным траекториям
- •Глава 6. Принцип максимума
- •Постановка задачи поиска оптимального управления
- •Пояснения к получению принципа максимума
- •6.3. Динамическое программирование
- •Примеры применения динамического программирования
- •Глава 7. Аналитическое конструирование регуляторов (акор)
- •7.1. Постановка задачи
- •7.2. Решение задачи акор
- •7.3. Уравнение Риккати
- •7.4. Общие свойства решения уравнения Риккати
- •7.5. Способы решения уравнения Риккати
- •7.7. Метод диагонализации
- •Глава 8. Случайные процессы в системах управления
- •8.1. Описание случайных процессов
- •8.2. Стохастические дифференциальные уравнения
- •8.3. Прогнозирование (оценивание) значений случайных величин с использованием закона распределения
- •8.4. Линейное оценивание значений случайных величин
- •Глава 9. Фильтр калмана
- •9.1. Постановка задачи
- •9.2. Основные принципы получения формул дискретного фильтра Калмана
- •9.3. Получение формул фильтра Калмана
7.4. Общие свойства решения уравнения Риккати
Сначала сформулируем [8] некоторые общие асимптотические свойства уравнения Риккати при t1 →∞ .
P(t ) → Py (t ) , причем Py (t ) не зависит от P1 .
Если все матрицы, входящие в постановку задачи, постоянны, то Py (t ) также является постоянной и удовлетворяет уравнению
R1 − Py BR2−1 B T Py + AT Py + Py A = 0 .
3. Если все матрицы, входящие в постановку задачи, постоянны, но t1 – конечная величина, то матрица Риккати зависит от времени,
т.е. при управлении с помощью обратной связи последняя зависит от времени и задача управления является нестационарной.
4. Минимальное значение критерия оптимальности равно
JM = x T ( t 0 ) Py (t 0 ) x (t0 ) .
70
7.5. Способы решения уравнения Риккати
1. Метод прямого интегрирования (метод обратного времени).
Он заключается в применении численного интегрирования с ис-пользованием начального условия и основан на применении соот-
ношения Pр (t1 − |
|
|
) = Pр (t1 ) − Pр (t1 ) . |
|
Матрица Pр ( t1 ) может быть вычислена с помощью правой части
уравнения (7.3.3).
Аналогичным способом может быть найдена матрица Pр (t1 − 2 ) . Процесс вычисления продолжается до момента време-
ни t0 .
2. Метод Ньютона – Рафсона предназначен для решения ста-ционарной задачи. Концепцию метода можно проиллюстрировать на примере численного решения обычного квадратного уравнения
x 2 + ax + b = 0 . Пусть x0 – приближенное значение корня xk урав-нения. Понятно, что x k = x0 + ε0 , где ε0 – малая ошибка. Тогда (x0 + ε )2 + a (x0 + ε ) + b = 0 , и, пренебрегая квадратом ошибки, полу-чим линейное уравнение для ε0 . Решение этого уравнения дает приближенное значение ε0 ошибки, но теперь можно определить значение x1 = x0 + ε0 , которое, наверное, будет ближе к xk , нежели x0 . Продолжая итерационный процесс, будем приближаться к ис-
тинному значению корня.
Такой подход можно применить к решению матричного уравне-
ния R1 + Pk SPk + Pk +1 ( A − SPk ) + ( AT − Pk S)Pk +1 = 0 , где S = BR2−1 BT .
3. Метод диагонализации предназначен для решения стацио-нарной задачи.
Пусть матрица Z , определяющая (см. систему (5.9)) решение стационарной задачи АКОР, имеет различные действительные соб-ственные значения. Структура матрицы Z такова, что корни ха-рактеристического уравнения (собственные значения) обладают следующим свойством. Если λ корень характеристического урав-нения, то −λ также является корнем характеристического уравне-ния. Это означает, что матрица Z может быть представлена в виде
71
Z =W λ ; 0 W −1 , где W – матрица, составленная из собственных
0; −λ
векторов, λ = diag(λ1 ,..., λn ) – диагональная матрица, образованная
с помощью положительных собственных значений, − λ диагональ-ная матрица, образованная с помощью отрицательных собственных значений.
Введем замену переменных в системе (5.9) |
z |
|
|
x |
. То- |
|
||||||||||||||
1 |
=W −1 |
|
|
|||||||||||||||||
|
|
|
z 2 |
|
p |
|
|
|
||||||||||||
z |
|
x |
|
|
|
|
|
|
|
|||||||||||
гда 1 |
=W −1 |
. Замена переменных приводит к диагональному |
|
|||||||||||||||||
z 2 |
p |
|
|
|
|
|
|
|
||||||||||||
виду системы |
дифференциальных уравнений |
z1 |
|
λ ;0 |
z1 |
|
|
|||||||||||||
|
|
= |
|
|
. |
|
||||||||||||||
|
|
|
z 2 |
0; |
−λ |
z 2 |
|
|
||||||||||||
Введем |
обозначение |
|
|
|
|
V ;V |
|
Тогда |
|
|||||||||||
W −1 = V = 11 |
12 |
. |
|
|||||||||||||||||
|
|
|
|
|
|
|
|
V21 ;V22 |
|
|
||||||||||
z1 ( t ) = V11 x ( t ) +V12 p ( t ) . |
Ранее |
была |
|
установлена |
связь |
|
||||||||||||||
p(t ) = Pр (t )x (t) , |
поэтому |
z1 (t ) = (V11 +V12 Pр )x (t) |
и x ( t) → 0 , то |
|
||||||||||||||||
z ( t) → 0 |
. Поскольку z (t ) = e λ( t −t0 ) z (t |
) , то это возможно только |
|
|||||||||||||||||
1 |
|
1 |
|
1 |
0 |
|
|
|
|
|
|
|
|
|||||||
при условии V11 +V12 Pр = 0 , так как |
x ( t0 ) ≠ 0 . Это приводит к ре- |
|
||||||||||||||||||
зультату |
P = −V −1V . |
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
12 |
11 |
|
|
|
|
|
|
|
|
|
|
|
|||||||
7.6. Пример решения задачи АКОР |
|
|
|
|
|
|
|
|||||||||||||
Рассмотрим систему первого |
порядка |
|
dx |
= ax +bu , |
x(0) = x , |
|
||||||||||||||
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
dt |
|
|
0 |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
T |
|
|
|
|
|||||||||
t ∈[0,T ] |
и критерий оптимальности |
J = ∫ (x 2 + cu 2 )dt + x (T )Px (T ) , |
|
|||||||||||||||||
так что A = a , B = b , R1 = 1, |
R2 = c , P1 = P . |
0 |
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
72
Система дифференциальных уравнений (5.9)
|
x |
|
|
|
|
|
b |
2 |
|
x |
|
|
мого случая имеет вид |
= |
a ; − |
|
|
, т.е. |
|
||||||
c |
|
|||||||||||
|
|
|
|
|
|
|
|
|||||
|
p |
|
|
|
−1; |
−a |
|
p |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
dx = ax − b2 p, dt c
dpdt = − x − ap.
для рассматривае-
(7.5.1)
Для решения этой системы запишем характеристическое урав-
нение и найдем его корни: | λE − An |= |
|
λ − a; |
|
b2 |
|
|
= 0 . |
Последнее |
|
|||||||||||||||
|
|
|
|
|||||||||||||||||||||
|
|
c |
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
1; |
|
λ + a |
|
|
|
|
|
|
|
|
||||
уравнение является квадратным: |
λ2 − a2 − |
b 2 |
|
= 0 , и имеет два кор- |
|
|||||||||||||||||||
c |
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
ня: λ = a 2 |
+ |
b 2 |
, λ |
|
= − |
a2 + |
b2 |
. Решение системы дифференци- |
|
|||||||||||||||
|
2 |
|
|
|||||||||||||||||||||
1 |
|
c |
|
|
|
c |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
x ( t) |
k1 exp(λ1t) |
|
|||||||||
альных уравнений при |
λ = λ1 ищем в виде |
p (t ) |
|
= k |
2 |
exp(λ t) |
. |
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
||||||
Поскольку |
x = k1 λ1 exp(λ1t ), p = k 2 λ1 exp(λ1t) , |
то после |
соответст- |
|
в
ующей
подстановки получим однородную систему
линейных уравнений для k1
,
k2
:
k1 (λ1 − a ) + bc2 k2 = 0,
k1 + ( λ1 + a ) k2 = 0.
Определитель этой системы равен нулю (он совпадает с левой частью характеристического уравнения при λ = λ1 ), поэтому по-
следние два уравнения линейно зависимы. Полагая k1 =1 , получим
73
k |
|
= − |
1 |
|
|
|
|
. Решение |
системы |
(7.5.1) |
при λ = λ |
|
|
|
имеет вид |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2 |
λ + a |
|
1 |
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||
x (t) |
|
|
|
|
|
exp(λ1t) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||
= |
|
|
|
−1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
exp(λ t) . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
λ |
|
+ a |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||
p (t) 1 |
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
при λ = λ2 и |
|
|||||||||||||||||||||||||||||||||||||
|
|
Аналогично находится решение системы (7.5.1) |
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
x ( t) |
|
|
|
|
|
|
|
|
|
exp(λ2t) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
−1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||
оно имеет вид |
|
= |
|
|
|
|
|
|
|
|
. Общее решение системы |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
p (t) |
2 |
|
|
|
|
|
|
|
exp(λ2t) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
λ |
|
+ a |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||
(7.5.1) записывается в форме |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
x (t) |
= C |
|
|
|
exp(λ1t ) |
|
|
|
|
|
|
|
|
exp(λ2t) |
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
−1 |
|
|
|
|
|
|
|
|
+ C |
|
|
−1 |
|
|
|
|
|
. |
|
|
|||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
exp(λ t ) |
|
|
2 |
|
|
|
|
exp(λ |
t) |
|
|
|||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
+ a |
|
|
|
|
|
|
+ a |
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
p (t) |
|
|
λ |
|
|
|
|
|
|
1 |
|
|
|
λ |
2 |
|
|
|
|
2 |
|
|
|
||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||
|
|
Для определения значений произвольных констант используем |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
начальное и граничное условия |
|
x(0) = x0 |
|
и |
p(T ) = Px (T ) , которые |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
приводят к уравнениям: C1 + C 2 = x0 , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
− |
|
C1 |
|
|
|
exp(λ T ) − |
|
C2 |
|
|
|
exp(λ |
T ) = P[C exp(λ t) + C |
2 |
exp(λ |
T )] . |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
λ1 + a |
|
|
|
|
|
|
1 |
|
λ2 |
+ a |
|
|
|
|
2 |
|
|
|
|
1 |
|
|
|
1 |
|
|
|
|
2 |
|
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||
|
|
Исключая C 2 |
= x0 −C1 , получим выражение для C1 : |
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
x exp(λ T )(1 + |
|
|
1 |
|
) |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||
|
|
C1 = |
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
2 |
|
|
|
|
|
λ2 + a |
|
|
|
|
|
|
|
. |
|
|
|
|
(7.5.2) |
|
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
( |
|
|
|
|
|
|
+ P )exp(λ T ) − ( |
|
|
|
+ P )exp(λ T ) |
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
λ2 + a |
|
|
|
|
|
|
2 |
|
|
|
|
|
λ1 |
+ a |
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рассмотрим асимптотические свойства решения рассматривае-мой задачи. Следует рассмотреть асимптотический результат при T →∞ . Учитывая, что λ1 > 0 и λ2 < 0 , получим C1 → 0 (столкнем-
ся с ситуацией 0 −0∞ ). При этом C 2 → x0 , и зависимость решения задачи АКОР от матрицы P1 = P пропадает.
74
Это соответствует общим асимптотическим свойствам решения, поскольку при C1 ≠ 0 – x(t ) не может стремиться к нулю, так как
λ1 > 0 .
При T = ∞ задача АКОР становится стационарной. Это следу-ет непосредственно из аналитического вида решения
|
x ( t) |
|
|
|
|
|
exp(λ2t) |
|
|
|
|
|
|
|
|
|
|
|
||
|
= x |
|
|
|
−1 |
|
, поскольку имеют |
место |
равенства |
|
||||||||||
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
p ( t) |
|
|
|
λ |
2 |
+ a exp(λ2t) |
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x (t) |
= − ( λ |
|
+ a) и u (t ) = −R −1 |
(t )B T (t ) p (t ) = − 1 bp ( t ) = |
|
b |
|
x ( t) . |
|
||||||||||
|
|
2 |
|
|
|
|
||||||||||||||
|
p ( t) |
|
|
|
|
|
|
|
|
2 |
|
|
c |
|
c (λ2 + a) |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Поэтому справедлива связь |
|
|
b |
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
u (t ) = β x (t), β = |
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
(7.5.3) |
|
|||||
|
|
|
|
|
|
|
|
|
c (λ2 + a) |
|
|
|
|
Коэффициент β является постоянным (не зависящим от време-
ни). Таким образом, оптимальное управление можно осуществить с помощью стационарной обратной связи.
Можно заметить, что β < 0 , так как λ2 |
+ a = − a 2 + |
b 2 |
+ a < 0 , |
|
c |
|
|||
|
|
|
|
т.е. обратная связь является отрицательной.