
- •Глава 1. Оптимизация статических объектов 6
- •Глава 2. Основы линейного программирования 22
- •Глава 3. Способы описания динамических систем 34
- •Глава 4. Применение вариационных методов для поиска
- •Глава 1. Оптимизация статических объектов
- •1.1. Понятие статических и динамических объектов
- •1.2. Задача нелинейного программирования
- •Задачи на условный экстремум, неопределенные множители Лагранжа
- •1.4. Пример применения метода неопределенных множителей Лагранжа для поиска наибольших значений функций
- •1.5. Общая постановка задачи линейного оценивания параметров
- •Глава 2. Основы линейного программирования
- •2.1. Постановка задачи
- •2.2. Основные геометрические фигуры в линейном программировании
- •Экстремальные точки
- •2.4. Основные теоремы об экстремальных точках
- •2.5. Симплексный метод решения задач линейного программирования
- •2.6. Учет ограничений типа неравенств
- •2.7. Поиск начальной экстремальной точки
- •Глава 3. Способы описания динамических систем
- •3.1. Передаточные функции
- •3.2. Описание в форме Коши
- •3.3. Управляемость, наблюдаемость, стабилизируемость, обнаруживаемость
- •3.4. Понятие фильтра и общая задача регулирования
- •Глава 4. Применение вариационных методов для поиска оптимальных управлений
- •4.1. Понятие линейного пространства
- •4.2. Функционал и его вариация
- •4.3. Вычисление вариации функционала
- •4.4. Задача Эйлера
- •4.5. Применение уравнения Эйлера для поиска оптимального закона управления
- •4.6. Уравнение Эйлера – Пуассона и его применение
- •4.8. Неопределенные множители Лагранжа в вариационном исчислении
- •Глава 5. Вариационные задачи с подвижными границами
- •5.1.Основные виды задач с подвижными границами
- •5.2. Скольжение граничных точек по заданным траекториям
- •Глава 6. Принцип максимума
- •Постановка задачи поиска оптимального управления
- •Пояснения к получению принципа максимума
- •6.3. Динамическое программирование
- •Примеры применения динамического программирования
- •Глава 7. Аналитическое конструирование регуляторов (акор)
- •7.1. Постановка задачи
- •7.2. Решение задачи акор
- •7.3. Уравнение Риккати
- •7.4. Общие свойства решения уравнения Риккати
- •7.5. Способы решения уравнения Риккати
- •7.7. Метод диагонализации
- •Глава 8. Случайные процессы в системах управления
- •8.1. Описание случайных процессов
- •8.2. Стохастические дифференциальные уравнения
- •8.3. Прогнозирование (оценивание) значений случайных величин с использованием закона распределения
- •8.4. Линейное оценивание значений случайных величин
- •Глава 9. Фильтр калмана
- •9.1. Постановка задачи
- •9.2. Основные принципы получения формул дискретного фильтра Калмана
- •9.3. Получение формул фильтра Калмана
Глава 7. Аналитическое конструирование регуляторов (акор)
7.1. Постановка задачи
Описание ОУ: x = A(t ) x (t ) + B (t )u ( t ) . Управлению подлежит z(t ) = D (t ) x (t ) . Требуется «прижать» сигнал z( t ) к желаемому сиг-налу r ( t ) = 0 на интервале времени [ t 0 , t1 ] . Имеются начальные ус-ловия x( t 0 ) = x0 . Далее для простоты рассматривается случай, когда z(t ) = x ( t ).
Критерий качества управления имеет вид
J = t∫1 [ x T (t ) R1 ( t ) + u T (t ) R2 ( t )u (t )]dt + x T (t1 ) P1 x (t1 ) ,
t 0
где матрицы R1 ( t ), R2 ( t ), P1 обладают свойством положительной оп-
ределенности.
Движение описывается выражением
x( t ) = Ф(t , t 0 ) x (t 0 ) + ∫t Ф( t ,τ) B (τ ) u (τ ) dτ ,
t 0
63
где Ф(t , τ) – матрица Коши, имеющая свойства:
x( t ) = Ф( t , t 0 ) x ( t0 ) , если отсутствует управляющее воздейст-вие (происходит свободное движение при u (t ) = 0 );
dtd Ф(t , t 0 ) = A( t)Ф(t , t0 ) ;
Ф( t 0 , t 0 ) = E (единичная матрица);
Ф( t 2 , t 0 ) = Ф( t 2 , t1 )Ф( t1 , t0 ) ;
Ф−1 (t , t0 ) = Ф(t 0 , t) ;
dtd ФT (t 0 ,t ) = −AT (t )ФT (t 0 ,t) .
7.2. Решение задачи акор
Пусть u 0 (t ) – оптимальное управляющее воздействие и x0 (t ) – оптимальное движение. Введем вариацию u (t ) управляющего воз-
действия и вычислим вариацию функционала (критерия J ), учи-тывая линейность объекта управления.
Поскольку новое (возмущенное) движение x(t ) = x 0 (t ) +δ(t ) при новом управляющем воздействии uн (t ) = u 0 + λu (t ) находится из уравнения x 0 (t ) + δ (t ) = A(t ) x 0 (t ) + A(t )δ(t ) + B (t )u 0 (t ) + B (t )λu (t ) и x0 (t ) = A(t ) x 0 (t ) + B (t ) u 0 (t ) , то δ(t ) = A(t )δ(t ) + λB (t )u (t ) , где
δ(t0 ) = 0 , Кроме того, возмущению u (t ) управляющего воздействия соответствует возмущение x(t ) движения, удовлетворяющее усло-
вию δ( t ) = λx (t ) , причем |
|
|
x (t ) = ∫t |
Ф(t ,τ)B (τ )u (τ ) dτ . |
(7.2.1) |
t0 |
|
|
Новое значение Jн функционала можно записать в виде
64
t1
J н = ∫ [ x T (t ) R1 ( t ) x ( t ) + u нT ( t ) R2 (t )u н (t )]dt + x T ( t1 ) P1 x ( t1 ) =
t0
= t∫1 [ x 0 T (t ) R1 ( t ) x 0 (t ) + u 0 (t ) R2 (t ) u 0 (t )]dt + x 0 T ( t1 ) P1 x 0 ( t1 ) +
t0
t1
+2 λ{∫[ x T (t ) R1 ( t ) x 0 (t ) + u T (t ) R2 (t )u 0 (t )]dt + x T (t1 ) P1 x 0 ( t1 )} +
t0
t1
+λ2{∫[ x T (t ) R1 (t )x(t ) + u T (t ) R2 (t )u (t )]dt + x T (t1 ) P1 x (t1 )}.
t0
Вычисление вариации δJ функционала по формуле ∂∂λ Jн при
λ = 0 и приравнивание ее нулю приводит к условию экстремума
δJ = t∫1 [ x T (t ) R1 (t ) x 0 (t ) + u T (t ) R2 (t )u 0 (t )]dt + x T (t1 ) P1 x 0 (t1 ) = 0 . (7.2.2)
t 0
Исключим из выражения (7.2.2) с помощью соотношения (7.2.1) функцию x(t ) , получим
-
t1
t
∫ [{∫Ф(t , τ ) B (τ )u (τ ) dτ}T R1 (t ) x 0 (t )} +u T ( t ) R2 (t ) u 0 (t )]dt +
t 0
t0
+ x T (t ) P x 0
(t ) = 0.
1
1
1
Теперь в условии экстремума осталась вариация только одного аргумента. Далее следует преобразовать условие экстремума к та-кому виду, чтобы можно было воспользоваться основной леммой вариационного исчисления.
Последнюю запись можно представить в виде
-
t∫1 [{ ∫t
u T (τ ) B T (τ )ФT (t , τ ) dτ}R1 (t ) x 0 (t ) + u T (t ) R2
(t ) u 0 (t )]dt +
(7.2.3)
t 0 t 0
+ x T (t1 ) P1 x 0 (t1 ) = 0.
Отметим одно свойство двойного интеграла, связанного с заме-ной порядка интегрирования функции двух аргументов
65
-
t1
t
t1
t1
∫ [ ∫ ψ (t , τ) dτ ]dt = ∫ [ ∫ψ(t , τ ) dt ]dτ .
t 0
t0
t0
τ
Введем обозначение ψ(t ,τ ) = u T (τ ) B T (τ ) ФT (t ,τ) R1 (t ) x 0 ( t ) в вы-ражении (7.2.3), поменяем порядок интегрирования для первого слагаемого
-
t1
t
S = ∫ [ ∫u T (τ ) B T (τ ) ФT (t , τ ) R1 (t ) x 0 ( t ) dτ]dt =
t 0
t0
(7.2.4)
t1 t1
= ∫ [ ∫u T (τ ) BT (τ )ФT (t , τ ) R1 ( t ) x 0 (t ) dt ]dτ.
t 0 t
Учитывая, что результат интегрирования не зависит от обозна-чения переменных, используем в выражении (7.2.4) замену: вместо буквы τ применим символ t , а вместо буквы t – символ τ . Тогда получим, что первое слагаемое в соотношении (7.2.3) можно запи-сать в измененной форме
|
t1 t1 |
|
S = ∫ [ ∫u T ( t ) B T ( t )ФT (τ, t )R1 (τ ) x 0 (τ ) dt ]dτ . |
|
t 0 t |
|
Теперь условие (7.2.3) принимает вид |
t1 |
t1 |
∫ u T ( t ){ B T ( t )∫ФT (τ , t ) R1 (τ )x 0 (τ ) dτ + R2 ( t ) u 0 ( t )}dt + x T ( t1 ) P1 x 0 ( t1 ) = 0 . |
|
t 0 |
t |
|
t1 |
|
Учитывая, что x T ( t1 ) = ∫u T ( t ) B T ( t )ФT ( t1 , t )dt , получим оконча- |
|
t0 |
тельно условие экстремума, когда можно воспользоваться основ-ной леммой вариационного исчисления
t1 |
t1 |
|
|
|
|
∫ u T (t ){B T (t )∫ФT (τ, t ) R1 (τ )x 0 (τ ) dτ + |
(7.2.5) |
|
|||
t 0 |
t |
|
|
|
|
+R ( t )u 0 |
( t ) + ФT ( t , t ) P x 0 |
(t )}dt = 0. |
|
|
|
2 |
1 |
1 |
1 |
|
|
Введем обозначение |
|
|
|
|
|
t1 |
|
|
|
|
|
p ( t ) = ∫ФT (τ , t )R1 (τ ) x 0 (τ ) dτ + ФT (t1 ,t )P1 x 0 (t1 ) |
(7.2.6) |
|
t
66
и |
запишем |
более |
|
компактно |
условие |
(7.2.5): |
|
t1 |
|
|
|
|
|
|
|
∫u T ( t )[ B T ( t ) p ( t ) + R2 ( t ) u 0 ( t )]dt . |
|
|
|
|
|||
t0 |
|
|
|
|
|
|
|
|
После чего, опираясь на основную лемму вариационного исчис- |
|
|||||
ления, получим B T (t ) p (t ) + R ( t )u 0 (t ) = 0 |
|
|
|
||||
или |
|
2 |
|
|
|
|
|
|
(t ) B T (t ) p (t ) , |
|
|
|
|||
|
|
u 0 (t ) = −R −1 |
|
(7.2.7) |
|
||
|
|
2 |
|
|
|
|
|
где p(t ) – вспомогательный вектор, подлежащий поиску. |
|
|
|||||
|
Вектор p(t ) удовлетворяет дифференциальному уравнению, ко- |
|
|||||
торое можно найти, вычислив |
производную от выражения (7.2.6). |
|
|||||
Действительно, |
t1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
p ( t ) = ∫ [ −AT (t )ФT (τ , t ) R1 (τ )x 0 (τ ) dτ − |
|
|
|||
|
|
t |
|
|
|
|
|
|
|
− AT (t )ФT (t , t ) Px 0 ( t ) − ФT (t , t ) R (t ) x 0 (t ). |
|
|
|||
|
|
1 |
1 |
1 |
1 |
|
|
Первое слагаемое – результат дифференцирования под знаком интеграла, второе – результат дифференцирования второго слагае-мого выражения (7.2.6), третье слагаемое – результат дифференци-рования по нижнему пределу интеграла.
Учитывая свойство матрицы Коши ФT (t , t ) = E , получим
p(t ) = −AT (t )[ |
t1 |
ФT (τ , t )R (τ ) x 0 |
(τ ) dτ + ФT (t ,t )Px 0 |
(t )] − R (t )x 0 |
|
|
|||||
∫ |
(t) , |
|
|||||||||
|
|
|
|
1 |
1 |
1 |
1 |
1 |
|
|
|
или: |
|
|
t |
|
|
|
|
|
|
|
|
|
p(t ) = − AT (t ) p (t ) − R (t )x 0 (t) . |
|
|
|
|
|
|||||
|
|
|
|
|
(7.2.8) |
|
|||||
|
|
|
|
|
|
1 |
|
|
|
|
|
Для |
вектора |
p(t ) можно получить |
граничное условие |
|
|||||||
p(t ) = Px 0 |
(t ) , полагая t = t |
в выражении (7.2.6). |
|
|
|
||||||
1 |
1 |
1 |
|
|
1 |
|
|
|
|
|
|
Полученные результаты объединяются в систему дифференци-альных уравнений с помощью подстановки соотношения (7.2.7) в исходное уравнение движения
x0 (t ) = A(t )x 0 (t ) − B (t )R2 (t )B T (t ) p (t), p (t ) = − AT (t ) p (t ) − R1 (t )x 0 (t).
67
x 0 (t )
Последняя система записывается в виде
p (t )
где
-
A( t ); −B ( t ) R2−1
( t ) B T ( t )
A =
− R
( t ); −A T ( t )
.
1
= A(t)
x 0 (t) , p (t)
(7.2.9)
Система (7.2.9) имеет порядок 2n и может быть решена с ис-пользованием начальных и граничных условий:
x0 (t |
) = x , p (t ) = Px 0 |
(t ) . |
||
0 |
0 |
1 |
1 |
t |