
- •Глава 1. Оптимизация статических объектов 6
- •Глава 2. Основы линейного программирования 22
- •Глава 3. Способы описания динамических систем 34
- •Глава 4. Применение вариационных методов для поиска
- •Глава 1. Оптимизация статических объектов
- •1.1. Понятие статических и динамических объектов
- •1.2. Задача нелинейного программирования
- •Задачи на условный экстремум, неопределенные множители Лагранжа
- •1.4. Пример применения метода неопределенных множителей Лагранжа для поиска наибольших значений функций
- •1.5. Общая постановка задачи линейного оценивания параметров
- •Глава 2. Основы линейного программирования
- •2.1. Постановка задачи
- •2.2. Основные геометрические фигуры в линейном программировании
- •Экстремальные точки
- •2.4. Основные теоремы об экстремальных точках
- •2.5. Симплексный метод решения задач линейного программирования
- •2.6. Учет ограничений типа неравенств
- •2.7. Поиск начальной экстремальной точки
- •Глава 3. Способы описания динамических систем
- •3.1. Передаточные функции
- •3.2. Описание в форме Коши
- •3.3. Управляемость, наблюдаемость, стабилизируемость, обнаруживаемость
- •3.4. Понятие фильтра и общая задача регулирования
- •Глава 4. Применение вариационных методов для поиска оптимальных управлений
- •4.1. Понятие линейного пространства
- •4.2. Функционал и его вариация
- •4.3. Вычисление вариации функционала
- •4.4. Задача Эйлера
- •4.5. Применение уравнения Эйлера для поиска оптимального закона управления
- •4.6. Уравнение Эйлера – Пуассона и его применение
- •4.8. Неопределенные множители Лагранжа в вариационном исчислении
- •Глава 5. Вариационные задачи с подвижными границами
- •5.1.Основные виды задач с подвижными границами
- •5.2. Скольжение граничных точек по заданным траекториям
- •Глава 6. Принцип максимума
- •Постановка задачи поиска оптимального управления
- •Пояснения к получению принципа максимума
- •6.3. Динамическое программирование
- •Примеры применения динамического программирования
- •Глава 7. Аналитическое конструирование регуляторов (акор)
- •7.1. Постановка задачи
- •7.2. Решение задачи акор
- •7.3. Уравнение Риккати
- •7.4. Общие свойства решения уравнения Риккати
- •7.5. Способы решения уравнения Риккати
- •7.7. Метод диагонализации
- •Глава 8. Случайные процессы в системах управления
- •8.1. Описание случайных процессов
- •8.2. Стохастические дифференциальные уравнения
- •8.3. Прогнозирование (оценивание) значений случайных величин с использованием закона распределения
- •8.4. Линейное оценивание значений случайных величин
- •Глава 9. Фильтр калмана
- •9.1. Постановка задачи
- •9.2. Основные принципы получения формул дискретного фильтра Калмана
- •9.3. Получение формул фильтра Калмана
Глава 6. Принцип максимума
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Постановка задачи поиска оптимального управления
Динамический объект описывается системой дифференциаль-
ных уравнений в форме Коши: |
|
|
|
|||||
|
dxi |
|
= f |
(x ,..., x ,u ),i =1,2,..., n . |
|
|||
|
|
|
|
|||||
|
dt |
i |
|
1 |
n |
|
|
|
|
|
|
|
|
|
|
||
Требуется перевести объект за время T |
из одного состояния в дру- |
|
||||||
гое так, чтобы функционал |
J = T∫G ( x1 ,..., xn , u )dt принял наимень- |
|
||||||
|
|
|
|
|
0 |
|
|
|
шее (или наибольшее) |
значение |
при |
соблюдении ограничений |
|
||||
| u ( t ) |≤ uM . |
|
|
|
|
|
|
Порядок получения принципа максимума состоит из следующих этапов [14]:
вводится для упрощения рассуждений дополнительная
-
переменная
x0 ( t )
такая,
что
dx0
= G (x
,..., x
,u ) = f
0
(x
,..., x
,u)
и
x (0) = 0, x
0
(T ) = J ;
dt
1
n
1
n
0
определяется понятие игольчатой вариации δ(t ) как уз-
кого прямоугольного импульса (длительностью ε ) с ма-лой площадью, большей нуля;
• управляющему воздействию u (t ) в момент времени t = τ −ε дается приращение δ(t ) , изменяющее незначи-тельно начальные условия к моменту времени τ ;
рассматривается приращение функционала δJ = δx0 (T ) (выделяется линейная часть приращения), для чего про-изводится линеаризация дифференциальных уравнений;
вводится вспомогательный числовой вектор ψ с коор-динатами ψ0 = − 1, ψ1 = ψ 2 = ... = ψn = 0 , так что вариация δJ равна скалярному произведению < ψ, x (T ) > векто-ров ψ и x(T ) с составляющими x0 , x1 ,..., xn ;
56
предлагается рассмотреть вектор ψ( t ) такой, чтобы ска-лярное произведение < ψ(t ), x (t ) > было постоянным во времени на интервале [0;T ] и равно < ψ, x (T ) > , что приводит к появлению сопряженных дифференциальных уравнений для составляющих вектора ψ( t ) ;
используется условие одинакового знака приращения функционала при достижении наименьшего (или наи-большего значения);
в итоге получается главный вывод, который и называет-ся принципом максимума, заключающийся в том, что оптимальное управление для любого достигнутого со-стояния должно искаться из условия максимума по ар-гументу u функции H =< f 0 , ψ(t ) > , где f0 – вектор с составляющими fi (x1 ,..., x n ,u ), i = 0,1, 2,..., n .