
- •Часть I Методы теории оптимизации динамических систем Введение.
- •§ 1. Постановка задачи оптимального управления.
- •§2. Классификация задач оптимального управления.
- •Глава I. Решение задачи оптимального управления на основе вариационного исчисления и метода множителей лагранжа. §1.1. Метод множителей Лагранжа.
- •§ 1.2. Уравнение Эйлера-Лагранжа.
- •§1.3. Решения задачи оптимального управления при наличии интегральных ограничений.
- •Глава II. Принцип максимума
- •§2.1. Задача с закрепленными концами и фиксированным временем.
- •§2.2. Задача с подвижными концами и нефиксированным временем.
- •§ 2.3. Задача быстродействия для траектории с закреплёнными концами.
- •Глава III. Метод динамического программирования §3.1. Принцип оптимальности Беллмана
- •§3.2. Решение дискретных задач оптимизации
- •§3.3. Необходимые условия оптимальности для непрерывных систем
- •Часть II Адаптивные системы автоматического управления. Глава I: Основные понятия адаптивных систем управления. § 1. Определение адаптивной системы управления. Функциональная блок-схема системы.
- •§2. Классификация и способы реализации структур адаптивных систем управления.
- •§3. Вычислительные аспекты алгоритма адаптации.
- •Глава II: Варианты построения адаптивных систем. §4. Адаптивная система с определением градиента методом вспомогательного оператора, содержащая настраиваемую модель (идентификационного типа).
- •§5. Адаптивная система управления с эталонной моделью.
- •§ 6 Адаптивная система управления с неявной эталонной моделью.
- •§ 7. Самонастраивающиеся системы со стабилизацией качества управления.
- •§ 8. Адаптивная система с нечетким регулятором.
- •§9. Экстремальные системы управления.
- •§10 Аналитическая самонастраивающаяся система по внешним воздействиям.
- •Литература
- •Контрольные вопросы
§1.3. Решения задачи оптимального управления при наличии интегральных ограничений.
В настоящем разделе рассматривается решение ЗОУ на основе вариационного метода при наличии интегральных ограничений [6]. В этой задаче минимизируется функционал:
(1.32)
Исходные данные и ограничения имеют следующий вид:
; (1.33)
; (1.34)
; (1.35)
Здесь
- функция
переменных;
- функция
переменных;
- вектор-функция
переменных.
Ограничение (1.33) называется дифференциальной
связью. Четверка
называется управляемым процессом, если
,
,
и всюду при
выполняется дифференциальная связь
(1.33) и допустимым управляемым процессом,
если эта четверка является управляемым
процессом и, кроме того, выполнены
ограничения (1.34) и (1.35). Допустимый
управляемый процесс
называется локальным минимумом в задаче
(1.32), если существует такое
,
что для любого допустимого управляемого
процесса
,
удовлетворяющего условию
,
выполняется неравенство
.
В приведенной постановке задачи
оптимального управления в отличие от
рассмотренный ранее присутствуют
ограничения (1.35) в виде равенств,
называемые изопериметрическими, и
ограничения (1.34) в виде неравенств. Форма
задания ограничений является достаточно
общей и может включать в себя как
ограничения на вид траектории движения
объекта и управляющего воздействия,
представленные функцией
,
так и краевые условия
и
,
которые можно записать в форме (1.35):
;
Рассматриваемая задача содержит
ограничения в форме (1.33), (1.34), (1.35), и
поэтому является задачей на условный
экстремум функционала. Для перехода к
задаче на безусловный экстремум формируем
лагранжиан и новый критерий оптимизации
,
относительного которого ЗОУ решается
как задача на безусловный экстремум.
(1.36)
Необходимые условия для решения поставленной задачи сформулированы в следующей теореме [6].
Теорема 1.5.
Пусть
- оптимальный процесс в задаче и при
этом функции
,
,
и их частные производные по
и
непрерывны в некоторой окрестности
множества
,
а
,
непрерывно дифференцируемы в окрестности
точки
(условие гладкости).
Тогда обязательно существуют множители
Лагранжа
,
и
не равные одновременно нулю и такие,
что для функции Лагранжа
и лагранжиана
выполняются условия:
а) стационарности по - уравнение Эйлера:
;
(1.37)
б) трансверсальности по :
,
;
(1.38)
в) стационарности по :
;
(1.39)
г) стационарности по
:
;
(1.40)
д) дополняющей нежесткости:
,
; (1.41)
е) неотрицательности:
,
.
(1.42)
Доказательство теоремы приведено в [6],[2].
Набор условий теоремы для нахождения
оптимального процесса является полным.
Для определения неизвестных функций
,
и
имеется система из дифференциальных
уравнений из (1.34), (1.37) и (1.40). Выразим
через
и
и получим
скалярных дифференциальных уравнений.
Решение системы зависит от 2n
произвольных постоянных и еще множители
,
.
Кроме того, решение задачи требует
определения
и
.
Следовательно, всего неизвестных
.
Для их определения имеется 2
условий трансверсальности,
условий дополняющей нежесткости и
заданных ограничений (1.35) и два условия
стационарности по
.
Для задач с закрепленными концами
и
,
условия трансверсальности тоже можно
написать, если принять
,
и
,
, и эти условия можно рассматривать как
соотношение (1.35) в постановке задачи
оптимизации. В этом случае условия
трансверсальности имеют вид [8]:
,
(1.43)
,
(1.44)
Соотношения (1.43) и (1.44) не содержат граничные условия, и поэтому условия на концах траектории можно использовать при решении оптимизационной задачи самостоятельно.
Пример
Требуется определить оптимальное
управление
в задаче, имеющей следующие исходные
данные:
,
,
,
Критерий оптимизации
Решение
Сделаем замену переменных
и
,
чтобы представить описание объекта в
переменных состояния:
,
,
,
,
.
Составим лагранжиан и критерий оптимизации :
;
Запишем необходимые условия экстремума:
а) система уравнений Эйлера для лагранжиана :
,
,
;
б) условия трансверсальности по для терминанта:
;
,
,
,
;
в) условия стационарности по управлению
.
Для решения задачи необходимо определить
значение
.
Если принять
,
то из в) следует, что
,
тогда из а) имеем
и в силу условия б) получаем
,
т.е. все множители Лагранжа равны нулю,
что противоречит условию теоремы о
необходимом условии экстремума. Положим
.
Из системы уравнений Эйлера вытекает,
что
Общее решение этого дифференциального уравнения
.
Поскольку
,
то
и по условию стационарности по управлению
.
Тогда дифференциальное уравнение связи
и его решение имеет вид:
;
.
Неизвестные константы
определяются из заданных условий на
концах:
;
;
;
Следовательно, оптимальная траектория
;
Подставим
в уравнение связи и получим функцию
оптимального управления
:
;
Итак, мы нашли оптимальную пару
.
Можно показать с помощью непосредственной
проверки, что найденный экстремум
является абсолютным минимумом.