- •Часть I Методы теории оптимизации динамических систем Введение.
- •§ 1. Постановка задачи оптимального управления.
- •§2. Классификация задач оптимального управления.
- •Глава I. Решение задачи оптимального управления на основе вариационного исчисления и метода множителей лагранжа. §1.1. Метод множителей Лагранжа.
- •§ 1.2. Уравнение Эйлера-Лагранжа.
- •§1.3. Решения задачи оптимального управления при наличии интегральных ограничений.
- •Глава II. Принцип максимума
- •§2.1. Задача с закрепленными концами и фиксированным временем.
- •§2.2. Задача с подвижными концами и нефиксированным временем.
- •§ 2.3. Задача быстродействия для траектории с закреплёнными концами.
- •Глава III. Метод динамического программирования §3.1. Принцип оптимальности Беллмана
- •§3.2. Решение дискретных задач оптимизации
- •§3.3. Необходимые условия оптимальности для непрерывных систем
- •Часть II Адаптивные системы автоматического управления. Глава I: Основные понятия адаптивных систем управления. § 1. Определение адаптивной системы управления. Функциональная блок-схема системы.
- •§2. Классификация и способы реализации структур адаптивных систем управления.
- •§3. Вычислительные аспекты алгоритма адаптации.
- •Глава II: Варианты построения адаптивных систем. §4. Адаптивная система с определением градиента методом вспомогательного оператора, содержащая настраиваемую модель (идентификационного типа).
- •§5. Адаптивная система управления с эталонной моделью.
- •§ 6 Адаптивная система управления с неявной эталонной моделью.
- •§ 7. Самонастраивающиеся системы со стабилизацией качества управления.
- •§ 8. Адаптивная система с нечетким регулятором.
- •§9. Экстремальные системы управления.
- •§10 Аналитическая самонастраивающаяся система по внешним воздействиям.
- •Литература
- •Контрольные вопросы
Глава II. Принцип максимума
Принцип максимума был разработан
академиком Понтрягиным Л.С. и его
учениками и впервые опубликован в 1956
году. Открытие этого принципа явилось
итогом работ авторов по решению задач
оптимального управления в вариационной
постановке применительно к реальным
объектам управления при ограниченных
возможностях управляющих воздействий.
Так, при решении задачи Лагранжа
рассматриваются только непрерывные
управляющие воздействия
без ограничений на максимальное и
минимальное значение. В практических
ситуациях управляющее воздействие
всегда ограничено по модулю, а иногда
все множество допустимых значений
состоит из совокупности точек. Кроме
того, известно, что ряд оптимизационных
задач имеет решение
в виде кусочно-постоянной функции. В
разработанном методе в отличие от
вариационного метода отсутствует
условие непрерывности управляющих
воздействий (функции управления
),
что являлось обязательным при выводе
уравнений Эйлера-Лагранжа. Множество
возможных значений управления считается
произвольным топологическим пространством,
не обладающим в общем случае линейной
структурой, в реализации условий принципа
максимума. Отсутствуют требования на
существование производных по
функций
и
.
Однако при решении задач оптимального
управления эта особенность метода
восполняется необходимостью решения
вспомогательной задачи на максимум по
переменной
(принцип
максимума). Таким образом, принцип
максимума обладает более широкими
возможностями для решения практических
задач и для многих частых постановок
позволяет получить простые соотношения
для определения оптимального решения.
Тем не менее следует заметить, что
несмотря на новые возможности, которые
открывает принцип в общем случае, процесс
решения каждой задачи является
самостоятельной творческой проблемой,
решаемой в рамках той отрасли динамики,
к которой относится объект управления.
§2.1. Задача с закрепленными концами и фиксированным временем.
В начале рассмотрим условия принципа максимума для задачи с закрепленными концами. Описание объекта имеет вид:
(2.1)
Вектор управления
принимает значения из некоторой замкнутой
области
и принадлежит классу кусочно-непрерывных
функций
.
Составляющие вектора
являются непрерывными и всюду, кроме
точек разрыва допустимого управления,
имеют непрерывные производные
.
Функции
непрерывны по всем аргументам и имеют
непрерывные частные производные по
переменным состояния
.
Из всех допустимых управлений
,
переводящих объект из начального
состояния
в конечное
,
требуется найти такое управление,
которое минимизирует функционал:
(2.2)
Где
непрерывная и дифференцируемая функция.
Применяем к задаче (2.1-2.2) прием Лагранжа[2],
составляем Лагранжиан
(2.3)
Согласно исходным данным задачи выражение (2.3) для не содержит ограничения на управляющие воздействия, и в соответствии с приемом Лагранжа задача (2.1-2.2) сводится к задаче на безусловный экстремум функционала:
(2.4)
Результат решения задачи (2.4) предполагает
определение оптимальных функций
.
Возможность определения этих функций
можно представить в форме решения двух
задач, в каждой из которых определяется
экстремаль по одной переменной при
условии, что по другой переменной задача
оптимизации решена [2]. Эти задачи имеют
вид:
(2.5)
(2.6)
При решении (2.5) и (2.6) предполагается
рассматривать класс допустимых функций
в форме
.
Задача (2.5) является задачей вариационного
исчисления с закрепленными концами на
экстремум функционала. Для нее необходимое
условие экстремума – уравнение Эйлера:
(2.7)
(2.8)
Условие (2.7) называется сопряженной
системой, решение которой позволяет
определить вектор
множителей Лагранжа.
Очевидно решение второй задачи (2.6).
Оптимальное управление
,
должно удовлетворять условию
.
В методе принципа максимума вводится
скалярная функция гамильтониан
(2.9)
Введение гамильтониана
в (2.6) позволяет сформировать эту задачу
на максимум функционала при
:
(2.10)
Условием максимизации
является максимизация подынтегрального
выражения. Функция
доставляет максимум функционалу
,
если всюду
,
кроме точек разрыва
выполняется соотношение:
(2.11)
Следовательно доставляет максимум гамильтониану. Необходимое условие (2.7) и соотношение (2.11) образуют необходимое условие оптимальности исходной задачи (2.1), (2.2) и называется принципом максимума или принципом максимума Понтрягина.
Теорема(принцип максимума)
Пусть
- такое допустимое управление, что
соответствующая ему траектория
,
исходящая при
из точки
,
проходит в момент
через точку
.
Для оптимальности управления
и траектории
необходимо существование такой ненулевой
непрерывной вектор - функции
,
соответствующей функциям
и
и
,
что для любого момента времени
,
когда
является непрерывной, функция
достигает по
максимума.
Согласно теореме в формулировке принципа
максимума имеются
неизвестных функций
.
Совокупность уравнений (2.7), (2.8) и условий
(2.11) представляют столько же соотношений
для определения этих неизвестных.
Постоянные интегрирования определяются
на основании граничных условий.
Если точка
является внутренней точкой области
,
то для выполнения условия максимума
необходимо обращение в нуль
частных производных:
. (2.12)
Если же некоторые составляющие вектор
– функции
принимают граничные значения на
,
то соотношение (2.12) для них не будет
выполняться. Однако взамен появятся
условия принадлежности
этой грани. (Например,
на границе
).
Управление
является
функцией времени. В условиях практики
приреализации управления, определенного
по (2.12), возможна ситуация, когда
по
значению некоторых составляющих
-подходит
к своим граничным значениям в какой-то
момент времени
,
тогда при
-управления
принимают свои граничные значения. При
условии
оптимальное значение
при
.
Соотношения, полученные из (2.12), являются
конечными и не содержат производных от
неизвестных функций. Так как
является линейной и однородной функцией
переменных
и соотношения (2.7),(2.11) не изменяются при
умножении всех переменных на одну и ту
же постоянную величину, значение
,
которая согласно теореме является
постоянной величиной, можно задаться
произвольно. Обычно принимают
.
На основании введенной функции гамильтониана необходимое условие (2.7), (2.8) также можно представить в форме канонических уравнений:
,
(2.13)
