
- •12. Оптимальное управление
- •12.1 Введение
- •12.2. Цели управления и критерии оптимизации
- •12.3. Синтез оптимальных систем управления с помощью вариационного исчисления
- •12.4. Синтез оптимальных систем с помощью принципа максимума
- •12.4.1. Общие положения
- •12.4.2 Последовательность решения задач с помощью принципа максимума
- •1) При любом в интервале функция , рассматриваемая как функция переменного , , достигала в точке максимума ;
- •12.4.3. Связь принципа максимума с уравнением Эйлера
- •12.4.4. Пример применения метода Понтрягина.
- •12.5. Динамическое программирование - метод решения задач оптимального управления
- •12.5.1 Общие сведения
- •12.5.2. Принцип оптимальности Беллмана
- •12.5.3 Уравнение Беллмана
- •12.5.4. Пример применения уравнения Беллмана
- •12.5.5. Дискретный вариант мдп
12.4. Синтез оптимальных систем с помощью принципа максимума
12.4.1. Общие положения
Использование вариационного исчисления становится невозможным, когда управление или координаты объекта управления имеют нелинейные характеристики, что весьма характерно для большинства практических задач оптимального управления.
Введение в синтез таких ограничений приводит к нарушению условий, необходимых для использования функционала и его вариаций, которые должны быть непрерывными.
В качестве метода, допускающего любые ограничения к вектору управления или к вектору координат объекта управления, пришел метод, разработанный группой советских ученых, и который получил имя принципа максимума или принцип Л.С. Понтрягина.
Метод справедлив для систем управления, поведение которых может быть описано системой уравнений первого порядка:
где
-
координата объекта управления;
-
вектор управления;
-
вектор управления.
Известно,
что начальное состояние
и
конечное состояние
системы,
то-есть.,
Кроме того, дано, что вектор управления
,
который может переместить систему из
положения
в положение
,
принадлежит к некоторой закрытой области
:
Ставится
задача определить управление,
принадлежащее области
,
которое
может
перевести систему из состояния
в состояние
и доставить экстремальное значение
функционалу
extremum.
Чтобы
решить поставленную проблему, вводим
прежде всего вспомогательную переменнуюв
систему уравнений, представляющих
систему управления: :
Заметим,
что координатасоответствует
текущему значению функционала
и
что
que
Тогда, задача сводится к решению системы уравнений
,
где
координата
будет иметь экстремальное значение, а
все другие координаты удовлетворяют
граничным условиям:
.
Затем,
в рассматриваемом методе вводятся
вспомогательные переменные:
, образующие вспомогательный вектор
такой, что
Вводится
также функция Гамильтона,
такая что
Функция
называется
также функцией Понтрягина. Очевидно,
что
Тогда,
можно объединить системы (1) и (2) в одну
систему уравнений, называемую системой
Гамильтона (система канонически
сопряженных уравнений):
12.4.2 Последовательность решения задач с помощью принципа максимума
Теорема,
доказанная Л.С.Понтрягиным:
чтобы управление было оптимальным
необходимо, чтобы существовала непрерывная
и ненулевая вектор-функция
такая, что
1) При любом в интервале функция , рассматриваемая как функция переменного , , достигала в точке максимума ;
2)
при
выполнялись бы следующие соотношения:
Особенностью
принципа максимума является то, что
вариационная задача нахождения функции
, экстремизирующей функционал
,
заменена более простой задачей
математического анализа нахождения
значения
,
доставляющего максимум вспомогательной
функции
.
Отсюда ясно и название метода- принцип
максимума.
Последовательность решения задач оптимального управления с помощью принципа максимума.
Записываем уравнения объекта управления в виде системы уравнений первого порядка, добавляя уравнение для производной функционала
Замечание:
в рамках метода принципа максимума
доказано, что, если экстремизируемый
функционал не зависит в явном виде от
вектора управления,
где
функция
под знаком интеграла-функционала
,
может не присоединяться к системе
,
так как в этом случае составляющая
не влияет на максимизацию функции
Понтрягина
В качестве дополнительной переменной
можно другие переменные, например,
,
которыми заданы ограничения.
Составляем функцию Л.С. Понтрягина:
Находим значение
, максимизирующее функцию
, используя систему уравнений:
Возможно,
что максимум
будет достигаться на границе допустимой
области управлений. Тогда для некоторых
предыдущее равенство может не выполняться
при ненулевой
.
Составляем уравнения для определения
:
Решаем совместно выше написанные уравнения вместе с уравнениями по п.1 и находим оптимальное управление