
- •II. Элементы оптимального управления
- •2.1. Постановка задачи оптимального управления
- •2.2. Линейная стационарная задача оптимального
- •2.3. О возможности решения задач оптимального
- •2.4. Принцип максимума Понтрягина в линейной
- •2.5. Быстрейшая остановка движущейся точки в заданном месте
- •2.5.1. Сведение задачи (1) к нормальной линейной системе
- •2.5.2. Нахождение оптимального управления и оптимальных траекторий без краевых условий. Линия переключения.
- •2.6. Приведение маятника в верхнее положение равновесия
- •2.6.1. Сведение задачи (1) к нормальной линейной системе дифференциальных уравнений
- •2.6.2. Нахождение оптимального управления и оптимальных траекторий без краевых условий. Линия переключения Сопряженная система
- •2.6.3. Синтез оптимальной траектории
- •Контрольные вопросы
II. Элементы оптимального управления
2.1. Постановка задачи оптимального управления
Будем
рассматривать объект, состояние которого
в фиксированный момент времени описывается
набором из
чисел
.
Например, если объект есть движение
материальной точки в пространстве, то
координаты
точки; если объект – электрическая
цепь, то
напряжения
или токи в различных участках цепи, если
объект – течение химической реакции,
то
количества
различных ингредиентов, катализаторов.
Эти числа называют координатами
фазового состояния,
вектор
называется фазовым
вектором.
Состояние объекта в каждый момент
времени можно изобразить точкой
(вектором)
-мерного
арифметического пространства
,
которое называется фазовым
пространством.
Движение
объекта
(например,
течение химической реакции) проявляется
в том, что его фазовые координаты меняются
с течением времени
,
т.е. фазовый вектор является вектор-функцией
.
При движении объекта фазовая (т.е.
изображающая) точка
описывает в фазовом пространстве
кривую – фазовую
траекторию.
Обычно фазовые координаты являются
инерционными (меняются плавно), так что
вектор-функция
непрерывна.
Пусть
множество
представляет собой совокупность всех
фазовых состояний
,
в которых объекту разрешается находиться.
Тогда при движении объекта его состояние
в каждый момент времени
должно подчиняться условию
,
которое называется фазовым ограничением.
Предположим,
что объект находится под воздействием
управления, параметры которого в каждый
момент времени описываются набором из
чисел
(например, углы поворота рулей, мощность
двигателя; в химической реакции –
количество добавляемых или убираемых
ингредиентов, и т.д.). Этот набор чисел
составляет вектор
управления
,
его можно изобразить точкой (или вектором)
-мерного
пространства
.
Управление
– вектор-функция
обычно является кусочно-непрерывной
функцией (может иметь конечное число
скачков в моменты переключения
управления). Параметры управления не
могут быть совершенно произвольными
из-за конструктивных особенностей
объекта, ограниченности ресурсов,
условий эксплуатации объекта. Это
значит, что в пространстве
управляющих параметров выделяется
некоторое множество
,
называемое областью
управления.
В любой момент времени точки
должны принадлежать этому множеству:
.
Это условие называется ограничением на управление. Кусочно-непрерывные функции управления , значения которых попадают в область управления, называется допустимыми управлениями. В дальнейшем имеем в виду допустимые управления. |
|
Чтобы указать, как именно фазовая траектория объекта определяется по выбранному управлению , надо задать закон движения объекта (управляемой системы). Будем предполагать, что закон движения объекта задается системой обыкновенных дифференциальных уравнений
(1)
где
известная
вектор – функция, непрерывная как
функция
переменных и имеющая непрерывные частные
производные по фазовым переменным
.
При
фиксированном допустимом управлении
система (1) превращается в нормальную
систему обыкновенных дифференциальных
уравнений
с
неизвестными функциями
.
Её решение
называется фазовой
траекторией, соответствующей выбранному
управлению
.
Говорят,
что управление
,
определенное на отрезке времени
,
переводит
объект из фазового состояния
в фазовое
состояние
,
если соответствующая этому управлению
фазовая траектория – решение системы
(1) с начальным условием
удовлетворяет фазовому ограничению
и в момент времени
попадает в фазовое состояние
.
Таким образом, задача
управления
состоит в том, чтобы найти какое-нибудь
допустимое управление
(кусочно-непрерывную функцию из области
управления
),
чтобы задача (1) с краевыми условиями
,
,
т.е. задача
,
,
(2)
имела
решение
,
удовлетворяющее фазовому ограничению
.
Если
эта задача имеет решение при любых
краевых условиях (т.е. всегда найдется
допустимое управление
,
переводящее объект (1) из любого состояния
в любое другое состояние
),
то говорят, что система
(2)
управляема.
Если
система (2) управляема, то обычно она
имеет бесконечное множество решений:
имеется бесконечно множество допустимых
управлений, переводящих объект (1) из
фазового состояния
в фазовое состояние
по различным траекториям
.
Поэтому ставится задача оптимального
выбора: среди допустимых управлений,
решающих задачу (2), выбрать такое, при
котором управляемый процесс будет
наилучшим в каком-либо смысле. Другими
словами, если качество процесса
оценивается некоторой числовой
характеристикой (себестоимость, время
процесса и т.п.), то задача заключается
в том, чтобы выбором подходящего
управления обеспечить максимальное
или минимальное значение этой числовой
характеристики. Такую числовую
характеристику называют критерием
качества.
Значение критерия качества определяется
фазовой траекторией
и управлением
:
это – число, зависящее от функций
,
,
т.е. функционал
.
Задача оптимального управления состоит в отыскании управления , обеспечивающего экстремум этого функционала:
,
,
,
.
Управление
,
обеспечивающее экстремум критерия
качества
,
называется оптимальным
управлением,
а соответствующая этому уравнению
фазовая траектория
оптимальной
траекторией.
Наиболее широко используется интегральные критерии качества – функционалы вида
,
где
имеет такие же свойства, как и
(в смысле непрерывности и дифференцируемости).
Мы рассмотрим только одну задачу оптимального управления – линейную стационарную задачу оптимального быстродействия.