- •Учебное пособие
- •I. Элементы вариационного исчисления
- •1.1. Введение и вспомогательные утверждения
- •1.1.1. Пример.
- •1.1.2. Лемма Лагранжа
- •1.2. Основные понятия
- •Число обладает свойствами:
- •Величина, определенная равенством , является нормой.
- •1.2.5. Замечание.
- •1.3. Вычисление вариации интегрального функционала.
- •1.4. Простейшая вариационная задача
- •Если функционал от вектор - функции
- •1.4.3. Пример.
- •1.4.4. Пример.
- •1.5. Вариационная задача с подвижными границами.
- •1.6. Вариационные задачи на условный экстремум
- •Пусть требуется найти экстремум функционала
- •1.6.3. Пример
- •1.6.6. Пример.
- •II. Элементы оптимального управления
- •2.1. Постановка задачи оптимального управления
- •2.2. Линейная стационарная задача
- •2.2.2. Определение.
- •2.2.3. Определение.
- •2.3. Примеры синтеза оптимального управления
- •Составим сопряженную систему
- •2.3.1. Пример
- •2.3.2. Пример.
- •Сопряженная система
- •2.3.3. Пример.
- •III. Примеры решения задач.
- •3.1. Простейшие задачи вариационного исчисления
- •3.2. Задачи для самостоятельного решения
- •3.3. Варианты заданий: «Простейшие задачи вариационного
- •3.4. Задачи с подвижными границами
- •Задача 1.
- •Условие трансверсальности
- •3.5. Варианты заданий: «Задачи с подвижными границами»
- •3.6. Варианты заданий: «Задачи по оптимальному управлению»
1.6.6. Пример.

.
□
.
Уравнения Эйлера:


![]()
Определим
и
:
,
откуда
,
,откуда
.
Решение уравнений Эйлера:

Найдем постоянные

Экстремаль:
.
■
II. Элементы оптимального управления
2.1. Постановка задачи оптимального управления
Будем
рассматривать объект, состояние которого
в фиксированный момент времени описывается
набором из
чисел
.
Например, если объект есть движение
материальной точки в пространстве, то
координаты
точки; если объект – электрическая
цепь, то
напряжения
или токи в различных участках цепи, если
объект – течение химической реакции,
то
количества
различных ингредиентов, катализаторов.
Эти числа называюткоординатами
фазового состояния,
вектор
называетсяфазовым
вектором.
Состояние объекта в каждый момент
времени можно изобразить точкой
(вектором)
мерного
арифметического пространства
,
которое называетсяфазовым
пространством.
Движение
объекта
(например,
течение химической реакции) проявляется
в том, что его фазовые координаты меняются
с течением времени
,
т.е. фазовый вектор является вектор –
функцией
.
При движении объекта фазовая (т.е.
изображающая) точка
описывает в фазовом пространстве
кривую –фазовую
траекторию.
Обычно фазовые координаты являются
инерционными (меняются плавно), так что
вектор – функция
непрерывна.
Пусть
множество
представляет собой совокупность всех
фазовых состояний
,
в которых объекту разрешается находиться.
Тогда при движении объекта его состояние
в каждый момент времени
должно подчиняться условию
,
которое называется фазовым ограничением.
Предположим,
что объект находится под воздействием
управления, параметры которого в каждый
момент времени описываются набором из
чисел
(например, углы поворота рулей, мощность
двигателя; в химической реакции –
количество добавляемых или убираемых
ингредиентов, и т.д.). Этот набор чисел
составляетвектор
управления
,
его можно изобразить точкой (или вектором)
мерного
пространства
.Управление
- вектор –
функция
обычно
является кусочно-непрерывной функцией
(может иметь конечное число скачков в
моменты переключения управления).
Параметры управления не могут быть
совершенно произвольными из-за
конструктивных особенностей объекта,
ограниченности ресурсов, условий
эксплуатации объекта. Это значит, что
в пространстве
управляющих параметров выделяется
некоторое множество
,
называемоеобластью
управления.
В любой момент времени точки
должны принадлежать этому множеству:
.
|
Это
условие называется ограничением
на управление.
Кусочно–непрерывные функции управления
|
|
Чтобы
указать, как именно фазовая траектория
объекта
определяется по выбранному управлению
,
надо задатьзакон
движения объекта
(управляемой системы). Будем предполагать,
что закон движения объекта задается
системой обыкновенных дифференциальных
уравнений
(1)
где
известная
вектор – функция, непрерывная как
функция
переменных и имеющая непрерывные частные
производные по фазовым переменным
.
При
фиксированном допустимом управлении
система (1) превращается внормальную
систему обыкновенных дифференциальных
уравнений
с
неизвестными функциями
.
Её решение
называетсяфазовой
траекторией, соответствующей выбранному
управлению
.
Говорят,
что управление
,
определенное на отрезке времени
,переводит
объект (1) из фазового состояния
в фазовое
состояние
,
если соответствующая этому управлению
фазовая траектория – решение системы
(1) с начальным условием
удовлетворяет фазовому ограничению
и в момент времени
попадает в фазовое состояние
.
Таким образом,задача
управления
состоит в том, чтобы найти какое–нибудь
допустимое управление
(кусочно – непрерывную функцию из
области управления
),
чтобы задача (1) с краевыми условиями
,
,
т.е. задача
,
,
(2)
имела
решение
,
удовлетворяющее фазовому ограничению
.
Если
эта задача имеет решение при любых
краевых условиях (т.е. всегда найдется
допустимое управление
,
переводящее объект (1) из любого состояния
в любое другое состояние
),
то говорят, чтосистема
(2)
управляема.
Если
система (2) управляема, то обычно она
имеет бесконечно множество решений:
имеется бесконечно множество допустимых
управлений, переводящих объект (1) из
фазового состояния
в фазовое состояние
по различным траекториям
.
Поэтому ставится задача оптимального
выбора: среди допустимых управлений,
решающих задачу (2), выбрать такое, при
котором управляемый процесс будет
наилучшим в каком – либо смысле. Другими
словами, если качество процесса
оценивается некоторой числовой
характеристикой (себестоимость, время
процесса и т.п.), то задача заключается
в том, чтобы выбором подходящего
управления обеспечить максимальное
или минимальное значение этой числовой
характеристики. Такую числовую
характеристику называюткритерием
качества.
Значение критерия качества определяется
фазовой траекторией
и управлением
:
это – число, зависящее от функций
,
,
т.е. функционал
.
Задача
оптимального управления
состоит в отыскании управления
,
обеспечивающего экстремум этого
функционала:
,
,
,
.
Управление
,
обеспечивающее экстремум критерия
качества
,
называется оптимальным
управлением,
а соответствующая этому уравнению
фазовая траектория
оптимальной
траекторией.
Наиболее широко используется интегральные критерии качества – функционалы вида
,
где
имеет такие же свойства, как и
(в смысле непрерывности и дифференцируемости).

