
- •Раздел 2. Линейные задачи оптимального управления
- •Раздел 2. Линейные задачи оптимального управления
- •§1. Постановка задачи
- •§2. Области достижимости и управляемости
- •§3. Существование оптимальных управлений
- •§4. Экстремальные управления
- •§5. Принцип максимума для линейных задач оптимального управления
- •§6. Структура оптимального управления
- •§7. Вычисление оптимального управления
- •§8. Примеры решения линейных задач оптимального управления с применением принципа максимума
- •Вопросы для самопроверки
§4. Экстремальные управления
Рассмотрим неавтономную задачу (2.1)-(2.5).
Пусть = (t)Rn – произвольный вектор. Составим систему
(2.11)
(где
T
–
знак
транспонирования),
которая
называется сопряженной
системой к
.
Если задаться начальным условием
(0) = 0, (2.12)
то каждое решение системы (2.11)-(2.12) имеет вид
(t) = Ф–1(t)0, (2.13)
где Ф(t) – фундаментальная матрица решений системы такая, что Ф(0) = Е. Если A(t) = A, то
(t) = e –At 0. (2.13')
Система (2.11) имеет одно тривиальное решение (t) 0 и бесконечное множество нетривиальных решений (t) 0, каждое из которых определено на – < t < + . Для получения конкретного нетривиального решения нужно задаться каким-либо начальным условием (2.12).
Определение 2.3.
Пусть
– траектория системы (2.1)-(2.2), соответствующая
допустимому управлению
.
Если ее конечная точка х(Т)
лежит на границе
множества достижимости
K(T),
то управление
называется экстремальным.
Теорема
2.6.
Пусть в задаче (2.1)-(2.5) множество U
компактно. Управление
будет экстремальным тогда и только
тогда, когда существует нетривиальное
решение
(t)
сопряженной системы (2.11)-(2.12),
удовлетворяющее
условию
(2.14)
для почти всех t[0,T].
Доказательство.
Необходимость.
Предположим, что
–
экстремальное управление, и, следовательно,
.
Так как
K(T)
– выпуклый компакт (см. теорему 2.1), то
существует в точке
опорная гиперплоскость
.
Пусть
– внешняя нормаль
в точке
.
Сопряженную систему (2.11)-(2.12) построим
таким образом, чтобы ее решение
(t) = Ф–1(t)0
в момент T удовлетворяло условию (T) = Ф–1(T)0 = (посредством выбора 0) (см. рис. 2.4).
Для нетривиального решения (t) вычислим скалярное произведение:
Предположим, что для (2.14) не выполнено, т.е.
Построим
управление
Так как U компактно, такое управление существует. Тогда для соответствующей траектории будем иметь:
Согласно нашего предположения
(2.15)
и поэтому
,
т.е.
(2.16)
По
определению опорной гиперплоскости
(2.16) означает,
что точка
отделена от
K(T)
гиперплоскостью
.
А это невозможно, так как
Следовательно, наше предположение
неверно и (2.14) выполнено.
Достаточность.
Предположим, что для некоторого
нетривиального решения (t)
выполнено
(2.14). Надо доказать, что
,
т.е.
– экстремальное управление. Докажем
от противного, т.е. предположим, что
Тогда
найдется точка
(лежащая "ближе"
к
,
чем
)
такая, что
Для управления
,
согласно условия достаточности (т.е.
(2.14))
Отсюда, как и выше (см (2.15) и (2.16)), найдем
Полученное противоречие доказывает теорему.
Содержательно теорема 2.6 означает, что если траектория приводит систему в граничную точку множества достижимости K(T), то движение в этом направлении происходит с максимальной скоростью. Действительно, по теореме 2.6
а максимум скалярного произведения векторов (T) и достигается, если направление вектора совпадает с направлением вектора (T).
Следствие.
В условиях теоремы
2.6 на каждом
отрезке времени [0,T'],
T' < T,
управление
также будет экстремальным управлением
и
.
Далее,
соответствующее равенству (2.14)
нетривиальное решение
(T')
является внешней нормалью к опорной
гиперплоскости для
K(T')
в точке
Докажите это следствие самостоятельно.
В теореме 2.6 речь не идет об оптимальных (по быстродействию) управлениях. Здесь говорится, что экстремальность управления и равенство (2.14) являются взаимно необходимыми и достаточными условиями.
Как будет видно из следующего параграфа, оптимальное управление находится среди экстремальных управлений.
Выполнение равенства
(2.14) для "почти всех"
t
[0,T]
означает, что
(т.е.
является
одной из точек максимума) для всех
t
[0,T]
и
(т.е. является единственной точкой максимума) для любого t [0,T], кроме конечного числа моментов времени.