
- •Раздел 2. Линейные задачи оптимального управления
- •Раздел 2. Линейные задачи оптимального управления
- •§1. Постановка задачи
- •§2. Области достижимости и управляемости
- •§3. Существование оптимальных управлений
- •§4. Экстремальные управления
- •§5. Принцип максимума для линейных задач оптимального управления
- •§6. Структура оптимального управления
- •§7. Вычисление оптимального управления
- •§8. Примеры решения линейных задач оптимального управления с применением принципа максимума
- •Вопросы для самопроверки
§2. Области достижимости и управляемости
Определение 2.1.
Совокупность всех точек пространства
Rn,
в каждую
из которых может быть приведена система
(2.1) из начального состояния (2.2) в момент
времени
T
с помощью допустимого управления
,
называется множеством
достижимости
и обозначается K(T) = K(0, x0, T) =
=
.
Другими словами, K(T) – это множество концов всех допустимых траекторий системы (2.1)-(2.2). Будем полагать для удобства K(0) = x0. Геометрия множества достижимости не зависит от начальной точки.
Теорема 2.1. Пусть в задаче (2.1)-(2.5) множество U – выпуклый компакт. Тогда множество достижимости K(T) является компактным, выпуклым и непрерывно зависит от T 0.
(Заметим, что выпуклость U нужна только для доказательства выпуклости K(T)).
Доказательство.
Сначала докажем компактность K(T)
в Rn.
Для этого покажем, что из любой
последовательности точек
в K(T)
можно выделить подпоследовательность,
сходящуюся к некоторой (предельной)
точке
.
Пусть
и
(
)
– траектория и управление, приводящие
систему в точку
(
):
.
Из компактности
следует существование в каждый момент
подпоследовательности
,
сходящейся к некоторому пределу
,
так что
.
Пусть
– траектория, порожденная допустимым
управлением
.
Тогда
и, следовательно,
.
Компактность K(T) доказана.
Пусть
,
а
и
– приводящие систему в эти точки
процессы. Для любого
управление
является допустимым, что следует из
выпуклости U.
Управление
порождает траекторию
,
которая в любой момент
удовлетворяет условию
.
Отсюда
,
так как траектория
порождена допустимым управлением
.
Ввиду произвольности
,
,
выпуклость K(T)
доказана.
Перейдем
к доказательству непрерывности K(T).
Пусть
– компактные множества. Для произвольной
точки
полагаем
,
где
– евклидово расстояние. Далее полагаем
.
Точно так же,
.
Под
расстоянием между двумя множествами A
и B
будем понимать число
.
Для
доказательства непрерывности отображения
мы должны показать, что для любого
найдется такое
,
что
,
как только
,
где
,
,
.
Начнем
с частного случая, положив
,
т.е. покажем справедливость неравенства
,
как только
.
Для любого
и произвольной точки
.
Поэтому
.
Матрицы
и
,
как непрерывные функции на отрезке
,
являются ограниченными,
и
также ограничены, интеграл является
непрерывной функцией переменного
верхнего предела, поэтому для заданного
и достаточно малого
справедливы оценки
,
.
Таким образом, для верно неравенство
и поэтому
.
Аналогично
можно показать, что
,
как только
для
.
Последнее предлагается выполнить
читателю самостоятельно в качестве
упражнения. Теорема доказана.
Множество достижимости обладает следующими свойствами:
для компактных U и U 0, таких что
и
, соответствующие им множества достижимости
и
компактны, выпуклы и равны между собой (здесь
– выпуклая оболочка U);
если U – граница U, то
(где
– множество достижимости, соответствующее множеству U); если
– множество вершин выпуклого многогранника U, то
.
Далее рассмотрим линейную систему (2.7), когда целью управления является начало координат.
Допустим, что
управление
реализует цель управления (решает задачу
управления), т.е. для некоторого
Поэтому задача управления сводится к
нахождению такого числа
T > 0
и управления
uU,
чтобы
(2.10)
(см.
(2.8)). Данное
уравнение разрешимо (относительно
T
и
),
вообще говоря, не для всех точек
x0.
Поэтому важно изучить множество тех
начальных состояний системы, для которых
это уравнение разрешимо.
Определение 2.2. Множество тех точек в Rn, из которых система (2.7) может быть переведена в начало координат за конечный промежуток времени с помощью допустимых управлений , называется областью 0-управляемости.
Область 0-управляемости для фиксированного времени T обозначим GT.
Теорема 2.2. Пусть при любом фиксированном T > 0 область GT . Тогда она является ограниченным, замкнутым, выпуклым множеством в Rn. Причем начало координат является внутренней точкой GT и, если T < T', то GT int GT '.
Из теоремы 2.2 следует, что с ростом T область GT расширяется (рис. 2.2). Поэтому представляет интерес объединение всех областей 0-управляемости:
которое называется областью управляемости для системы (2.7) и представляет собой открытое выпуклое множество в Rn. Из начального состояния, не принадлежащего множеству G, объект (2.7) нельзя перевести в начало координат никаким допустимым управлением. Другими словами, уравнение (2.10) разрешимо (относительно T и ) тогда и только тогда, когда x0G.
Эффективных методов построения области управляемости нет. Однако можно указать условие, когда G совпадает со всем фазовым пространством Rn.
Теорема 2.3. Если в (2.7) 0 int U и все собственные значения матрицы А имеют отрицательные действительные части, т.е. матрица А устойчива, то G Rn.
В случае
G Rn
говорят, что система (2.7) вполне
управляема.
Тогда для любой пары точек
x0
и
x1
из
Rn
существует допустимое управление
,
которое за некоторое время
T
переводит систему (2.7) из x0
в
x1
(в частности,
x
1 = 0).
Перечислим некоторые свойства области управляемости (рис. 2.2):
a) из любой внутренней точки множества GT в начало координат можно попасть за время, строго меньшее T, а из любой граничной точки множества GT – за время, в точности равное T, и нельзя попасть быстрее;
b) если 0 int U, система (2.7) будет вполне управляемой тогда и только тогда, когда выполнено условие общности положения (2.9).