
- •Раздел 2. Линейные задачи оптимального управления
- •Раздел 2. Линейные задачи оптимального управления
- •§1. Постановка задачи
- •§2. Области достижимости и управляемости
- •§3. Существование оптимальных управлений
- •§4. Экстремальные управления
- •§5. Принцип максимума для линейных задач оптимального управления
- •§6. Структура оптимального управления
- •§7. Вычисление оптимального управления
- •§8. Примеры решения линейных задач оптимального управления с применением принципа максимума
- •Вопросы для самопроверки
§7. Вычисление оптимального управления
Перечислим те предпосылки, которые позволяют приступить к поиску оптимального управления в линейной автономной задаче на быстродействие в начало координат:
a) вполне управляемость системы (2.7), для чего должно быть: 0int U, матрица А устойчива или выполнено условие общности положения (теорема 2.3);
b) существование оптимального управления, для чего должно быть: U – компакт (в частности, многогранник), 0int U, матрица А устойчива (теорема 2.5);
c) единственность оптимального управления, для чего должно быть: U – многогранник, 0int U, выполнено условие общности положения, матрица А устойчива (следствие теоремы 2.4);
d) предпосылки, при которых принцип максимума является необходимым и достаточным условием оптимальности: U – многогранник, 0int U и выполнено условие общности положения (теорема 2.8).
Синтезируя перечисленные условия, видим, чтобы имели место все эти положения, нужно выполнение следующих условий:
матрица А устойчива;
U – компактный многогранник, причем
условие общности положения.
Будем считать эти условия выполненными. Тогда для каждого нетривиального решения сопряженной системы принцип максимума однозначно определяет допустимое управление и в результате, благодаря положению c), однозначно определяется оптимальное управление, которое является кусочно-постоянной функцией с конечным числом переключений. Причем в интервалах постоянства его значениями являются вершины многогранника U (см. теоремы 2.9, 2.10, 2.11).
Итак, если для конкретной задачи мы уверены в справедливости положений a)-d), т.е. в выполнении условий 1)-3), то для вычисления оптимального управления можно сперва найти все экстремальные управления, переводящие фазовую точку из x 0 в начало координат, а затем выбрать из них то единственное управление, которое осуществляет этот переход за кратчайшее время.
Перечислим все этапы этой процедуры:
Этап I. Найти решение сопряженной системы (2.11) при произвольном начальном значении (2.12).
Этап II. Для найденного нетривиального решения (t) найти управление , удовлетворяющее принципу максимума (2.17) или (2.19) (экстремальное управление).
Этап III. Зная управление , найти соответствующую траекторию системы (2.7), исходящую из начального состояния x0.
Этап IV. Найти начальное условие 0 сопряженной системы, при котором соответствующая траектория приходит в начало координат.
Раскроем кратко содержание этих этапов.
Решение этапа I дается классическими теоремами для линейных дифференциальных уравнений с постоянными коэффициентами (см. (2.13')). Существуют также хорошо разработанные приближенные методы.
На этапе II, как следует из принципа максимума Понтрягина, решается оптимизационная задача максимизации линейной по u функции
на
многограннике
U
при известной по результату этапа I
функции
(t).
Сложность этой задачи зависит от задания
(вида) многогранника
U.
В общем случае это пересечение
полуплоскостей вида
,
k = 1, ..., r.
В более
простом случае, когда
U
является параллелепипедом
aj uj bj,
j = 1, ..., m,
область изменения каждого
uj
не зависит от остальных и поэтому для
того, чтобы функция
принимала максимальное значение, необходимо, чтобы каждое слагаемое
, (2.22)
принимало максимальное значение по uj (так как область изменения каждой uj не зависит от остальных). Следовательно, из принципа максимума имеем:
Это и есть соотношение (2.17) для оптимального управления, которое выполняется для любого t[0,T], кроме конечного числа моментов времени (когда j(t) = 0).
Вообще, структура оптимального управления определяется согласно теорем 2.9, 2.10, 2.11. При m = 1, 2 максимум функций (2.19) определяется визуально.
Этап III сводится к решению системы (2.7) с заданным начальным условием и известной из этапа II функцией . Это опять классическая, хорошо известная задача из области обыкновенных дифференциальных уравнений, представляющая собой неоднородную линейную систему дифференциальных уравнений с постоянными коэффициентами (см. формулу (2.8)).
Итак, по результатам
этапов I-III
мы, выбрав произвольное начальное
значение 0,
однозначно определили
,
и
.
Т.е. в силу принципа максимума траектория
однозначно определяется выбором
0.
Ясно, что, выбрав наудачу
0,
мы имеем мало шансов попасть в начало
координат (т.е. что соответствующая
траектория
придет в
точку
).
Если удается найти именно такое 0, когда соответствующая траектория приходит в начало координат, то по теореме 2.8 соответствующее управление и будет оптимальным по быстродействию. Ибо, если траектория ведет в начало координат, то принцип максимума является достаточным условием оптимальности.
Теоретическим обоснованием решения этапа IV являются теоремы существования и единственности (см. теорему 2.4). Они утверждают, что для заданной начальной точки x 0 возможно подобрать требуемое начальное значение 0.
Точных методов
решения этапа IV
не существует. Однако существуют
достаточно удобные приближенные методы.
Идея такова: взяв произвольное значение
0,
последовательно "улучшают" его;
если при этом последовательность
сходится к требуемому начальному
значению
,
то последнее и считается решением этапа
IV.
При этом "отклонение" от начала
координат
должно
быть практически приемлемым.
Замечание.
В результате применения принципа
максимума мы определяем оптимальное
управление как функцию времени
t.
Недостаток этого результата заключается
в том, что для разных начальных состояний
x0 R n
весь процесс расчета (этапы I-IV)
приходится переделывать заново. Ибо
управление
,
оптимальное в состоянии
x 0,
вообще говоря, неоптимально в состоянии
x x 0.
Поэтому значительно более удобным
является решение задачи оптимального
управления в форме синтеза, когда
u = u(x, t).
В этом случае оптимальное синтезирующее
управление
пригодно для любого начального состояния
x 0 R n.
К этому вопросу мы вернемся в Разделе
4.