Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
TOP-2.doc
Скачиваний:
4
Добавлен:
01.04.2025
Размер:
1.02 Mб
Скачать

§7. Вычисление оптимального управления

Перечислим те предпосылки, которые позволяют приступить к поиску оптимального управления в линейной автономной задаче на быстродействие в начало координат:

a) вполне управляемость системы (2.7), для чего должно быть: 0int U, матрица А устойчива или выполнено условие общности положения (теорема 2.3);

b) существование оптимального управления, для чего должно быть: U – компакт (в частности, многогранник), 0int U, матрица А устойчива (теорема 2.5);

c) единственность оптимального управления, для чего должно быть: U – многогранник, 0int U, выполнено условие общности положения, матрица А устойчива (следствие теоремы 2.4);

d) предпосылки, при которых принцип максимума является необходимым и достаточным условием оптимальности: U – многогранник, 0int U и выполнено условие общности положения (теорема 2.8).

Синтезируя перечисленные условия, видим, чтобы имели место все эти положения, нужно выполнение следующих условий:

  1. матрица А устойчива;

  2. U – компактный многогранник, причем

  3. условие общности положения.

Будем считать эти условия выполненными. Тогда для каждого нетривиального решения сопряженной системы принцип максимума однозначно определяет допустимое управление и в результате, благодаря положению c), однозначно определяется оптимальное управление, которое является кусочно-постоянной функцией с конечным числом переключений. Причем в интервалах постоянства его значениями являются вершины многогранника U (см. теоремы 2.9, 2.10, 2.11).

Итак, если для конкретной задачи мы уверены в справедливости положений a)-d), т.е. в выполнении условий 1)-3), то для вычисления оптимального управления можно сперва найти все экстремальные управления, переводящие фазовую точку из x 0 в начало координат, а затем выбрать из них то единственное управление, которое осуществляет этот переход за кратчайшее время.

Перечислим все этапы этой процедуры:

Этап I. Найти решение сопряженной системы (2.11) при произвольном начальном значении (2.12).

Этап II. Для найденного нетривиального решения (t) найти управление , удовлетворяющее принципу максимума (2.17) или (2.19) (экстремальное управление).

Этап III. Зная управление , найти соответствующую траекторию системы (2.7), исходящую из начального состояния x0.

Этап IV. Найти начальное условие 0 сопряженной системы, при котором соответствующая траектория приходит в начало координат.

Раскроем кратко содержание этих этапов.

Решение этапа I дается классическими теоремами для линейных дифференциальных уравнений с постоянными коэффициентами (см. (2.13')). Существуют также хорошо разработанные приближенные методы.

На этапе II, как следует из принципа максимума Понтрягина, решается оптимизационная задача максимизации линейной по u функции

на многограннике U при известной по результату этапа I функции (t). Сложность этой задачи зависит от задания (вида) многогранника U. В общем случае это пересечение полуплоскостей вида , k = 1, ..., r. В более простом случае, когда U является параллелепипедом aj  uj  bj, j = 1, ..., m, область изменения каждого uj не зависит от остальных и поэтому для того, чтобы функция

принимала максимальное значение, необходимо, чтобы каждое слагаемое

, (2.22)

принимало максимальное значение по uj (так как область изменения каждой uj не зависит от остальных). Следовательно, из принципа максимума имеем:

Это и есть соотношение (2.17) для оптимального управления, которое выполняется для любого t[0,T], кроме конечного числа моментов времени (когда j(t) = 0).

Вообще, структура оптимального управления определяется согласно теорем 2.9, 2.10, 2.11. При m = 1, 2 максимум функций (2.19) определяется визуально.

Этап III сводится к решению системы (2.7) с заданным начальным условием и известной из этапа II функцией . Это опять классическая, хорошо известная задача из области обыкновенных дифференциальных уравнений, представляющая собой неоднородную линейную систему дифференциальных уравнений с постоянными коэффициентами (см. формулу (2.8)).

Итак, по результатам этапов I-III мы, выбрав произвольное начальное значение  0, однозначно определили , и . Т.е. в силу принципа максимума траектория однозначно определяется выбором  0. Ясно, что, выбрав наудачу  0, мы имеем мало шансов попасть в начало координат (т.е. что соответствующая траектория придет в точку ).

Если удается найти именно такое  0, когда соответствующая траектория приходит в начало координат, то по теореме 2.8 соответствующее управление и будет оптимальным по быстродействию. Ибо, если траектория ведет в начало координат, то принцип максимума является достаточным условием оптимальности.

Теоретическим обоснованием решения этапа IV являются теоремы существования и единственности (см. теорему 2.4). Они утверждают, что для заданной начальной точки x 0 возможно подобрать требуемое начальное значение  0.

Точных методов решения этапа IV не существует. Однако существуют достаточно удобные приближенные методы. Идея такова: взяв произвольное значение  0, последовательно "улучшают" его; если при этом последовательность сходится к требуемому начальному значению , то последнее и считается решением этапа IV. При этом "отклонение" от начала координат должно быть практически приемлемым.

Замечание. В результате применения принципа максимума мы определяем оптимальное управление как функцию времени t. Недостаток этого результата заключается в том, что для разных начальных состояний x0 R n весь процесс расчета (этапы I-IV) приходится переделывать заново. Ибо управление , оптимальное в состоянии x 0, вообще говоря, неоптимально в состоянии x  x 0. Поэтому значительно более удобным является решение задачи оптимального управления в форме синтеза, когда u = u(xt). В этом случае оптимальное синтезирующее управление пригодно для любого начального состояния x 0 R n. К этому вопросу мы вернемся в Разделе 4.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]