Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
OTAU lecture 1.docx
Скачиваний:
8
Добавлен:
01.07.2025
Размер:
1.96 Mб
Скачать

8.4. Принцип максимума Понтрягина

Начнем с самого простого примера задачи опти­мального управления. Пусть F(t, X, U)=F1(t)u(t], где F1(t) - непрерывная функция на отрезке [0, Т]. Рассмотрим задачу

(-1≤u(t)≤1).

Совсем несложно понять, что изучаемый интеграл бу­дет минимальным, если в случае F1(t) > 0 положить а в случае F1(t) < 0 положить u(t) = 1, то есть u(t)=-sign F1(t). И в более общей задаче

(8.4.1)

следует поступать аналогично, а именно - надо для каждого t [0, Т] найти и из отрезка [и1, и2], при котором функция F(t, и) имеет минимум по и. Это можно сформулировать в виде следующего утверждения: для того чтобы функция была решением за­дачи (8.4.1), необходимо, чтобы

(8.4.2)

Теперь становится ясной идея, заложенная в прин­цип максимума Понтрягина. К задаче оптимального управления (8.3.1) - (8.4.5) применим общий замысел Лагранжа, только несколько модифицированный.

Надо (сняв ограничение в (8.3.3)) составить функцию Лагранжа, которая будет иметь вид

(8.4.3)

а затем рассмотреть задачу

LminX(0) = X0, X(T)=XT, U(t) U. (8.4.4)

При этом надо по X, как и раньше, составить уравне­ние Эйлера, а по U применить утверждение типа (8.4.2). Но так как все члены с U в функции Лагран­жа входят со знаком минус, то удобнее сформулиро­вать это утверждение в виде принципа максимума. (Очевидно, что mах{-φ(·)} =-min {φ(·)}.) Тогда решение задачи { (t),..., (t),u1,...,um} будет удовлетворять условию

(8.4.5)

Обычно принцип максимума Понтрягина формули­руют, используя функцию Гамильтона (см. (8.2.11)). При этом наряду с системой (8.4.2) рассматривают со­пряженную систему

(8.4.6)

(ψi(t) - точно такие же множители Лагранжа, как и λ(t)). Справедлива следующая теорема

Принцип максимума Понтрягина. Для того чтобы вектор-функция U(t) доставляла минимум функционалу

при условиях

необходимо, чтобы она доставляла максимум функ­ции Гамильтона, то есть чтобы она была решением за­дачи

(8.4.7)

К условию (8.4.7) должны быть добавлены еще гра­ничные условия

Х(0)=Х0, Х(Т)=ХТ. (8.4.8)

В сделанных предположениях данная теорема поз­воляет свести задачу отыскания оптимальной про­граммы к краевой задаче для системы обыкновенных дифференциальных уравнений. Действительно, из ус­ловия (8.4.7) можно определить управление U как функцию ψ, X, t, то есть

U = U(ψ, X, t). (8.4.9)

Подставив эту функцию в (8.3.2) и (8.4.6), получим систему уравнений

(8.4.10)

где компоненты вектор-функции φ(·) определяются из (8.4.6). Учитывая граничные условия (8.4.8), имеем систему из 2п уравнений с 2п граничными условиями. Напомним, что п - размерность фазового вектора.

Сформулированная теорема - принцип максимума Понтрягина - говорит о том, что оптимальная про­грамма может содержаться только среди решений краевой задачи (8.4.8), (8.4.10).

Процедура решений этой задачи заключается в ре­шении экстремальной задачи (8.4.7), где вектор упра­вления имеет размерность т. Эта задача должна ре­шаться на каждом шаге численного интегрирования системы (8.4.10), то есть в данном случае принцип мак­симума Понтрягина позволяет свести решение задачи размерности т×N (N - число интервалов интегрирования) к решению N задач размерности т, связанных процедурой численного интегрирования.

Проиллюстрируем вышесказанное на одном из наиболее популярных методов решения задач опти­мального управления, носящем название метод при­стрелки. Суть его заключается в процедуре подбора ψ(0) таким образом, чтобы достигнуть цели управле­ния Х(Т)=ХТ, исходя из начального состояния систе­мы Х(0)=Х0. Предположим, что ψ(0)=ψ0, и приме­ним схему Эйлера, описанную в предыдущем разделе, то есть зададим шаг интегрирования τ и положим

X((k+1)τ)=X() +τf(X(), и(), ),

ψ((k+1)τ)=ψ()+ τφ(Х(), ψ(0), u(), ). (8.4.11)

В частности,

X(τ)=X(0) + τf(x(0), и (0), 0),

ψ(τ)=ψ(0)+τφ(x(0),u(0),0). (8.4.12)

Согласно принципу максимума для определения X(τ) и ψ(τ) нужно найти управление u(0) такое, что дости­гается

(8.4.13)

Заметим, что если и - открытое множество, то, как и ранее, для решения задачи (8.4.13) можно ис­пользовать необходимые условия максимума функции, которые приводят к решению, как правило, системы трансцендентных уравнений

(i=1, 2, ...,m) (8.4.14)

(см. также (8.2.13)).

Определив и(0) из условия (8.4.13), находим из (8.4.12) величины X(τ), ψ(τ). Повторяя эту процеду­ру, можно найти последовательно значения Х(2τ), ψ(2τ), Х(3τ), ψ(3τ) и так далее. Окончанием этой процеду­ры является нахождение вектора Поскольку ве­личина ψ(0) выбиралась произвольным образом, то при tв общем случае

(8.4.15)

Ясно, что Ф будет функцией от ψ(0), то есть Ф=Ф(ψ(0)) и, следовательно, задача будет решена, если удастся подобрать ψ(0), для которого

Ф(ψ(0)) = 0. (8.4.16)

Таким образом, в итоге метод пристрелки приво­дит к решению хорошо разработанной задачи отыска­ния нулей некоторой вектор-функции. Несмотря на ка­жущуюся простоту метода пристрелки, в нем содер­жится много подводных камней, связанных с его численной реали­зацией.

Пример (рис.8.3). Пусть имеется тележка, движущаяся прямолинейно без трения по горизонталь­ным рельсам. Тележка уп­равляется внешней силой U, которую можно изменять в пределах 0≤U 1. В начальный момент времени тележка имеет скорость х2(0)=-1 и находится в точке 1. Требуется остановить тележку в точке 0 за кратчайшее время Т.

Рисунок 8.3.

Это простейшая задача о быстродействии в автоматическом управлении. Формализация этой задачи следующая:

Т →min,

x1(0)=0, x2(0)=-1, x1(T)=x2(T)=0.

В данном случае

H1x2+ψ2U-1

(функционал ).

Для переменных ψi (i=1, 2) имеем /dt = 0, 2/dt =-ψ1, откуда ψi=c0, ψ2=c0t+ c1. Согласно принципу максимума

При U=1 интегрированием системы состояний получаем семей­ство траекторий

(s1, s2 - постоянные интегрирования). Соответственно при (U=0 имеем x1=r2t+r1, x2=r2 (r1,r2 - постоянные интегрирования). Очевидно, что никакая прямая этого семейства не может пройти через конечную точку 1(Т)=х2(Т)=0), так как тогда должно было бы выполняться условие r1=r2=0.

Прохождение через конечную точку приводит к условию то есть парабола проходит через ко­нечную точку, но эта парабола не содержит начальной точки. Поэтому сначала необходимо управлять с U=0, пока не будет достигнута нужная парабола, а затем сделать переключение на U=1. Время переключения t0 и полное время Т могут быть легко вычислены.

Исходящая из начальной точки траектория получается при U=0: х1=-t+1, х2 =-1. Для t0 имеем

Достигнутое в этот момент состояние х1=1/2, х2=-1. Даль­нейшее управление с U=1 дает траекторию

Из условия x1(T)=x2(T) = 0 следует, что Т=3/2.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]