Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
shpora.doc
Скачиваний:
22
Добавлен:
28.10.2018
Размер:
543.74 Кб
Скачать

51. Принцип максимума Понтрягина.

Для решения задачи оптимального управления нужно рассмотреть вопрос о необходимых условиях экстремума. Ответ дает теорема, которая носит название принципа максимума Понтрягина.

Теорема (принцип максимума Понтрягина). Пусть (x*, u*, t0*, t1*) – оптимальный процесс в задаче оптимального управления (7.1.2)–(7.1.6).

Предположим, что

-функции fi, φ непрерывны вместе со своими производными по x в окрестности множества {(t, x*(t),u) | u∈U};

-функции ψi непрерывно дифференцируемы в окрестности точки (t0*, t1*, x*( t0*), x*( t1*)).

Тогда найдутся множители Лагранжа: числа λk∈R, k =0,…,N и функция p(t)∈ACR[a; b], не все равные нулю, такие что для функции Лагранжа (функции Понтрягина)

H = ∫[t(0); t(1)] f(t, x, u) + p(t)(x' - φ(t, x, u))dt + ψ(t0, t1, x(t0), x(t1)),    (7.2.1)

в которой

f(t, x, u) = ∑ 0≤ k ≤ N λkfk(t, x, u); ψ(t0, t1, x0, x1) = ∑ 0≤ k ≤ N λkψk(t0, t1, x0, x1);    (7.2.2)

выполняются следующие условия:

А) стационарность по x (уравнение Эйлера): d/dt L*x ' (t) = L*x (t),

или p'(t) = fx*(t) – p(t) φx*(t),     (7.2.3)

где L = f(t, x, u) + p(t)(x'–φ(t, x, u)) – лагранжиан задачи.

Б) трансверсальность по x:Lx’* (t0*) = ψx0*,  Lx’* (t1*) = – ψx1*, или p(t0*) = ψx0*,  p(t1*) = – ψx1*.     (7.2.4)

В) оптимальность по u:

minuU L(t, x*(t), u) = L(t, x*(t), u*(t)) (7.2.5)

для всех t ∈ [t0*, t1*].

Г) стационарность по t0 и t1 (только для подвижных концов): Ht0* = 0, H  t1* = 0;              (7.2.6)

Д) дополняющая нежесткость:

λkBk* = 0, k = 1,…,m;        (7.2.7)

Е) неотрицательность:

λk ≥ 0, k = 0,…,m.       (7.2.8)

Доказательство. Зафиксируем управление u. Тогда задача (7.1.2) - (7.1.5) - типичная гладкая задача с ограничениями, к которой применима теорема о множителях Лагранжа. Единственное, что требуется - это записать условия (7.1.4) и (7.1.5) в виде уравнения

F(x, t0, t1) = 0, где оператор F действует в пространство Y = RN-m×R[a, b] (напомним, что на пространстве R[a, b] мы рассматриваем равномерную норму).

Cогласно теореме о множителях Лагранжа найдутся не все равные нулю числа λk, k = 0,…,m (соответствующие целевой функции и ограничениям-неравенствам) и функционал y*∈Y*, такие что в в решении задачи дифференциал функции  H = ∑ 0≤ k ≤ m λkBk + y*F  равен нулю, причем выполняются условия дополняющей нежесткости (7.2.7) и неотрицательности (7.2.8).

Отметим, что элемент y*∈Y* задается вектором из N-m чисел (которые мы обозначим λk, k = m+1,…, N) и линейным ограниченным функционалом на R[a, b]. Последний функционал согласно теореме Рисса для пространства C[a, b] задается некоторой функцией ограниченной вариации g.

Следовательно, имеет место формула: H = ∑ 0≤ k ≤ N λkBk + ∫[a; b] (x'–φ(t, x, u))dg(t).

Можно показать, что в качестве функции g можно подобрать абсолютно непрерывную функцию. В этом случае найдется интегрируемая функция p, для которой dg(t) = p(t)dt. Следовательно (с учетом обозначений (7.2.2)),

H = ∑ 0≤ k ≤ N λkBk + ∫[t(0); t(1)] p(t)(x'–φ(t, x, u))dt =

= ∫[t(0); t(1)] f(t, x, u) + p(t)(x'–φ(t, x, u))dt + ψ(t0, t1, x(t0), x(t1)) = ∫[t(0); t(1)] L dt + ψ.

Функция H по переменной x имеет такой же вид, как целевой функционал в задаче Больца, поэтому получаем уравнение Эйлера (7.2.3) и условия трансверсальности (7.2.4).

По переменным t0 и t1 функция H - обычная функция двух действительных переменных, поэтому в точке экстремума частные производные по этим переменным должны равняться нулю, т.е. выполняется условие стационарности (7.2.6).

Заметим, что в оптимальной точке при λ0=1 выполняется H(x*, u, t0*, t1*)=H(u) = B0(u), поэтому minu(t)∈U H(u) = minu(t)∈U B0(u) = H(u*). Поскольку H = ∫[t(0); t(1)] L dt + ψ, и функция ψ не зависит от u, получаем условие оптимальности по u (7.2.4)..

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]