Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казахская академия транспорта и коммуникаций им. М. Тынышпаева

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

OTAU lecture 1.docx

Скачиваний:

Добавлен:

01.07.2025

Размер:

1.96 Mб

Скачать

☆

<<< < Предыдущая 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 3738 / 4438 39 40 41 42 43 44 > Следующая >>>

8.4. Принцип максимума Понтрягина

Начнем с самого простого примера задачи оптимального управления. Пусть F(t, X, U)=F₁(t)u(t], где F₁(t) - непрерывная функция на отрезке [0, Т]. Рассмотрим задачу

(-1≤u(t)≤1).

Совсем несложно понять, что изучаемый интеграл будет минимальным, если в случае F₁(t) > 0 положить а в случае F₁(t) < 0 положить u(t) = 1, то есть u(t)=-sign F₁(t). И в более общей задаче

(8.4.1)

следует поступать аналогично, а именно - надо для каждого t [0, Т] найти и из отрезка [и₁, и₂], при котором функция F(t, и) имеет минимум по и. Это можно сформулировать в виде следующего утверждения: для того чтобы функция была решением задачи (8.4.1), необходимо, чтобы

(8.4.2)

Теперь становится ясной идея, заложенная в принцип максимума Понтрягина. К задаче оптимального управления (8.3.1) - (8.4.5) применим общий замысел Лагранжа, только несколько модифицированный.

Надо (сняв ограничение в (8.3.3)) составить функцию Лагранжа, которая будет иметь вид

(8.4.3)

а затем рассмотреть задачу

L→minX(0) = X₀, X(T)=X_T, U(t) U. (8.4.4)

При этом надо по X, как и раньше, составить уравнение Эйлера, а по U применить утверждение типа (8.4.2). Но так как все члены с U в функции Лагранжа входят со знаком минус, то удобнее сформулировать это утверждение в виде принципа максимума. (Очевидно, что mах{-φ(·)} =-min {φ(·)}.) Тогда решение задачи { (t),..., (t),u₁,...,u_m} будет удовлетворять условию

(8.4.5)

Обычно принцип максимума Понтрягина формулируют, используя функцию Гамильтона (см. (8.2.11)). При этом наряду с системой (8.4.2) рассматривают сопряженную систему

(8.4.6)

(ψ_i(t) - точно такие же множители Лагранжа, как и λ(t)). Справедлива следующая теорема

Принцип максимума Понтрягина. Для того чтобы вектор-функция U(t) доставляла минимум функционалу

при условиях

необходимо, чтобы она доставляла максимум функции Гамильтона, то есть чтобы она была решением задачи

(8.4.7)

К условию (8.4.7) должны быть добавлены еще граничные условия

Х(0)=Х₀, Х(Т)=Х_Т. (8.4.8)

В сделанных предположениях данная теорема позволяет свести задачу отыскания оптимальной программы к краевой задаче для системы обыкновенных дифференциальных уравнений. Действительно, из условия (8.4.7) можно определить управление U как функцию ψ, X, t, то есть

U = U(ψ, X, t). (8.4.9)

Подставив эту функцию в (8.3.2) и (8.4.6), получим систему уравнений

(8.4.10)

где компоненты вектор-функции φ(·) определяются из (8.4.6). Учитывая граничные условия (8.4.8), имеем систему из 2п уравнений с 2п граничными условиями. Напомним, что п - размерность фазового вектора.

Сформулированная теорема - принцип максимума Понтрягина - говорит о том, что оптимальная программа может содержаться только среди решений краевой задачи (8.4.8), (8.4.10).

Процедура решений этой задачи заключается в решении экстремальной задачи (8.4.7), где вектор управления имеет размерность т. Эта задача должна решаться на каждом шаге численного интегрирования системы (8.4.10), то есть в данном случае принцип максимума Понтрягина позволяет свести решение задачи размерности т×N (N - число интервалов интегрирования) к решению N задач размерности т, связанных процедурой численного интегрирования.

Проиллюстрируем вышесказанное на одном из наиболее популярных методов решения задач оптимального управления, носящем название метод пристрелки. Суть его заключается в процедуре подбора ψ(0) таким образом, чтобы достигнуть цели управления Х(Т)=Х_Т, исходя из начального состояния системы Х(0)=Х₀. Предположим, что ψ(0)=ψ₀, и применим схему Эйлера, описанную в предыдущем разделе, то есть зададим шаг интегрирования τ и положим

X((k+1)τ)=X(kτ) +τf(X(kτ), и(kτ), kτ),

ψ((k+1)τ)=ψ(kτ)+ τφ(Х(kτ), ψ(0), u(kτ), kτ). (8.4.11)

В частности,

X(τ)=X(0) + τf(x(0), и (0), 0),

ψ(τ)=ψ(0)+τφ(x(0),u(0),0). (8.4.12)

Согласно принципу максимума для определения X(τ) и ψ(τ) нужно найти управление u(0) такое, что достигается

(8.4.13)

Заметим, что если и - открытое множество, то, как и ранее, для решения задачи (8.4.13) можно использовать необходимые условия максимума функции, которые приводят к решению, как правило, системы трансцендентных уравнений

(i=1, 2, ...,m) (8.4.14)

(см. также (8.2.13)).

Определив и(0) из условия (8.4.13), находим из (8.4.12) величины X(τ), ψ(τ). Повторяя эту процедуру, можно найти последовательно значения Х(2τ), ψ(2τ), Х(3τ), ψ(3τ) и так далее. Окончанием этой процедуры является нахождение вектора Поскольку величина ψ(0) выбиралась произвольным образом, то при t=Т в общем случае

(8.4.15)

Ясно, что Ф будет функцией от ψ(0), то есть Ф=Ф(ψ(0)) и, следовательно, задача будет решена, если удастся подобрать ψ(0), для которого

Ф(ψ(0)) = 0. (8.4.16)

Таким образом, в итоге метод пристрелки приводит к решению хорошо разработанной задачи отыскания нулей некоторой вектор-функции. Несмотря на кажущуюся простоту метода пристрелки, в нем содержится много подводных камней, связанных с его численной реализацией.

Пример (рис.8.3). Пусть имеется тележка, движущаяся прямолинейно без трения по горизонтальным рельсам. Тележка управляется внешней силой U, которую можно изменять в пределах 0≤U≤ 1. В начальный момент времени тележка имеет скорость х₂(0)=-1 и находится в точке 1. Требуется остановить тележку в точке 0 за кратчайшее время Т.

Рисунок 8.3.

Это простейшая задача о быстродействии в автоматическом управлении. Формализация этой задачи следующая:

Т →min,

x₁(0)=0, x₂(0)=-1, x₁(T)=x₂(T)=0.

В данном случае

H =ψ₁x₂+ψ₂U-1

(функционал ).

Для переменных ψ_i (i=1, 2) имеем dψ/dt = 0, dψ₂/dt =-ψ₁, откуда ψ_i=c₀, ψ₂=c₀t+ c₁. Согласно принципу максимума

При U=1 интегрированием системы состояний получаем семейство траекторий

(s₁, s₂ - постоянные интегрирования). Соответственно при (U=0 имеем x₁=r₂t+r₁, x₂=r₂ (r₁,r₂ - постоянные интегрирования). Очевидно, что никакая прямая этого семейства не может пройти через конечную точку (х₁(Т)=х₂(Т)=0), так как тогда должно было бы выполняться условие r₁=r₂=0.

Прохождение через конечную точку приводит к условию то есть парабола проходит через конечную точку, но эта парабола не содержит начальной точки. Поэтому сначала необходимо управлять с U=0, пока не будет достигнута нужная парабола, а затем сделать переключение на U=1. Время переключения t₀ и полное время Т могут быть легко вычислены.

Исходящая из начальной точки траектория получается при U=0: х₁=-t+1, х₂ =-1. Для t₀ имеем

Достигнутое в этот момент состояние х₁=1/2, х₂=-1. Дальнейшее управление с U=1 дает траекторию

Из условия x₁(T)=x₂(T) = 0 следует, что Т=3/2.

<<< < Предыдущая 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 3738 / 4438 39 40 41 42 43 44 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.20251.36 Mб4NOK_ASSUD_745.rtf
#
08.04.201573.73 Кб25OBZh_surak.doc
#
01.07.202526.73 Кб4OET.docx
#
01.05.2025676.89 Кб7OPPT Ustno OK.docx
#
01.07.2025731.65 Кб6Ordabekova_A_VOLS_KR.doc
#
01.07.20251.96 Mб8OTAU lecture 1.docx
#
08.04.201596.91 Кб32Otvety_2.docx
#
01.07.2025202.24 Кб4Otvety_GOSY_30b.docx
#
01.07.20251.04 Mб3P3.RTF
#
14.03.2016741.04 Кб13pf.rtf
#
01.07.2025180.91 Кб7philosophy_1-8 (2).docx