
- •21. 4.1. Передаточная функция и характеристики разомкнутой цепи звеньев
- •4.1.1. Цепь из последовательно соединенных звеньев
- •4.1.2. Цепь из параллельно соединенных звеньев
- •4.1.3. Цепи с местной обратной связью
- •22. Линейные законы регулирования. Понятие о законах регулирования
- •23.Пропорциональное регулирование. Интегральное регулирование. Изодромное регулирование. Регулирование по производным.Пропорциональное регулирование
- •24.Процесс управления и требования к нему. Итд
- •28.Алгебраический критерий устойчивости Гурвица.
- •29. Частотный критерий устойчивости Михайлова
- •Критерий устойчивости Найквиста
- •35. Постановка задач оптимального управления. Фазовые и управляющие переменные. Амплитудные ограничения. Примеры
- •Амплитудные ограничения
- •37. Критерии качества управления. Типы критериев качества
- •38. Классификация задач оптимального управления по типу ограничений фазовые переменные.
- •34.Методы анализа и синтеза систем управления.
- •39. Распространенные задачи оптимального управления. Основные проблемы теории управляемых процессов.
- •40.Принцип максимума л.С. Понтрягина в теории оптимальных систем
- •41.Метод динамического программирования р. Беллмана
- •42. Применение принципа максимума, как проверочного условия
- •43.Применение принципа максимума для сведения задачи оптимального управления к решению двухточечной краевой задачи.
- •45. Принцип максимума л.С. Понтрягина для задач Больца, Лагранжа
- •46. Принцип максимума л.С. Понтрягина для задач терминального управления
- •48. Свойства функции Гамильтона. Достаточность принципа максимума для линейных систем
- •48. Свойства функции Гамильтона. Достаточность принципа максимума для линейных систем
- •31. Области устойчивости сау. Метод корневого годографа. Критерий Вышнеградского. Метод d-разбиения. Области устойчивости сау
- •Метод корневого годографа
- •Критерий Вышнеградского
- •Метод d-разбиения
- •25. Операционный метод расчета переходных процессов в сау. Преобразования Фурье, Лапласа, Карсона-Хевисайда. Теорема разложения Преобразование Лапласа
- •Преобразование Карсона-Хевисайда
- •Теорема разложения
- •Преобразование Фурье
46. Принцип максимума л.С. Понтрягина для задач терминального управления
с нефиксированной продолжительностью процесса
Рассмотрим следующую задачу оптимального управления
=f(x,
u,
t),
x(t0)=x0, (13.2.1)
u(t)U,
t0
≤ t
≤ t1. (13.2.2)
J(u) = (x(t1)). (13.2.3)
Момент t1 не известен. Допустим, что решение задачи (13.2.1)-(13.2.3) существует. Это значит, что найдется такой оптимальный момент времени t1* и управление u*(t), заданное на отрезке t0 ≤ t ≤ t1, что
J(u*)
= (x*(t1*))
=(x(t1)),
t1>t0,
t0
≤ t
≤ t1.
Рассмотрим задачу (13.2.1)-(13.2.3) при t1=t1*. В этом случае задача (13.2.1)-(13.2.3) есть задача с фиксированным временем и следовательно оптимальное управление u*(t) в этой задаче будет совпадать с оптимальным управлением в задаче (13.2.1)-(13.2.3) с фиксированным временем и по доказанному оно обязано удовлетворять принципу максимума.
Получим дополнительное условие, определяющее специфику задачи. Найдем дополнительное соотношение, которому удовлетворяет оптимальный момент времени t1*.
Пусть t1 > t0 произвольный момент и Δt1 приращение времени, такое что t1+Δt1 > t0. Δt1 может принимать достаточно малые приращения.
Найдем приращение функционала (13.2.3), соответствующее приращению момента t1–Δt1. Пусть задано некоторое допустимое управление u(t), t0 ≤ t ≤ t1 и x(t) соответствующая ему фазовая траектория.
(Если t1+Δt1>t1, то расширим промежуток регулирования, при этом управление на отрезке [t1, t1+Δt1] доопределяется произвольным образом, не выходя из области допустимых управлений с сохранением непрерывности в точке t1).
Рассмотрим приращение функционала, соответствующее приращению Δt1. Тогда
J(u)
= (x(t1+Δt1))
–(x(t1))
=
== –ψ(t1)´f(x(t1),
u(t1),
t1)
= –H(x(t1),
ψ(t1),
u(t1),
t1)
.
(13.2.4)
Рассмотрим приращение функционала вдоль оптимального процесса u*(t), x*(t), ψ*(t), t0 ≤ t ≤ t1.
Тогда
.
Учитывая произвольность приращения Δt1 из формулы (13.2.4) для приращения функционала получаем, что функция Гамильтона Н, подсчитанная в оптимальный момент t1* должна равняться нулю в силу произвольности Δt1 .
H(x*(t1*), ψ*(t1*), u*(t1*), t1*) = 0.Это есть дополнительное условие, характеризующее оптимальный момент времени t1*.
Теорема 13.2. Пусть u(t), t0 ≤ t ≤ t1, некоторое допустимое управление в задаче оптимального управления (13.2.1)-(13.2.3) с нефиксированным моментом времени t1; x(t), ψ(t) соответствующие этому управлению фазовая и сопряженная траектории.
Для оптимальности управления u(t) и момента t1 необходимо, чтобы выполнялось условие максимума функции H
,
а в конечный момент t1 было выполнено условие H(x(t1), ψ(t1), u(t1), t1) = 0.
Следствие
1. Если
система (13.2.1) стационарна
=
f(x,
u),
то вдоль управления, удовлетворяющего
принципу максимума H(x(t),
ψ(t),
u(t))
≡ 0, t0
≤ t
≤ t1.
48. Свойства функции Гамильтона. Достаточность принципа максимума для линейных систем
Управление u(t) у нас кусочно-непрерывно, x(t), ψ(t) – непрерывны по t. Поэтому в общем случае функция Гамильтона кусочно-непрерывна по t. Оказывается, если управление удовлетворяет принципу максимума, то функция Гамильтона непрерывна и даже кусочно-дифференцируема по t вдоль всех процессов, подозрительных на оптимальность. Таким образом, вдоль оптимального процесса функция Гамильтона обладает повышенной гладкостью.
Теорема 13.3. Пусть вектор-функция f(x, u, t), задающая правую часть системы, непрерывна по своим аргументам вместе с частными производными по x - ∂f/∂x и по t - ∂f/∂t.
Если допустимое управление u(t) удовлетворяет принципу максимума, то функция Гамильтона M(t)=H(x(t), ψ(t), u(t), t),
вдоль
этого управления является непрерывной
и кусочно-дифференцируемой функцией
времени на [t0,
t1].
Причем, в точках непрерывности управления
u(t),
производная dM/dt
существует и равна.(Функция
Гамильтона дифференцируема во всех
точках непрерывности управления).
Доказательство: Рассмотрим приращение M(t) в некоторой произвольной точке
t0 ≤ t ≤ t1.
ΔM(t)=M(t+Δt)-M(t)=H(x(t+Δt), ψ(t+Δt), u(t+Δt), t+Δt)-H(x(t), ψ(t), u(t), t)=H[t+Δt]-H[t].
Т.к. u(t) удовлетворяет принципу максимума, то имеет место неравенствоH[t+Δt] ≥ H(x(t+Δt), ψ(t+Δt), u(t), t+Δt),
(по сравнению, с какими угодно управлениями и в частности, по сравнению с u(t)). АналогичноH[t] ≥ H(x(t), ψ(t), u(t+Δt), t). Произведем оценку приращения ΔM(t) ΔM(t) ≤ H(x(t+Δt), ψ(t+Δt), u(t+Δt), t+Δt) - H(x(t), ψ(t), u(t+Δt), t)=A(Δt).
Управление никакого приращения не получает. С другой стороны ΔM(t) ≥ H(x(t+Δt), ψ(t+Δt), u(t), t+Δt) - H(x(t), ψ(t), u(t), t)=В(Δt). Таким образом имеем оценку B(Δt) ≤ ΔM(t) ≤ A(Δ (13.4.1)
Перейдем к пределу при Δt→0. Т.к. вектор-функции x(t), ψ(t) непрерывны по t, а функция Гамильтона непрерывна по своим аргументам, то при Δt→0, A(Δt)→0, B(Δt)→0. В A(Δt), B(Δt) управление приращения не получает. Отсюда следует: ΔM(t)→0, что и доказывает непрерывность функции M(t).
Докажем
дифференцируемость.
Пусть t
точка дифференцируемости управления
u(t).
Т.е.u(t+Δt)=u(t).
Тогда
x(t),
ψ(t)
будут являться дифференцируемыми в
точке t,
т.е. их производные в этой точке будут
являться непрерывными. Тогда в этой
точке производные существуют и непрерывны.
Поделим неравенство (13.4.1) на приращение
Δt
(Δt
– произвольное приращение)..
Если Δt<0, то неравенство переменится. Будет иметь противоположный смысл при Δt<0.
Пусть
Δt→0
и рассмотрим, как ведут себя эти отношения.
Тогда
.
∂H/∂x существует, поскольку существует ∂f/∂x ; ∂H/∂t существует, т.к. существует ∂f/∂t .
Эти производные существуют и непрерывны.
Следовательно,
. существует и равен ∂H/∂t.
.
Таким
образом, вдоль управления, удовлетворяющего
принципу максимума.
Следствие 1. Пусть исходная система является стационарной (правые части явно от времени не зависят):
=f(x,
u).
В этом случае H
= H(x,
ψ, u),
также явно от t
не зависит. Следовательно, вдоль
управления, удовлетворяющего принципу
максимума
.
Отсюда, учитывая непрерывность H
по времени, получаем
H(x(t), ψ(t), u(t)) ≡ C, для любых t0 ≤ t ≤ t1. Из механики известно, что если система дифференциальных уравнений описывает механическую систему, то функция Гамильтона Н описывает полную энергию. Это свойство равносильно закону сохранения энергии.
Теорема 13.4. Для оптимальности допустимого управления u(t) в задаче оптимального управления, линейной по фазовым переменным
=A(t)
x + b(u,
t),
(13.4.2)
x(t0)
= x0,
u(t)U,
t0
≤ t ≤ t1.
(13.4.3)
J(u) = (x(t1)) → min, (13.4.4)
где (x) выпуклая функция, необходимо и достаточно, чтобы оно удовлетворяло принципу максимума.
Рассмотрим следующую линейную задачу:
=A(t)x
+ B(t)u
+ W(t),
x(t0)=x0,
u(t)
U,
t0
≤ t
≤ t1.
J(u)
=
x(t1)
→ min,
C – заданный n-мерный вектор.
Для этой задачи в силу теоремы 13.4 принцип максимума есть необходимое и достаточное условие оптимальности. Найдем управление, удовлетворяющее принципу максимума в сформулированной задаче.
H=ψ(t)’x +ψ’B(t)u +ψ’W(t).
Сопряженная
система (13.4.5)
Сопряженная
система (13.5.5) не зависит от выбора
управления u
и является замкнутой. Найдем управление,
удовлетворяющее принципу максимума.
Это управление и будет являться
оптимальным управлением. Чтобы найти
максимум нужно максимизировать линейную
форму по u.B(t)u*
=
B(t)u,
t0
≤ t
≤ t1.
(13.4.6) Таким образом, оптимальное
управление для сформулированной
линейной задачи определяется из условия
(13.4.6), где ψ=ψ(t)
есть решение сопряженной системы
(13.4.5).
47.