- •Введение
- •1. Основные задачи теории автоматического управления
- •Формулировка задачи управления
- •Математическая модель объекта управления
- •1.3. Управляющая система и объект автоматического управления
- •1.4. Закон обратной связи
- •1.5. Общая задача теории автоматического управления
- •2. Математические модели сау
- •2.1. Построение модели элемента системы управления
- •2.2. Динамические и статические звенья сау
- •2.3. Составление дифференциальных уравнений систем автоматического управления
- •2.4. Примеры составления дифференциальных уравнений звеньев сау
- •2.5. Типовые динамические звенья линейных сау
- •2.6. Соединение звеньев и преобразование структурных схем сау
- •2.7. Вопросы идентификации моделей объектов управления
- •3. Методы исследования линейных сау
- •3.1. Общая модель линейной непрерывной и дискретной сау
- •3.2. Линейные сау, описываемые обыкновенными дифференциальными уравнениями с постоянными коэффициентами
- •3.3. Дискретные линейные сау
- •4.1. Метод фазовой плоскости
- •4.2. Линеаризация нелинейных дифференциальных уравнений
- •4.3. Автоколебания нелинейных сау
- •5. Устойчивость систем автоматического управления
- •5.1. Основные понятия теории устойчивости (математическая формулировка)
- •5.2. Общие теоремы об устойчивости линейных сау
- •5.3. Устойчивость линейной сау с постоянной матрицей
- •5.4. Связь устойчивости с корнями характеристического уравнения
- •5.5. Критерии устойчивости
- •5.6. Алгебраические критерии устойчивости
- •5.7. Частотные критерии устойчивости
- •5.8. Логарифмический критерий устойчивости
- •5.9. Запас устойчивости по фазе и амплитуде
- •5.10. Устойчивость импульсных сау
- •5.11. Устойчивость нелинейных сау
- •6. Качество систем автоматического управления
- •6.1. Показатели качества переходного процесса
- •6.2. Прямые методы определения показателей качества
- •6.3. Связь переходного процесса с вещественной частотной характеристикой системы
- •6.4. Интегральные оценки качества
- •7. Случайные воздействия в линейных сау
- •7.1. Понятие случайной функции
- •7.2. Основные характеристики случайной функции
- •7.3. Стационарные случайные функции
- •7.4. Спектральное представление стационарной случайной функции
- •7.5. Спектральная плотность стационарной случайной функции
- •7.6. Преобразование стационарной случайной функции стационарной линейной динамической системой
- •7.7. Преобразование случайных сигналов безынерционными нелинейными звеньями
- •7.8. Понятие статистически оптимальной линейной системы
- •7.9. Статистическая проверка гипотез
- •8. Задачи оптимального управления
- •8.1. Экстремумы функций. Принцип Лагранжа
- •8.2. Начала вариационного исчисления
- •8.3. Прямые методы решения задач оптимального управления
- •8.4. Принцип максимума Понтрягина
- •8.5. Оптимальное позиционное управление (динамическое программирование)
- •9. Современные тенденции развития систем управления
- •9.1. Управление при неполной начальной информации
- •9.2. Экстремальные сау
- •9.3. Самонастраивающиеся системы (снс)
- •9.4. Самоорганизующиеся и самообучающиеся сау
- •9.5. Автоматизированные системы управления
- •9.6. Роботы и гибкие производственные системы
- •9.7. Математические методы в управлении роботами и гпс
8.4. Принцип максимума Понтрягина
Начнем с самого простого примера задачи оптимального управления. Пусть F(t, X, U)=F1(t)u(t], где F1(t) - непрерывная функция на отрезке [0, Т]. Рассмотрим задачу
(-1≤u(t)≤1).
Совсем
несложно понять, что изучаемый интеграл
будет минимальным, если в случае
F1(t)
> 0
положить
а в случае F1(t)
<
0
положить u(t)
=
1,
то есть u(t)=-sign
F1(t).
И
в более общей задаче
(8.4.1)
следует
поступать аналогично, а именно - надо
для каждого t
[0,
Т]
найти
и
из
отрезка [и1,
и2],
при
котором функция F(t,
и) имеет
минимум по и.
Это
можно сформулировать в виде следующего
утверждения: для того чтобы функция
была
решением задачи (8.4.1), необходимо,
чтобы
(8.4.2)
Теперь становится ясной идея, заложенная в принцип максимума Понтрягина. К задаче оптимального управления (8.3.1) - (8.4.5) применим общий замысел Лагранжа, только несколько модифицированный.
Надо (сняв ограничение в (8.3.3)) составить функцию Лагранжа, которая будет иметь вид
(8.4.3)
а затем рассмотреть задачу
L→minX(0) = X0, X(T)=XT, U(t) U. (8.4.4)
При
этом надо по X,
как
и
раньше, составить уравнение Эйлера,
а по U
применить
утверждение типа (8.4.2). Но так как все
члены с U
в
функции Лагранжа входят со знаком
минус, то удобнее сформулировать это
утверждение в виде принципа максимума.
(Очевидно, что mах{-φ(·)}
=-min
{φ(·)}.)
Тогда решение задачи {
(t),...,
(t),u1,...,um}
будет
удовлетворять условию
(8.4.5)
Обычно принцип максимума Понтрягина формулируют, используя функцию Гамильтона (см. (8.2.11)). При этом наряду с системой (8.4.2) рассматривают сопряженную систему
(8.4.6)
(ψi(t) - точно такие же множители Лагранжа, как и λ(t)). Справедлива следующая теорема
Принцип максимума Понтрягина. Для того чтобы вектор-функция U(t) доставляла минимум функционалу
при условиях
необходимо, чтобы она доставляла максимум функции Гамильтона, то есть чтобы она была решением задачи
(8.4.7)
К условию (8.4.7) должны быть добавлены еще граничные условия
Х(0)=Х0, Х(Т)=ХТ. (8.4.8)
В сделанных предположениях данная теорема позволяет свести задачу отыскания оптимальной программы к краевой задаче для системы обыкновенных дифференциальных уравнений. Действительно, из условия (8.4.7) можно определить управление U как функцию ψ, X, t, то есть
U = U(ψ, X, t). (8.4.9)
Подставив эту функцию в (8.3.2) и (8.4.6), получим систему уравнений
(8.4.10)
где компоненты вектор-функции φ(·) определяются из (8.4.6). Учитывая граничные условия (8.4.8), имеем систему из 2п уравнений с 2п граничными условиями. Напомним, что п - размерность фазового вектора.
Сформулированная теорема - принцип максимума Понтрягина - говорит о том, что оптимальная программа может содержаться только среди решений краевой задачи (8.4.8), (8.4.10).
Процедура решений этой задачи заключается в решении экстремальной задачи (8.4.7), где вектор управления имеет размерность т. Эта задача должна решаться на каждом шаге численного интегрирования системы (8.4.10), то есть в данном случае принцип максимума Понтрягина позволяет свести решение задачи размерности т×N (N - число интервалов интегрирования) к решению N задач размерности т, связанных процедурой численного интегрирования.
Проиллюстрируем вышесказанное на одном из наиболее популярных методов решения задач оптимального управления, носящем название метод пристрелки. Суть его заключается в процедуре подбора ψ(0) таким образом, чтобы достигнуть цели управления Х(Т)=ХТ, исходя из начального состояния системы Х(0)=Х0. Предположим, что ψ(0)=ψ0, и применим схему Эйлера, описанную в предыдущем разделе, то есть зададим шаг интегрирования τ и положим
X((k+1)τ)=X(kτ) +τf(X(kτ), и(kτ), kτ),
ψ((k+1)τ)=ψ(kτ)+ τφ(Х(kτ), ψ(0), u(kτ), kτ). (8.4.11)
В частности,
X(τ)=X(0) + τf(x(0), и (0), 0),
ψ(τ)=ψ(0)+τφ(x(0),u(0),0). (8.4.12)
Согласно принципу максимума для определения X(τ) и ψ(τ) нужно найти управление u(0) такое, что достигается
(8.4.13)
Заметим, что если и - открытое множество, то, как и ранее, для решения задачи (8.4.13) можно использовать необходимые условия максимума функции, которые приводят к решению, как правило, системы трансцендентных уравнений
(i=1,
2,
...,m)
(8.4.14)
(см. также (8.2.13)).
Определив
и(0)
из
условия (8.4.13), находим из (8.4.12) величины
X(τ),
ψ(τ).
Повторяя эту процедуру, можно найти
последовательно значения Х(2τ),
ψ(2τ),
Х(3τ),
ψ(3τ)
и так далее. Окончанием этой процедуры
является нахождение вектора
Поскольку величина ψ(0)
выбиралась произвольным образом, то
при t=Т
в
общем случае
(8.4.15)
Ясно, что Ф будет функцией от ψ(0), то есть Ф=Ф(ψ(0)) и, следовательно, задача будет решена, если удастся подобрать ψ(0), для которого
Ф(ψ(0)) = 0. (8.4.16)
Таким образом, в итоге метод пристрелки приводит к решению хорошо разработанной задачи отыскания нулей некоторой вектор-функции. Несмотря на кажущуюся простоту метода пристрелки, в нем содержится много подводных камней, связанных с его численной реализацией.
Пример (рис.8.3). Пусть имеется тележка, движущаяся прямолинейно без трения по горизонтальным рельсам. Тележка управляется внешней силой U, которую можно изменять в пределах 0≤U≤ 1. В начальный момент времени тележка имеет скорость х2(0)=-1 и находится в точке 1. Требуется остановить тележку в точке 0 за кратчайшее время Т.
Рисунок 8.3.
Это простейшая задача о быстродействии в автоматическом управлении. Формализация этой задачи следующая:
Т →min,
x1(0)=0, x2(0)=-1, x1(T)=x2(T)=0.
В данном случае
H =ψ1x2+ψ2U-1
(функционал
).
Для переменных ψi (i=1, 2) имеем dψ/dt = 0, dψ2/dt =-ψ1, откуда ψi=c0, ψ2=c0t+ c1. Согласно принципу максимума
При U=1 интегрированием системы состояний получаем семейство траекторий
(s1, s2 - постоянные интегрирования). Соответственно при (U=0 имеем x1=r2t+r1, x2=r2 (r1,r2 - постоянные интегрирования). Очевидно, что никакая прямая этого семейства не может пройти через конечную точку (х1(Т)=х2(Т)=0), так как тогда должно было бы выполняться условие r1=r2=0.
Прохождение
через конечную точку приводит к условию
то
есть парабола
проходит через конечную точку, но
эта парабола не содержит начальной
точки. Поэтому сначала необходимо
управлять с U=0,
пока не будет достигнута нужная парабола,
а затем сделать переключение на U=1.
Время переключения t0
и
полное время Т
могут
быть легко вычислены.
Исходящая из начальной точки траектория получается при U=0: х1=-t+1, х2 =-1. Для t0 имеем
Достигнутое в этот момент состояние х1=1/2, х2=-1. Дальнейшее управление с U=1 дает траекторию
Из условия x1(T)=x2(T) = 0 следует, что Т=3/2.
