
- •Оптимальные и адаптивные системы (1 четверть).
- •Введение.
- •Глава 1. Принцип максимума Понтрягина (пмп).
- •Методика пмп.
- •Связь оптимального управления с энергией, запасаемой в объекте.
- •Теорема об n-интервалах.
- •Определение моментов переключения управляющих функций. Метод стыковки решения.
- •Задача об управлении консервативным объектом.
- •Аналитический синтез оптимальных регуляторов по квадратичному критерию качества.
- •Дискретная форма вариационной задачи. Принцип оптимальности Беллмана.
- •Непрерывная задача динамического программирования.
- •Глава 2. Общая характеристика адаптивных систем. Их классификация.
- •Типы самонастраивающихся систем (снс).
-
Аналитический синтез оптимальных регуляторов по квадратичному критерию качества.
Пусть
мат модель ОУ задана в переменных
состояния:
В
векторном виде:
X – n-мерный вектор переменных состояния.
A – квадратная матрица
B - n×r матрица
U – r-мерный вектор управляющих воздействий.
Для этого объекта необходимо синтезировать регулятор оптимальный с точки зрения квадратичного критерия:
Q – матрица весовых коэффициентов (gij – коэффициенты при xixj)
R –матрица r×r (rij коэффициенты при uiuj)
Обычно матрицы Q и R диагональные.
Рассмотрим пример.
Задачу (2) и (3) решим с помощью ПМП.
-
Введем вспомогательную переменную и составим расширенную систему.
-
Составим функцию Гамильтона.
Функция
Н не зависит от
,
поэтому
-
Решается задача H→max.
-
Определим функцию Ψ из системы сопряженных уравнений.
Функцию
Ψ будем искать в виде
Уравнение (6) называется алгебраическим уравнение Рикати. Уравнение Рикати позволяет определить элементы матрицы К. Матрица К является симметричной. Уравнение Рикати является нелинейным, поэтому содержит несколько решений. Из этих решений выбирается одно, удовлетворяющее условию Сильвестра.
-
Дискретная форма вариационной задачи. Принцип оптимальности Беллмана.
Функционал
вариационной задачи:
при замене подынтегральной функции G
ломаной может быть представлен в
дискретном виде:
В
этом случае задача поиска экстремума
J
заменяется задачей мат программирования
поиска экстремума функций N-переменных
.
Чем больше N,
тем точнее решение. Но с увеличением N
возрастает сложность решения задачи,
поэтому Беллманом разработана методика
решения задач управления многошаговая,
мат аппаратом при этом является
динамическое программирование. Рассмотрим
задачу управления как многошаговую.
На
i-том
шаге управления под действием управления
Ui
объект переводится из состояния Xi-1
в состояние Xi.
Эффективность
управления на каждом шаге оценивается
функцией потери r(xi,
u).
Эффективность всего управления:
.
Задача состоит в определении такой
стратегии управления U*=(U1…UN),
которая переводила бы объект из X0
в XN
и при этом обеспечивала бы минимальные
функции потерь R.
Введем понятия fk(xk) – минимальные потери, при переходе из состояния xk в состояние xn.
Поставленная задача решается на основе принципа оптимальности Беллмана: не зависимо от того каким образом система пришла в данное состояние, управление на данном шаге должно быть таким, чтобы суммарные потери на данном шаге + минимальные потери на всех последующих шагах были минимальными.
- рекуррентное
соотношение Беллмана, которое выражает
принцип оптимальности. Это соотношение
позволяет решать задачу с последнего
шага. Полагаем k=N-1
Для всех состояний XN-1 определяется условно-оптимальное управление UN-1. Затем полагаем k=N-2.
Определяется условно-оптимальное управление UN-2.
Процедура
продолжается до начального состояния
X0:
которая известна.
-
Непрерывная задача динамического программирования.
Принцип оптимальности Беллмана может быть применен и для решения непрерывных задач управления:
Эта задача при замене dt на Δt может быть представлена в дискретном виде:
Для данной задачи функция минимальных потерь имеет вид:
Минимальные
потери при движении системы из
в конечное состояние.
В
соответствии с принципом оптимальности:
Функцию
разложим в ряд вблизи точки
:
Подставим
(5) в (4):
Подставляем
(3) в (6):
Функция в квадратных скобках равна 0, если она минимальна, поэтому последнее выражение эквивалентно системе:
Выражение (7) называется функциональным уравнением Беллмана для непрерывной задачи управления.
Если
верхний предел
:
Метод динамического программирования позволяет синтезировать системы не только оптимальные, но и устойчивые, поскольку функция минимальных потерь S является функцией Ляпунова.
-
знакоопределенная положительная
функция.
-
знакоопределенная отрицательная
функция.