- •Глава 2. Sdre-метод синтеза управляющих воздействий
- •§ 2.1. Постановка задачи
- •§ 2.2. Дифференциальная игра: общее решение
- •§ 2.3. Оптимальные стратегии дифференциальной игры
- •§ 2.4. Анализ устойчивости по Ляпунову
- •§ 2.6. Структура регулятора
- •§ 2.7. Существование sdre стабилизирующего управления
- •§ 2.8. Анализ локальной оптимальности дифференциальной игры
- •§ 2.9. Множество стабилизирующих управлений
- •§ 2.10. Выводы
§ 2.6. Структура регулятора
Будем считать, что представление системы
в виде
(2.46)
является эквивалентным в указанном выше смысле.
Запишем уравнение Гамильтона-Якоби-Беллмана для системы (2.46)
(2.47)
Будем искать в виде
. (2.48)
Тогда из (2.47) будем иметь
Так как это уравнение должно выполняться при всех, из последнего следует
(2.49)
Или
Положительно определенная матрица решения алгебраического уравнения Риккати (SDRE) определяет параметры управлений (2.8)
, . (2.50)
Система исходная управления будет иметь вид
(2.51)
Как уже отмечалось выше, основная проблема построения оптимальной системы SDRE-методом связана с получением решения уравнения (2.49) в темпе функционирования объекта.
§ 2.7. Существование sdre стабилизирующего управления
Прежде чем рассматривать использования SDRE стабилизирующего управления в задаче дифференциальной игры, приведем некоторые сведения, расширяющие ранее опубликованные результаты исследований [24,25,44, 45]. Пусть управляемая нелинейная система описывается уравнением
(2.52)
где −состояние системы , − открытое множество в , −управления и .
Функции и . Без потери общности, будем считать начало координат устойчивым состоянием покоя, и .
Задан функционал качества
(2.53)
Отметим, что лагранжиан функционала (2.53) квадратичен по и . Матрицы весов таковы, что
.
Предположение 2.7.1. Нелинейная система в постановке задачи (2.52), (2.53) стабилизируема и детектируема, если тройка стабилизируема и детектируема.
Определение 2.7.1. Будем называть представление нелинейной управляемой системы (2.52) в виде
(2.54)
SDC-представлением.
Предположение 2.7.2. − матрицы действительных переменных.
Предположение 2.7.3. SDC-представление нелинейной системы (2.52) является стабилизируемым (управляемым) в области , если пары , стабилизируемы (управляемы) в линейном смысле для ., т.е.
Это означает, что существует положительно определенная матрица (грамиан управляемости) для всех , являющаяся решением уравнения Ляпунова
.
Предположение 2.7.4. SDC-представление нелинейной системы (2.52) является наблюдаемым и детектируемым в области , если пара наблюдаема, а пара детектируема в линейном смысле для, т.е.
Это означает, что существует положительно определенная матрица (грамиан наблюдаемости) для всех , являющаяся решением уравнения Ляпунова
.
Управление объектом (2.52) осуществляется с использованием обратной связи в соответствии с законом
, (2.55)
где . Синтез управления, осуществляющего перевод системы (2.52) из начального состояния в состояние , т.е. , и доставляющего минимум функционалу (2.53), заключается в нахождении соответствующих матриц .
В соответствии с изложенным в предыдущей главе, искомые матрицы определяются соотношениями
, (2.56)
где положительно определенная матрица является решением уравнения Риккати с параметрами, зависящими от состояния,
(2.57)
Определение 2.7.2. Матрица
в SDC-представление вида (2.44) является поточечно гурвицевой в области , если корни характеристического уравнения этой матрицы отрицательны () для всех .
Система (2.52) управлениями (2.56) − (2.57) имеет вид
. (2.58)
Определение 2.7.3. Будем называть метод синтеза управляющих воздействий для нелинейной системы вида (2.52) в ее SDC-представлении с квадратическим функционалом качества, что приводит к использованию уравнения Риккати с параметрами, зависящими от состояния, SDRE-методом.
Определение 2.7.4. Управления (2.55) реализуемы SDRE-методом в области , если существует поточечно стабилизируемая SDC-параметризация , поточечно положительно полуопределенная матрица и поточечно положительно определенные матрицы такие, что синтезированные управления являются функциями состояния объекта.
Предположение 2.7.5. Закон управления (2.54) реализуем SDRE-методом, если существует SDC-представление нелинейной системы (2.52) и матрицы штрафа функционала (2.53) таковы, что и для .
Теорема 2.7.1. [2]. Законы управления (2.54) реализуемы SDRE-методом, если существует SDC-представление нелинейной системы (2.52) такое, что матрица поточечно является матрицей Гурвица при и нули замкнутой системы поточечно лежат в левой полуплоскости .
Теорема 2.7.1 представляет необходимые и достаточные условия для реализации закона управления SDRE-методом. Следует отметить сложность использования данной теоремы в случае неконечного числа SDC-представлений нелинейной системы.
Теорема 2.7.2. [2] Пусть нелинейная управляемая система описывается уравнением (2.52), где , и симметричная положительно определенная матрица, являющаяся поточечным решением матричного уравнения типа Риккати (2.56). Тогда, учитывая Предположение 2.7.2, SDRE-метод реализует локально асимптотическое устойчивое решение задачи управления в замкнутом виде.
Доказательство. Воспользовавшись теоремой 2.4.1, запишем условие асимптотической устойчивости для SDC-представления нелинейной системы (2.52):
(2.59)
Если функция Ляпунова является решением уравнения Гамильтона-Якоби-Беллмана
(2.60)
то управления есть оптимальные управления к множеству допустимых управлений, производящих траектории, которые целиком расположены в X .
Пусть , где симметричная положительно определенная матрица является решением уравнения Риккати с параметрами, зависящими от состояния (SDRE),
.(2.62)
Тогда условие асимптотической устойчивости (2.59) будет иметь вид
.(2.61)
Добавление 2.7.1. В задаче дифференциальной игры условие асимптотической устойчивости вида (2.59) дополняется условием: матрица
(2.63)
должна быть, по крайней мере, положительно полуопределенной.
Следует заметить, что при сделанных предположениях управления (2.50) обеспечивают локально асимптотические свойства стабилизации SDC-представлению нелинейной системы. Однако, асимптотическая стабилизация может не иметь место в исходной нелинейной системы с синтезированными SDRE-методом управлениями и произвольным начальным состоянием (глобальная асимптотическая стабилизация).
В качестве альтернативы глобальной асимптотической устойчивости, которую обычно трудно достичь и/или доказать, желательно иметь возможность оценки области притяжения для асимптотической устойчивости системы с регулятором, синтезированным с использованием SDRE-метода. Это область в пространстве состояний, которая образуется траекториями асимптотически устойчивой системы управления, начинающимися из любого начального состояния системы, принадлежащего заданной области , в момент .
Для отыскания условий, которым должна отвечать область притяжений, введем в рассмотрение две системы
, (2.64)
, (2.65)
где и положительно определенная матрица − поточечное решение алгебраического уравнения Риккати (2.62).
Пусть . Тогда
(2.66)
Очевидно, что при будет , т.е. .
В окрестности нуля для стабилизированных систем (2.63) и (2.64) выполняется следующее соотношение
(2.67)
Уравнение ошибки при этом (2.66) будет иметь вид
. (2.68)
Введем функцию Ляпунова
,
где положительно определенная матрица − решение алгебраического уравнения (2.62) при . Тогда вблизи нуля для траекторий, порождаемых решениями уравнений (2.64), (2.65), будем иметь
Так как при ,
и , то для тех начальных условий, для которых при , условие
(2.69)
определяет область притяжения стабилизируемых траекторий системы, начинающихся из , для всех , удовлетворяющей канонической системе
.