Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Экзамен по матану.docx
Скачиваний:
3
Добавлен:
01.03.2025
Размер:
824.71 Кб
Скачать

17. Задача оптимального управления для линейной системы с квадратичным функционалом без ораничений на управление.

Важным частным случаем задачи (1) является задача оптимального управления для линейной системы с квадратичным функционалом без ограничений на управление, т.е. когда U

(8)

Здесь C – симметричная матрица размерности n× n, D – положительно

определенная матрица размерности m ×m. Остальные параметры те же, что и в (1). Подобные задачи являются моделями многих систем управления. Минимизация квадратичного функционала может означать минимизацию средней ошибки управления, или, например, минимизацию энергии, расходуемой на управление. Для сформулированной задачи выполняется теорема 1, причем в данном случае можно решить задачу нахождения максимума функции Гамильтона. Тем самым мы найдем явную зависимость оптимального управления от сопряженных переменных. Далее выпишем уравнения принципа максимума. Поскольку у нас нет ограничений на концы , левый конец закреплен, а правый свободен, то . Составим гамильтониан:

(9)

Ограничений на управление нет, поэтому переменную u, на которой достигается максимум функции H , можно найти из условия равенства нулю вектора градиента . Подсчитаем сначала частную производную по от скалярного произведения . Обозначим: m – -вектор . Тогда

Следовательно,

(10)

Подсчитаем частную производную по от скалярного произведения . Для этого запишем его в координатах:

Учитывая, что , будем иметь

Таким образом,

(11)

Из представления гамильтониана (9) и полученных формул (10), (11)

следует:

(12)

Если – оптимальное управление, то оно доставляет максимум функции Гамильтона и, следовательно, удовлетворяет равенству

Это действительно точка максимума, так как матрица вторых производных функции H отрицательно определенна. Действительно, из (12) следует:

а так как по условию D – положительно определенная матрица, то – отрицательно определенная матрица.

Подсчет вектора-градиента аналогичен подсчету , поэтому

Следовательно, сопряженная система имеет вид

Получим условие трансверсальности для задачи со свободным правым и закрепленным левым концом с учетом вида критерия качества (8). Определим функции : . Запишем условия (7):

Это следует из того, что , =0

Первое условие можно не учитывать при решении задачи, поскольку константы никуда больше не входят. Поэтому рассматриваем только условие .

Таким образом, в рассматриваемой задаче для оптимального управления найдена формула, выражающая в явном виде зависимость его от сопряженных переменных. Выпишем краевую задачу принципа максимума:

Эта краевая задача достаточно хорошо изучена. Ее решение сводится к решению задачи Коши для уравнения Риккати, для решения которого разработаны численные методы.

18. Принцип максимума для дискретных задач.

Принцип максимума Понтрягина впервые был получен для непрерывных систем. Позже было доказано, что в общем случае для дискретных задач принцип максимума Понтрягина не имеет места. Это значит, можно привести примеры, в которых дискретное оптимальное управление не удовлетворяет условию максимума, т.е. гамильтониан не достигает на оптимальном управлении своего максимума. И все же при определенных условиях принцип максимума имеет место и в дискретном случае. Далее приведем формулировку принципа максимума для некоторых дискретных задач оптимального управления. Рассмотрим следующую задачу оптимального управления с закрепленным левым концом:

(1)

Предполагается, что функции , , непрерывны и имеют непрерывные частные производные по всем своим переменным, множество U ограничено и замкнуто. Как и в непрерывном случае, введем в рассмотрение функцию Гамильтона:

Пусть – некоторое дискретное управление, – соответствующая этому управлению дискретная траектория при начальном условии . Паре , поставим в соответствие разностную систему для вспомогательных переменных :

,

которая называется сопряженной для системы (1), а переменные – сопряженными переменными. Кроме этих понятий понадобится понятие множества достижимости для дискретных систем.

Определение 1. Множеством достижимости за один шаг системы (1) при ограничении называется множество всех состояний в пространстве En , в которые можно перевести точку a за один шаг с помощью допустимых управляющих воздействий :

1. Пусть в задаче (1) функция , т.е. будем рассматривать задачу минимизации конечного состояния:

(2)

Теорема 1. Пусть – решение задачи (2) и пусть множества достижимости за один шаг системы (1) выпуклы при любом . Тогда выполняется условие максимума:

,

где – решение сопряженной системы

(3)

при граничном условии

(4)

2. Пусть в задаче (2) дискретная система линейна по управлению, т.е. имеем задачу:

(5)

где – матрица размерности n × m.

Теорема 2. Пусть – решение задачи (5) и пусть множество U в условии (5) выпукло. Тогда выполняется условие

,(6)

где – решение задачи (3) – (4).

Эта теорема вытекает из предыдущей, поскольку в предположении выпуклости множества U множества достижимости на каждом шаге будут выпуклы. Кроме того, условие (6) означает условие максимума, так как в данном случае гамильтониан имеет вид:

Первое слагаемое в правой части не зависит от u , поэтому оно не влияет на точку максимума.

3. Рассмотрим задачу, линейную по переменным состояния:

где – матрица размерности n ×n , a вектор размерности n. Выпишем для этой задачи гамильтониан:

Следовательно, сопряженная система имеет вид

(7)

Теорема 3. Если – решение задачи (6), то выполняется условие максимума:

, (8)

где – решение системы (7).

4. Для системы, линейной по управлению, рассмотрим суммарный критерий качества, т.е. имеем задачу:

(9)

Функция Гамильтона в данном случае имеет вид

Теорема 4. Пусть в задаче (8) множество U выпукло, функция F выпукла по совокупности переменных . Тогда если – оптимальная пара, то выполняется условие

(10)

где сопряженные переменные удовлетворяют системе

(11)

с граничным условием

(12)

Пример решения дискретной задачи с обоими закрепленными концами.

Принцип максимума обеспечивает оптимальность найденного процесса, если дифференциальные уравнения процесса линейны, множество U выпукло, функция F выпукла по совокупности переменных . Рассмотрим на примере управляемую систему с обоими терминальными концами, с квадратичным функционалом и линейными ограничениями. Рассмотрим задачу оптимального управления:

(13)

1. Составляем функцию Гамильтона:

2. Вычисляем ее частные производные по и1 и и2:

.

(14)

3. Строим сопряженную систему уравнений:

(15)

4. К заданной выше системе присоединяем уравнение процесса:

(16)

Для удобства последующих расчетов в системе уравнений 3 и 4 проведем некоторые преобразования, так чтобы, в конечном счете, в уравнениях слева иметь зависимости от t, а справа - от t+1. Получаем:

(17)

Это позволяет удобным образом вести итеративный процесс, последовательно понижая значения t от 4 до 0. Исходя из последних четырех формул, с учетом граничных условий, получаем:

при t = 3:

при t = 2:

при t = 1:

при t = 0 c учетом начальных условий x1(0) = -1; x2(0) = 1:

На последней, нулевой итерации значения ψ1(0) и ψ2(0) даже не обязательно вычислять, так как уже имеется возможность удовлетворить начальным условиям. Последняя итерация приводит к двум линейным алгебраическим уравнениям с двумя неизвестными:

(18)

Решая эти уравнения, получаем: ψ1(4) = 3,8711; ψ2(4) = - 1,737. Если теперь подставить найденные значения ψ1(4) и ψ2(4) в правые части проведенных выше итераций, то можно вычислить искомые функции оптимального состояния , сопряженные функции ψ1(t), ψ2(t) и, согласно формулам (14), – оптимального управления . Проверим полученное решение. Подставим в исходные уравнения (13) полученные значения

Получим

Уравнения удовлетворяются.

В рассмотренном случае решение краевой задачи и точное оптимальное решение задачи теории оптимального управления удалось получить в аналитической форме. Это следствие относительной простоты задачи: выпуклый квадратичный функционал и линейные ограничения. В результате система конечно-разностных уравнений оказалась линейной, что позволило в аналитическом виде “протащить” до конца (до нулевой итерации) неизвестные значения ψ1(4) и ψ2(4), а затем точно определить их, решая систему (18). В более сложных случаях аналитические прогонки затруднительны, а порой и просто невозможны. Необходимо применять численные методы решения краевой задачи для обыкновенных уравнений.