- •1. Задача о брахистохроне
- •2. Основная задача. Обобщение. О численном решении.
- •3.Вариации допустимых кривых и функционала
- •4.Необходимое условие оптимальности в терминах вариации
- •5.Условие Эйлера
- •6. Обсуждение условий Эйлера
- •7. Теорема Гильберта
- •9. Канонические переменные и Каноническая система
- •8. Условие Вейерштрасса-Эрдмана
- •10. Присоединённая задача на минимум. Лемма 1 и 2
- •11. Присоединённая задача на минимум. Уравнение Якоби
- •12. Условие Лежандра-Клебша
- •13. Условие Якоби
- •14. Достаточное условие слабого минимума
- •15. Простейшая задача терминального управления (пзту)
- •16. Формула приращения критерия качества.
- •17. Игольчатая вариация. Оценка приращения траектории
- •18. Принцип максимума (Понкрягина)
- •22. Применение принципа максимума
- •19.Пример в тоу(теория оптимального управления).
- •20. Решение терминальной задачи, методом динамического программирования
- •21.Достаточное условие оптимальности.
22. Применение принципа максимума
Принцип максимума удобен для использования. В частности, с его помощью вычислялись траектории первых спутников.
При применении в основном используют 2 подхода:
1 Улучшение допустимых управлений.
Пусть дано некоторое управление . Вычисляем для него траекторию , и сопряжённую Вычислим гамильтониан:
и
Затем: . Если , то, очевидно, управление удовлетворяет условию максимума, то есть является экстремальным (подозрительным на оптимальное управление) согласно принципу максимума.
Если и максимум достигается на некотором , то по этому -малом строят игольчатую вариацию.
Из доказательства теоремы 2 видно, что существует такое ε, что то есть можно построить лучшее управление. С ним описанную операцию улучшения можно повторить.
2 Краевая задача принципа максимума.
Пусть в задаче функция f такая, что можно при каждом фиксированном вычислить , и пусть аргумент этой максимизации.
Тогда построим краевую задачу:
Система (17) – это система из 2n дифференциальных уравнений относительно неизвестных x(t) и и тогда управление , очевидно, удовлетворяет условию максимума и является экстремальным (то есть подозрительным на решение).
19.Пример в тоу(теория оптимального управления).
Пусть n=2, r=1 – уравнение движения,начальные условия: , время .Мн-во – терминальный критерий качества.
Выберем в качестве управления u(t): .
Очевидно, оно допустимое управление, так как одна точка разрыва Подсчитаем порожденную этим управлением траекторию.Рассмотрим , тогда из 1-го уравнения получим: .
аналогично находим: Рассмотрим :
2 Посчитаем цену этого управления:
3 Проверим для нашего управления выполнение условия максимума. Для этого нужно подсчитать сопр.траекторию :
Составим сопр. сист.:
Решим эту систему:
б) Подсчитаем на
4 Условие максимума.
Имеем: Подсчитаем
Наше исх. управление уд. усл. max и явл. экстремальным .
5 Покажем, что это управление не является опт-м. Это означает, что принцип максимума не является достаточным условием оптимальности.Выберем другое управление и подсчитаем траекторию:
и тогда Таким образом, То есть управление лучше чем не является оптимальной.
20. Решение терминальной задачи, методом динамического программирования
1 этап. Инвариантное погружение.
Рассмотрим произвольное число , и будем рассматривать траектории на . Получим задачу:
(18)
где – это часть допустимых управлений.
Это и будет семейство терминальных задач зависящие от двух параметров: .
Если в этом семействе положим , то придём к исходной задаче.
Оптимальное значение функционала в (18) назовём функцией Беллмана и будем обозначать .
2 этап. Построение уравнения Беллмана.
Возьмём некоторое положительное число и положим: u(t)=v(t) на , где v(t) – кусок допустимого управления.
Под воздействием v(t) траектория движения перейдёт от вектора .
Тогда имеем: (19)
Предположим, что, начиная с момента из состояния , система управляется оптимальным образом, тогда по определению функции Беллмана значение функционала будет следующим:
(20)
Предположим, что – кусок оптимального управления. Тогда будет выполняться соотношение:
(21)
(согласно принципу оптимальности Беллмана, а здесь кусок оптимальной траектории).
Разложим левые части в (20) и (21) в ряд при малых :
(22)
(23)
Сокращая обе части (22) и (23) разделив на и устремив к нулю получаем:
(24)
Из (24) вытекает:
(25)
(25) – уравнение для функции Беллмана относительно искомой функции . Это есть дифференциальное уравнение в частной производной, осложнённое операцией минимизации.
Чтобы его решить нужно задать краевые условия: они получатся из задачи (18), если в ней положить (тогда ) и то есть
(26)
3 этап. Достаточное условие оптимальности.
Предположим, что мы решили (25) и (26), и построили функцию Беллмана и нашли: