- •Оглавление
- •57 58 Задача Больца и Майера
- •32 65 67 Уравнение Риккати. Пример
- •31 Расчет оптимальных параметров регулятора по уравнениям Риккати.
- •16. Уравнение Эйлера для многих функций и их первых производных.
- •39. Уравнение Эйлера.
- •14 41 Представление уравнений Эйлера для частных случаев.
- •13. 40 Уравнение Эйлера в развернутом виде.
- •46. Уравнение Эйлера для n – функций и их n первых производных.
- •9. Определение свойств уравнения Эйлера.
- •51. Задача Лагранжа. Синтез оптимальных систем.
- •61. Метод множителей Лагранжа.
- •18. Задача Лагранжа на условный экстремум при конечных связях.
- •49. Система уравнений Эйлера – Лагранжа при конечных связях.
- •19. Задача Лагранжа на условный экстремум при дифференциальных связях.
- •50. Система уравнений Эйлера – Лагранжа при дифференциальных связях.
- •17 47. Уравнение Эйлера - Пуассона.
- •1. Математическая постановка задачи оптимального управления.
- •2. Критерии качества.
- •60. Критерии качества методов оптимизации.
- •4. 69 Квадратичный критерий оптимизации.
- •5. 70 Задача оптимизации систем управления по расходу топлива
- •10. Функции близкие по ординате и производной
- •11. Исследование функционалов с закрепленными и подвижными границами.
- •12. 43 Определение условия трансверсальности.
- •15. 45 Определение теоремы Лежандра.
- •20. Области оптимального управления
- •21. 22 Определите гамильтониан
- •25. Теорема обn-интервалах
- •27. 64 Принцип оптимальности.
- •29. Постановка задачи аналитического конструирования регулятора.
- •30. Задача а. М. Лётова
- •33. Математическая задача определения параметров оптимальной настройки системы.
- •35. Оптимальное управление, обеспечивающее оптимальную стабилизацию режима работы объекта.
- •44. Задача о брахистохроне.
- •57. Задача Майера.
- •24 66. Системы, оптимальные по быстродействию.
- •3 68. Допустимое управление.
- •6.Определение функционала как переменной величины.
- •8. 38 Сравнительный анализ функции и функционалов.
- •1.2 . Различные виды функционалов
- •37. Формы аналитического выражения функционала.
- •7.Определение методов вариационного исчисления по исследованию функционалов на экстремум.
- •10. Функции близкие по ординате и производной
- •23. Теорема Понтрягина
- •63.Принцип максимума Понтрягина.
- •26. Постановка задачи. Постановка задачи оптимального управления.
- •28. Уравнение Беллмана.
- •62.Метод динамического программирования Беллмана.
- •34. Оптимизация типовых объектов из условия минимума квадратичного функционала.
- •36. Задача вариационного исчисления.
- •42. Граничные условия в задачах вариационного исчисления.
- •48. Вариационные задачи на условный экстремум.
- •59. Вариационная задача оптимизации при ограничениях на управление
- •1.2 . Различные виды функционалов
- •1.3 . Задача оптимального управления
- •52. Изопериметрические вариационные задачи.
- •53. Синтез оптимальных систем при изопериметрических связях.
- •54. Изопериметрическая задача. Оптимальная система по экономичности.
- •55. Изопериметрическая задача. Оптимальная система по быстродействию.
- •56. Изопериметрическая задача. Оптимальная система по производительности.
34. Оптимизация типовых объектов из условия минимума квадратичного функционала.
Пример на применение динамического программирования для определения управления, минимизирующего квадратичный функционал.
Пример1. Рассмотрим объект, движение которого задается уравнениями
В качестве конечной точки x*выберем начало координат, т.е. положимx*=0. Качество процесса управления будем оценивать функционалом
(4.27)
Таким образом, речь идет об определении оптимальной стратегии , которая обеспечивает перевод фазовой точки из произвольного начального состояния в начало координат и при том так, чтобы на траекториях движения функционал (4.27) принимал наименьшее значение.
Выпишем функциональное уравнение Беллмана
(4.28)
Так как на управляющий параметр uне наложено никаких ограничений, то для определения минимума необходимо продифференцировать правую часть уравнения (4.28) поu:
(4.29)
Из (4.29) находим
(4.30)
и уравнение Беллмана принимает вид
(4.31)
Будем искать решение уравнения (4.31) в виде квадратичной формы
Тогда
Уравнение (4.31) принимает вид
Коэффициенты C1,C2,C3определяются из системы уравнений:
(4.32)
Система нелинейных алгебраических уравнений (4.28) имеет два вещественных решения
Эти решения в соответствии с (4.30) приводят к двум синтезирующим функциям
(4.33)
(4.34)
В результате получаем две линейные системы, причем линейная система, порождаемая функцией (4.34), оказывается неустойчивой и, следовательно, не может обеспечить перевод фазовой точки в начало координат.
Таким образом, оптимальная синтезирующая функция (оптимальная стратегия) задается равенством (4.33). На рис. 4.1 изображена структурная схема оптимальной системы.
Пример2. Рассмотрим простейшее уравнение
(4.35)
полагая, что на управляющий параметр uналожено ограничение
Будем решать задачу перевода переменной xиз произвольного начального значения в нуль.
Как следует из (4.26), уравнение Беллмана имеет вид
(4.36)
Оптимальное по быстродействию управление
(4.37)
Подставляя (4.37) в (4.36), получим уравнение
(4.38)
Найдем решение уравнения (4.38), полагая . Из соотношения
следует, что
(4.39)
здесь C*- произвольная константа. Прианалогичным образом найдем
(4.40)
Полагая, что равенства (4.38) и (4.40) справедливы при x=0, то в соответствии с граничным условием (4.25)C*=C**=0.
Функция задает минимальное время движения и может быть только положительной величиной. Из (4.39) и (4.40) следует тогда, что
(4.41)
Оптимальное по быстродействию управление, таким образом, определяется равенством
Как следует из (4.41), производная имеет разрыв в точкеx=0. Это ставит под сомнение справедливость функционального уравнения Беллмана (4.38). Однако, поскольку в оптимальном движении переменнаяне изменяет знак, функциюможно отдельно рассматривать прии при, а в каждой из этих областей функцияявляется непрерывно дифференцируемой. Это позволяет заключить о справедливости равенства (4.41).
Во избежании недоразумений отметим, что целью настоящего примера является не демонстрация того, как с помощью динамического программирования можно осуществлять синтез оптимального по быстродействию управления, а желание показать, что предположение о непрерывной дифференцируемости функции является весьма существенным ограничением метода динамического программирования, когда он применяется для непрерывных процессов. Этот пример также показывает, что для синтеза оптимального по быстродействию управления целесообразно использовать принцип максимума Понтрягина.