- •Оглавление
- •57 58 Задача Больца и Майера
- •32 65 67 Уравнение Риккати. Пример
- •31 Расчет оптимальных параметров регулятора по уравнениям Риккати.
- •16. Уравнение Эйлера для многих функций и их первых производных.
- •39. Уравнение Эйлера.
- •14 41 Представление уравнений Эйлера для частных случаев.
- •13. 40 Уравнение Эйлера в развернутом виде.
- •46. Уравнение Эйлера для n – функций и их n первых производных.
- •9. Определение свойств уравнения Эйлера.
- •51. Задача Лагранжа. Синтез оптимальных систем.
- •61. Метод множителей Лагранжа.
- •18. Задача Лагранжа на условный экстремум при конечных связях.
- •49. Система уравнений Эйлера – Лагранжа при конечных связях.
- •19. Задача Лагранжа на условный экстремум при дифференциальных связях.
- •50. Система уравнений Эйлера – Лагранжа при дифференциальных связях.
- •17 47. Уравнение Эйлера - Пуассона.
- •1. Математическая постановка задачи оптимального управления.
- •2. Критерии качества.
- •60. Критерии качества методов оптимизации.
- •4. 69 Квадратичный критерий оптимизации.
- •5. 70 Задача оптимизации систем управления по расходу топлива
- •10. Функции близкие по ординате и производной
- •11. Исследование функционалов с закрепленными и подвижными границами.
- •12. 43 Определение условия трансверсальности.
- •15. 45 Определение теоремы Лежандра.
- •20. Области оптимального управления
- •21. 22 Определите гамильтониан
- •25. Теорема обn-интервалах
- •27. 64 Принцип оптимальности.
- •29. Постановка задачи аналитического конструирования регулятора.
- •30. Задача а. М. Лётова
- •33. Математическая задача определения параметров оптимальной настройки системы.
- •35. Оптимальное управление, обеспечивающее оптимальную стабилизацию режима работы объекта.
- •44. Задача о брахистохроне.
- •57. Задача Майера.
- •24 66. Системы, оптимальные по быстродействию.
- •3 68. Допустимое управление.
- •6.Определение функционала как переменной величины.
- •8. 38 Сравнительный анализ функции и функционалов.
- •1.2 . Различные виды функционалов
- •37. Формы аналитического выражения функционала.
- •7.Определение методов вариационного исчисления по исследованию функционалов на экстремум.
- •10. Функции близкие по ординате и производной
- •23. Теорема Понтрягина
- •63.Принцип максимума Понтрягина.
- •26. Постановка задачи. Постановка задачи оптимального управления.
- •28. Уравнение Беллмана.
- •62.Метод динамического программирования Беллмана.
- •34. Оптимизация типовых объектов из условия минимума квадратичного функционала.
- •36. Задача вариационного исчисления.
- •42. Граничные условия в задачах вариационного исчисления.
- •48. Вариационные задачи на условный экстремум.
- •59. Вариационная задача оптимизации при ограничениях на управление
- •1.2 . Различные виды функционалов
- •1.3 . Задача оптимального управления
- •52. Изопериметрические вариационные задачи.
- •53. Синтез оптимальных систем при изопериметрических связях.
- •54. Изопериметрическая задача. Оптимальная система по экономичности.
- •55. Изопериметрическая задача. Оптимальная система по быстродействию.
- •56. Изопериметрическая задача. Оптимальная система по производительности.
26. Постановка задачи. Постановка задачи оптимального управления.
Общая постановка задачи оптимального управления
Задача синтеза оптимальных систем управления относится к классу задач оптимального управления и формулируется как вариационная задача. При этом кроме уравнения объекта управления должны быть заданы ограничения на управление и фазовый вектор, краевые условия и выбран критерий оптимальности.
Пусть уравнение объекта задается в нормальной форме
или в скалярном виде
где — фазовый вектор;— управление или вектор управления. Как отмечалось в гл. 2, любое уравнение, разрешимое относительно старшей производной, можно преобразовать к равносильной нормальной системе.
На управление и фазовый вектор еще могут быть наложены ограничения в виде конечных соотношений — равенств, неравенств. Их в общем виде можно записать так:
Здесь — некоторые заданные множества, зависящие, вообще говоря, от времени, причемт. е.Ut— подмножествоr-мерного пространства;Xt — подмножествоn-мерного пространства. В (10.2) первое соотношение называется ограничением на управление, второе соотношение — ограничением на фазовый вектор или фазовым ограничением. Ограничения на управление и фазовый вектор могут быть не разделены, и в общем случае они записываются в виде
Краевые (граничные) условия — ограничения на фазовый вектор в начальный и конечный tfмоменты времени в общем виде можно записать так:
Вектор х(tо) называют левым, а вектор х(tj) — правым концом траектории. Краевые условия имеют вид (10.3), если ограничения на левый и правый конец траектории разделены.
В противном случае они записываются в виде
Критерий оптимальности, который является числовым показателем качества системы, задается в виде функционала
Задача оптимального управления формулируется следующим образом: при заданных уравнении объекта управления (10.l), ограничениях (10.2) и краевых условиях (10.3) требуется найти такие программное управлениеu*(t) или управление с обратной связьюu*(х(t),t) и фазовую траекторию х*(t), при которых критерий (10.4) принимает минимальное (или максимальное) значение. Дальше для определенности примем, что функционал (10.4) минимизируется. Задачу максимизации выбором нового критерияJ1=-Jвсегда можно свести к задаче минимизации. Управленияи траектория х*(t) называются оптимальными. При решении задач синтеза оптимальных систем управления- обычно бывает достаточно найти оптимальное управление.
28. Уравнение Беллмана.
Принцип оптимальности. Уравнение Беллмана
Составление уравнения для функции Беллмана представляет собой второй основной этап решения задачи методом динамического программирования. На этом этапе могут применяться различные рассуждения, но все они в той или иной степени опираются на принцип оптимальности, который Беллман сформулировал следующим образом: оптимальная политика обладает тем свойством, что каковы бы ни были начальное состояние и принятое начальное решение, последующие решения должны составлять оптимальную политику относительно состояния, возникшего в результате первоначального решения. При составлении уравнения для функции Беллмана выявляется правильность инвариантного погружения. С другой стороны, способ погружения сказывается на виде уравнения. Обратимся к задаче (3) с заданными значениями параметров у, kи положимгдеu- произвольный вектор из множестваU(k). Оставляя пока в стороне вопрос об оптимальности такого решения, постараемся распорядиться остальными переменнымиu(t),t= к +1,N-1, так, чтобы критерий качества принял минимально возможное значение, т. е. поставим перед собой следующую задачу:
Согласно определению функции Беллмана минимальное значение критерия качества в этой задаче равно
(4)
Минимум выражения (4) по есть, очевидно, оптимальное значение критерия качества в задаче (3), т. е. В(у, к). Таким образом,
(5)
Непосредственно из определения функции Беллмана следует
(6)
Объединяя (5) и (6), получаем для функции B(y,k) рекуррентно-функциональное уравнение
( 7)
(8)
которое называют уравнением Беллмана.
Из приведенных рассуждений также следует, что вектор u(y,k), на котором достигается минимум в (7), есть значение оптимального управления в задаче (3) в начальный момент времени.
Третий, заключительный, этап применения динамического программирования состоит в нахождении решения уравнения Беллмана и построении по нему оптимальной стратегии в исходной задаче. Решая рекуррентное уравнение (7), (8), последовательно получаем функции В(у, N), В(у, N -1),…, В(у, 1) и одновременно значения управления
(9)
на которых достигается минимум в (7). Понятно, что В(х0,1) - минимальное значение критерия качества в исходной задаче (2). Оптимальные управлениеи траекториярекуррентно вычисляются следующим образом:
(10)