- •Оглавление
- •57 58 Задача Больца и Майера
- •32 65 67 Уравнение Риккати. Пример
- •31 Расчет оптимальных параметров регулятора по уравнениям Риккати.
- •16. Уравнение Эйлера для многих функций и их первых производных.
- •39. Уравнение Эйлера.
- •14 41 Представление уравнений Эйлера для частных случаев.
- •13. 40 Уравнение Эйлера в развернутом виде.
- •46. Уравнение Эйлера для n – функций и их n первых производных.
- •9. Определение свойств уравнения Эйлера.
- •51. Задача Лагранжа. Синтез оптимальных систем.
- •61. Метод множителей Лагранжа.
- •18. Задача Лагранжа на условный экстремум при конечных связях.
- •49. Система уравнений Эйлера – Лагранжа при конечных связях.
- •19. Задача Лагранжа на условный экстремум при дифференциальных связях.
- •50. Система уравнений Эйлера – Лагранжа при дифференциальных связях.
- •17 47. Уравнение Эйлера - Пуассона.
- •1. Математическая постановка задачи оптимального управления.
- •2. Критерии качества.
- •60. Критерии качества методов оптимизации.
- •4. 69 Квадратичный критерий оптимизации.
- •5. 70 Задача оптимизации систем управления по расходу топлива
- •10. Функции близкие по ординате и производной
- •11. Исследование функционалов с закрепленными и подвижными границами.
- •12. 43 Определение условия трансверсальности.
- •15. 45 Определение теоремы Лежандра.
- •20. Области оптимального управления
- •21. 22 Определите гамильтониан
- •25. Теорема обn-интервалах
- •27. 64 Принцип оптимальности.
- •29. Постановка задачи аналитического конструирования регулятора.
- •30. Задача а. М. Лётова
- •33. Математическая задача определения параметров оптимальной настройки системы.
- •35. Оптимальное управление, обеспечивающее оптимальную стабилизацию режима работы объекта.
- •44. Задача о брахистохроне.
- •57. Задача Майера.
- •24 66. Системы, оптимальные по быстродействию.
- •3 68. Допустимое управление.
- •6.Определение функционала как переменной величины.
- •8. 38 Сравнительный анализ функции и функционалов.
- •1.2 . Различные виды функционалов
- •37. Формы аналитического выражения функционала.
- •7.Определение методов вариационного исчисления по исследованию функционалов на экстремум.
- •10. Функции близкие по ординате и производной
- •23. Теорема Понтрягина
- •63.Принцип максимума Понтрягина.
- •26. Постановка задачи. Постановка задачи оптимального управления.
- •28. Уравнение Беллмана.
- •62.Метод динамического программирования Беллмана.
- •34. Оптимизация типовых объектов из условия минимума квадратичного функционала.
- •36. Задача вариационного исчисления.
- •42. Граничные условия в задачах вариационного исчисления.
- •48. Вариационные задачи на условный экстремум.
- •59. Вариационная задача оптимизации при ограничениях на управление
- •1.2 . Различные виды функционалов
- •1.3 . Задача оптимального управления
- •52. Изопериметрические вариационные задачи.
- •53. Синтез оптимальных систем при изопериметрических связях.
- •54. Изопериметрическая задача. Оптимальная система по экономичности.
- •55. Изопериметрическая задача. Оптимальная система по быстродействию.
- •56. Изопериметрическая задача. Оптимальная система по производительности.
62.Метод динамического программирования Беллмана.
Динамическое программирование. Алгоритм
Динамическое программирование - один из наиболее мощных современных методов оптимизации. Основной областью его применения являются многошаговые процессы, т. е. процессы, развивающиеся во времени, что дало основание назвать этот метод "динамическим". Возникновение динамического программирования связывают с именем американского ученого Р. Беллмана, который в начале пятидесятых годов прошлого столетия предложил принцип последовательного анализа вариантов, названный впоследствии принципом оптимальности. Динамическое программирование опирается также на идею погружения оптимизационной задачи в семейство подобных ей задач. Благодаря этому приему, названному принципом инвариантного погружения, метод применим ко многим задачам, которые в исходной постановке не являются динамическими. Особенностью динамического программирования, выделяющей его среди других методов оптимизации, является форма конечного результата. Выигрыш при применении этого метода состоит прежде всего в том, что исходная задача разбивается на рад более простых задач. Эффект от применения динамического программирования к конкретной задаче оптимизации характеризуется тем, насколько велико такое упрощение.
Оптимизация многошаговых процессов с помощью динамического программирования включает в себя следующую последовательность действий:
постановка задачи;
инвариантное погружение. Функция Беллмана;
принцип оптимальности. Уравнение Беллмана;
стандартная процедура.
Постановка задачи
Пусть имеется некоторый объект (система), изменяющий свое состояние в дискретные моменты времени 1, 2, N, В каждый момент t из этой совокупности состояние объекта полностью описывается n–вектором, и процесс, определяется как собственной динамикой объекта, так и внешними управляющими воздействиями.Общая зависимость задается рекуррентным уравнением
(1)
Где - вектор-функция, определенная в области значений своих аргументов, х0- начальное состояние процесса (объекта, системы).
Вектор-функцию , назовем допустимым управлением или программой, если, гдеU(t) - заданные множества пространстваRr.Как видно из (1), течение процесса однозначно определяется выбранным управлением. Качество управления оценим величиной
где - скалярные функции, определенные в области значений своих аргументов, и рассмотрим задачу минимизации этой величины, называемой критерием качества, на множестве допустимых управлений. Допустимое управление, которое доставляет минимум критерию качества, и порожденный им в силу (1) процесс (траекторию), называют оптимальными.
Сформулированную задачу символически записывают следующим образом:
(2)
Она по сути является задачей МП, однако при больших N(типичная ситуация для процессов управления) число переменных в ней настолько велико, что применение других методов становится затруднительным или неэффективным. Поэтому при решении задачи (2) необходимо учитывать ее динамическую структуру.
Инвариантное погружение. Функция Беллмана
Первый шаг при решении экстремальных задач методом динамического программирования состоит во вложении конкретной задачи в семейство подобных ей задач. Этот шаг называют инвариантным погружением задачи. Любая задача оптимизации характеризуется рядом числовых параметров (числом переменных, постоянными, задающими ограничения и т. п.). При инвариантном погружении отвлекаются от заданных значений некоторых параметров и считают их переменными величинами. Выбор таких параметров есть в некотором смысле искусство: в каждом конкретном случае он зависит от опыта и изобретательности исследователя. Если говорить конкретно о задаче (2), то ее можно погрузить в следующее семейство:
(3)
где к - натуральное число, , а у – произвольныйn-вектор. Задача (2) выделяется из семейства(3) при к=1, у =x0.
Минимальное значение критерия качества в задачах (3) зависит, очевидно, от параметров у и к. Функция В(у, k), выражающая эту зависимость, называется функцией Беллмана.