- •Основные понятия.
- •1. Безусловная оптимизация (многомерные функции)
- •1.1 Методы первого порядка (градиентные методы)
- •1.1.1. Градиентный метод с постоянным шагом
- •1.1.2. Выпуклые функции и множества
- •Теорема
- •Определение.
- •Без доказательства
- •2.Теорема:
- •1.2. Градиентные методы (продолжение)
- •1.2.1. Градиентный метод с дроблением шага.
- •1.2.2. Метод наискорейшего спуска.
- •Без доказательства
- •1.2.3. Масштабирование
- •1.3. Метод Ньютона.
- •1.4. Многошаговые ( двухшаговые ) методы.
- •1.3.1. Метод тяжелого шарика
- •1.3.2. Метод сопряженных градиентов
- •1.3.3. Модификация Полака-Ривьера
- •1.5. Квазиньютоновские методы
- •1.6. Методы нулевого порядка (методы прямого поиска)
- •1.6.1. Методы аппроксимации
- •Метод покоординатного спуска
- •1.6.3. Метод симплексов (Нелдера-Мида)
- •1.6.4. Метод Пауэлла (сопряженных направлений)
- •1.7. Методы прямого поиска в задачах одномерной минимизации.
- •1.7.1. Метод квадратичной интерполяции.
- •1.7.2. Метод дихотомии ( половинного деления.).
- •1.7.3. Метод «золотого» сечения.
- •1.7.4. Метод Фибоначчи.
- •2. Условная минимизация.
- •2.1 Задача нелинейного программирования.
- •2.1.1. Ограничения типа равенства.
- •2.1.2. Ограничения типа неравенств.
- •2.2. Задача выпуклого программирования
- •2.3. Методы условной минимизации.
- •2.3.1. Метод проекции градиента.
- •2.3.2. Метод условного градиента.
- •2.3.3. Метод модифицированной функции Лагранжа.
- •2.3.4. Метод штрафных функций.
- •2.4. Двойственность звп
- •2.4.1. Двойственность злп
- •3. Линейное программирование
- •3.1. Основные понятия
- •3.2. Геометрическая интерпретация злп.
- •3.3. Условие оптимальности для злп.
- •3.4. Базис и базисное решение.
- •3.5. Симплекс - метод решения злп.
- •3.6 Транспортная задача
- •3.5.1. Построение первоначального опорного плана.
- •3.5.2. Построение оптимального плана. Метод потенциалов.
- •4. Решение переборных задач.
- •4.1. Метод ветвей и границ.
- •4.1.1. Задача о коммивояжере.
- •4.2. Динамическое программирование.
- •4.2.1. Абстрактная схема.
- •4.2.2. Вывод уравнения Беллмана.
- •4.2.3. Методика применения функции Беллмана для решения исходной задачи.
- •4.2.4. Примеры задач динамического программирования
- •5. Вариационное исчисление (ви)
- •5.1. Уравнение Эйлера-Лагранжа.
- •5.1.1. Частные случаи уравнения Эйлера-Лагранжа.
- •5.1.2. Задача о брахистохроне.
- •5.2. Вариационные задачи на условный экстремум.
- •5.2.1. Модельные задачи на условный экстремум.
- •6. Принцип максимума Понтрягина ( на примере задачи оптимального управления ).
- •6.1. Принцип максимума в задаче о быстродействии.
- •Список литературы
5.2. Вариационные задачи на условный экстремум.
Будем считать, что y - не одна функция, а набор из m функций , т.е. . Если они независимы, то уравнение Эйлера-Лагранжа надо писать для каждогоотдельно:
, i =,
Если между есть связь, то получаем задачу на условный экстремум.
5.2.1. Модельные задачи на условный экстремум.
1). Пусть в пространстве есть поверхность, а на ней две точки.
Определение: Линия, которая проходит по поверхности, соединяя эти две точки, и имеющая минимальную длину, называется геодезической.
Задача найти геодезическую, соединяющую две точки, может быть сформулирована, как задача вариационного исчисления.
Предположим, что поверхность задана уравнением j(,,x) = 0 (*)
j -дифференцируемая функция ;
x - независимая координата;
y1, y2 - функции от x;
тогда длина пути , соединяющего две точки , равна:
Надо найти минимум функционала при условии (*)
Т.о. получаем задачу на условный экстремум. Начальные условия :
начало и конец геодезической.
2) Изопериметрическая задача
Требуется найти линию заданной длины , ограничивающую max площадь .
Задача может быть поставлена так :
(**)
- длина линии.
S = max
Связи типа (*) называются локальными.
Связи типа (**) называются интегральными.
Задачи на условный экстремум типа (*) и (**) решаются методом множителей Лагранжа.
Обозначим ограничения следующим образом:
локальные : = 0, i =- сильные связи
интегральные : =, j =- слабые связи
Составлим функционал :
= F + +
Увеличилось количество неизвестных функций за счет .
Оказывается , что экстремальная траектория такова, что на ней справедливо уравнение Эйлера-Лагранжа для нового функционала относительно переменныхy и , то есть задача сводится к задаче на безусловный экстремум функционала . Введение каждого множителя Лагранжа(x) сопровождается появлением соответствующего нового уравнения Эйлера-Лагранжа относительно.
Пример:
Часто локальные связи задаются дифференциальными уравнениями.
- уравнения связи, (u - управление)
J =min
На плоскости имеются начальная и конечная точки. Надо выбратьu так , чтобы перевести систему из начальной точки в конечную, и функционал достигал экстремального значения.
*т.е. окончательный результат задачи - фазовая траектория.
Решаем методом множителей Лагранжа.
= +
Выписываем уравнение Эйлера-Лагранжа относительно параметров : ,,,,u.
= 0
= 0,
=(t)
(t) = 0 уравнение Эйлера-Лагранжа
= (t) ;=(t)
(t) = (t)
= 2u (t);= 0 2u (t) = 0
u =
и дадут уравнения связи.
Тогда получим :
(t) =
(t) =
u(t) = =
Т.о. , экстремальная траектория такова, что управление u - линейная функция. иопределяются из граничных условий на концах промежутка.
Т.о., мы сможем получить решение задачи, проинтегрировав исходную систему уравнений связи.
* мы получим новую фазовую траекторию.
Метод вариационного исчисления ориентирован на уменьшение перебора возможных значений. Так в нашем примере класс функций u(t) сужен и доведен до линейного.
6. Принцип максимума Понтрягина ( на примере задачи оптимального управления ).
Пусть некоторая физическая система описана системой дифференциальных уравнений:
,
где t - независимая переменная , в роли которой обычно выступает время.
, ... , - переменная состояния или фазовые координаты.
, ... , - переменные управления.
Если ввести векторные обозначения:
X =
U =
F =, то рассматриваемая система записывается в виде := F (X,U)
Требуется в классе кусочно-непрерывных (поэтому нельзя использовать вариационное исчисление) управлений, которые считаются допустимыми, найти U(t) такое, чтобы при переходе из начальной точки X(0) = =в заданную точку X(T) ==функционал I =достигал экстремума,
где - заданная гладкая функция.
Введем переменную , определив ее в виде интеграла с переменным верхним пределом:=
Тогда =(X,U)
Присоединив это уравнение к исходной схеме, получим:
= , i =
Важно отметить, что правые части уравнений новой системы не зависят от координаты . Если ввести расширенные n+1-мерные векторы:
X =
F =, то система= F (X,U)
Функционал I =(T) представляет собой конечное значение координатыи сформулированная выше задача сводится к задаче о достижении экстремума конечного значения координаты(будем иметь в виду минимизацию функционала ).
Метод принципа максимума Понтрягина является расширением классического вариационного исчисления на случай , когда управляющие воздействия ограничены и
описаны кусочно-непрерывными функциями.
Принцип максимума является необходимым условием оптимальности, для линейных систем - необходимым и достаточным.
Сущность принципа максимума состоит в следующем:
Наряду с системой =, i =(*),
описывающей движение управляющего объекта, будем рассматривать систему:
= -, i =(**),
составленную относительно некоторых вспомогательных переменных . Она называется сопряженной к (*).
Введем функцию Гамильтона:
H=
Вычислим частные производные: =,=.
Теперь с помощью функции Гамильтона системы (*) и (**) могут быть записаны так:
(***)
Система (***) называется гамильтоновой системой.
Необходимые условия оптимальности управления (принцип максимума) формулируется так :
Если управление U(t) и соответствующая ему траектория X(t) оптимальны ,то:
Существует ненулевая непрерывная (n+1)-мерная вектор-функция
(t) = , составляющие которой удовлетворяют гамильтоновой системе.
Функция Гамильтона
H = ( (t), F (X,U)) представляющая собой произведение вектора скорости, изображающей точки F (X,U) на вектор (t) , достигающее при каждом значении 0 < t < T максимума по U.
В момент времени t = T выполняются соотношения:
(T) 0 и H в момент T равна 0.
Пример:
Для системы минимизировать функционал I =при фиксированных концах траектории и фиксированном времени процесса.
Составим функцию Гамильтона:
H = ++=++
Определяем функции (t) , i = 0,1,2
= ;
= 0, =
= ;= 0 ,=
= ;= -,=+
Т.о. H = ++
Согласно условию 2 принципа максимума функция Гамильтона H должна достигать
максимума по u, т.е. = 0 2+= 0
u(t) =
Итак, для оптимального управления получен закон линейного изменения. Выше этот
результат был получен классическим вариационным исчислением.