- •РАБОЧАЯ ПРОГРАММА
- •СОДЕРЖАНИЕ
- •Тема 1. ОБЩИЕ СВЕДЕНИЯ О МЕТОДАХ ОПТИМИЗАЦИИ
- •1.1. Основные понятия и определения. Постановка задачи
- •Тема 2. МАТЕМАТИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
- •2.2. Определение выпуклости функций
- •2.3. Типы задач математического программирования
- •2.4. Связь между задачей математического программирования
- •Тема 3. ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ
- •3.3. Симплекс-метод решения задач ЛП
- •3.4. Симплекс-таблицы
- •3.5. Метод искусственного базиса
- •3.6. Информационные технологии линейного программирования
- •3.7. Двойственная задача линейного программирования
- •3.8. Двойственный симплекс-метод
- •3.9. Целочисленное линейное программирование
- •3.9.1. Алгоритм Гомори для полностью целочисленной задачи ЛП.
- •3.9.2. Алгоритм Гомори для частично целочисленной задачи.
- •3.9.3. Метод ветвей и границ решения целочисленных задач ЛП.
- •Тема 4. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ БЕЗ ОГРАНИЧЕНИЙ
- •4.1. Одномерная минимизация унимодальных функций
- •4.1.1. Метод Фибоначчи.
- •4.1.2 Метод золотого сечения.
- •4.1.3. Методы с использованием производных.
- •4.1.4. Методы полиномиальной аппроксимации.
- •4.2.2. Градиентные методы. Метод наискорейшего спуска.
- •4.2.4. Метод Дэвидона-Флетчера-Пауэла (ДФП) (метод переменной мет-
- •4.2.6. Обобщенный градиентный алгоритм.
- •4.2.7. Метод Ньютона.
- •4.2.9. Установка метода оптимизации в пакете MATLAB.
- •Тема 5. ЭКСТРЕМАЛЬНЫЕ НЕЛИНЕЙНЫЕ ЗАДАЧИ
- •5.1. Метод неопределенных множителей Лагранжа
- •5.2. Теорема Куна-Таккера
- •5.3. Квадратичное программирование
- •5.4. Метод допустимых направлений Зойтендейка
- •6.1. Метод линейных комбинаций
- •6.2. Метод отсекающих плоскостей Кэлли
- •6.3. Сепарабельное программирование
- •ТЕМА 7. МЕТОДЫ ОПТИМИЗАЦИИ УПРАВЛЕНИЯ
- •7.1. Дискретное динамическое программирование
- •7.3. Принцип максимума Понтрягина
- •7.3.1. Постановка задачи. Формулировка принципа максимума.
- •7.3.3. Принцип максимума в задачах о максимальном быстродействии.
- •7.4.1. Определение моментов переключения.
- •ЛИТЕРАТУРА
- •Содержание
- •Лабораторная работа № 1
- •Лабораторная работа № 2
- •Лабораторная работа № 3
- •Лабораторная работа № 4
- •ЗАДАНИЯ ПО КУРСОВОЙ РАБОТЕ
- •Задание 1. Линейное программирование
- •Задание 2. Нелинейное программирование
- •Задание 3. Математическое описание линейных систем
Для определения постоянных интегрирования C1 и C2 необходимо
задать начальные условия для функции Ψ(t) . Однако они не могут зада-
C2 |
Ψ1(t) |
ваться независимо, так как их выбор |
tоднозначно определил бы какой-то процесс x(t) из всей совокупности и
-C1T |
|
при этом не были бы уточнены гра- |
||
|
ничные условия, которым этом про- |
|||
u*(t) |
|
цесс должен удовлетворять. |
||
+Umax |
|
Задача может быть решена до конца |
||
|
следующим образом. Считая управ- |
|||
0 |
t |
ляющее воздействием известным, ин- |
||
t1 |
тегрируют уравнение объекта управ- |
|||
-Umax |
||||
ления. Затем, используя граничные |
||||
|
||||
|
|
условия для координат, получают |
||
Рис. 7.10. Вид функций Ψ(t) и u (t) |
систему алгебраических уравнений и |
|||
неравенств, которая однозначно оп- |
||||
|
к примеру 7.5 |
ределяет параметры |
оптимального |
|
|
|
процесса. |
|
|
На основании рассмотренного |
примера можно заметить, |
что функцию |
x&0 = f0 , а следовательно, и Ψ0 (t) можно не включать в выражение для H, если
функционал не содержит в явном виде управления u, так как в этом случае слагаемое Ψ0 f0 не влияет на максимизацию H.
7.3.3. Принцип максимума в задачах о максимальном быстродействии. В
задачах о максимальном быстродействии минимизируемый функционал характеризует время перехода системы из состояния x(t0 ) в состояние x(t1) и имеет вид
t1 |
|
|
J (x, u) = ∫dt = t1 |
−t0 , |
(7.55) |
t0 |
|
|
афункция f0 (x,u) ≡1.
Сучётом (7.55) составим функцию H1 , равную
n
H1 = Ψ0 + ∑Ψi fi (x,u) . (7.56)
i =1
139
|
Так как на основании (7.50) |
dΨ0 |
= 0 и |
Ψ = Const , максимум |
H |
1 |
реализу- |
|
|
||||||
|
|
dt |
0 |
|
|
||
|
|
n |
|
|
|
||
|
|
|
|
|
|
|
|
ется одновременно с максимумом функции |
H = ∑Ψi fi (x,u) , а из требования |
||||||
Ψ0 |
≤ 0 и max H1 = 0 вытекает, что max H ≥ 0 . |
i =1 |
|
|
|
||
|
|
|
|
||||
|
u(t) U |
|
|
|
|
С учётом сказанного, принцип максимума для систем, оптимальных по быстродействию формулируется следующим образом.
Для оптимальности системы по быстродействию необходимо существование таких ненулевых непрерывных функций Ψ1(t),Ψ2 (t),...,Ψn (t) , что для всех
t [t0 ,t1] функция H переменных u1, u2 ,..., ur в заданной области их допустимых значений достигает максимума, т.е. H (Ψ, x,u) = max H , причём величина max H
u U |
u U |
постоянна во времени и max H ≥ 0 .
u U
Согласно приведенным формулировкам принцип максимума даёт только необходимые условия оптимальности. Вопрос о достаточности условий сложен, поэтому в практических приложениях заранее интуитивно предполагают достаточность по физическому смыслу исследуемой системы.
Пример 7.6. ОУ описывается системой уравнений x&1 = x2 , x&2 = u . Найти
управляющее воздействие, которое за минимальное время переведёт объект из произвольного начального состояния в равновесное x1 = 0; x2 = 0 , при этом
u ≤1.
Составим функцию H (Ψ, x,u) = Ψ1x2 + Ψ2u и определим максимум H по пе-
ременной u: dHdu = Ψ2 = 0 . Это равенство может выполняться только при нулевой функции Ψ2 (t) , поэтому максимум H достигается на границе области допусти-
мых |
управлений |
|
u |
|
=1. |
Для нахождения |
Ψ2 (t) |
|
|
воспользуемся уравнениями |
||||||
|
|
|
|
|||||||||||||
|
dΨi |
= −∂H : |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
||||||
|
dt |
∂xi |
|
|
dΨ2 |
|
|
|
|
|
||||||
|
|
|
|
|
|
|
dΨ1 |
= − ∂H = 0, |
= − |
∂H |
= −Ψ , |
|||||
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
dt |
|
∂x1 |
dt |
|
∂x2 |
1 |
|||
|
|
|
|
|
|
|
|
|
|
|||||||
откуда Ψ1 = Const = C1 , Ψ2 = C2 −C1t . |
|
|
|
|
|
|
||||||||||
|
|
Оптимальное управление u = SignΨ |
= Sign(C |
2 |
−C t). |
|||||||||||
|
|
|
|
|
|
|
|
2 |
|
|
1 |
140
Поскольку линейная функция Ψ2 (t) = C2 −C1t не более одного раза меняет знак, то один раз произойдёт переключение с u = +1 на u = −1 (рис. 7.11).
Следовательно оптимальная по быстродействию система будет релейной со специальным законом переключения по знаку вспомогательной функции Ψ2 = C2 − C1t . Момент окончания управления tk определится
достижением |
заданных |
x1 = x2 = 0 . |
|
Ψ2 (t)
C2
|
|
|
t |
|
-C1t |
Ψ2 (t) |
|
u |
|
|
|
|
|
|
|
+Umax |
|
tk |
|
0 |
|
t |
|
|
|
||
-Umax |
|
|
|
Рис. 7.11. Вид функции Ψ2 (t) и u* (t) к примеру 7.6
7.4. Оптимальное по быстродействию управление линейными объектами
Предположим, что объект управления описывается дифференциальным уравнением n-го порядка с постоянными коэффициентами, которое можно представить в виде системы из n уравнений первого порядка:
x1 = |
k1u − x1 |
, |
|
|
|
|
|
|
|
|
|
||
& |
|
T1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
k2 x1 − x2 |
, |
|
|
|
& |
|
|
|
|
(7.57) |
|
|
|
|
||||
x2 = |
|
T2 |
|
|||
|
|
|
|
|
|
|
............................ |
|
|||||
|
|
|
|
|
|
|
xn = |
|
kn xn−1 − xn |
|
|
||
|
|
|
|
. |
|
|
& |
|
Tn |
|
|
|
|
|
|
|
|
|
Требуется определить закон управления u(t) , при котором время перехода объекта из положения x(t0 ) в x(tn ) будет минимальным, если на управление наложено ограничение u ≤Umax .
Функция Гамильтона H имеет вид
141
H = |
k1u − x1 |
Ψ (t) + |
k2 x1 − x2 |
Ψ (t) +... + |
kn xn−1 − xn |
Ψ (t). |
(7.58) |
|
|
|
|||||
|
T1 |
1 |
T2 |
2 |
|
n |
|
|
|
|
Tn |
|
Управление u , максимизирующее H, определим из равенства
∂∂H = K1 Ψ1(t) = 0. u T1
Равенство (7.59) возможно только при Ψ1(t) = 0 , в соответствии с этим для
максимума H необходимо, чтобы u =Umax при Ψ1(t) > 0 и u = −Umax при
Ψ1(t) < 0 , т.е.
u (t) =Umax SignΨ1(t) .
∂∂Hu может зависеть от нескольких или от суммы всех со-
ставляющих вектора Ψ(t) .
Для определения характера управляющего воздействия нужно знать, сколько раз функция Ψ1(t) меняет знак или, иначе говоря, сколько корней имеет функция
Ψ1(t) . При прохождении функции Ψ1(t) через нуль каждый раз будет происхо-
дить смена знака управляющего воздействия. Моменты смены знака управляющего воздействия называются моментами переключения.
А.А. Фельдбаум в 1953 г. доказал теорему об n-интервалах, которая позволяет определить вид оптимального управления, не анализируя функции Ψ1(t): ес-
ли ОУ описывается линейным дифференциальным уравнением n-го порядка с постоянными коэффициентами и корни его характеристического уравнения вещественные отрицательные или нулевые, то для оптимального управления необходимо и достаточно n-интервалов максимального значения управления Umax , а
знаки на интервалах должны чередоваться (n −1) раз.
В соответствии с теоремой об n-интервалах оптимальное управление для рассматриваемого ОУ (7.57) имеет вид, показанный на рис. 7.12.
Следует отметить, что теорема об n-интервалах указывает только форму оптимального процесса, но не даёт закона определения продолжительности интервалов постоянства и моментов переключения.
142