Тема 25
.doc
	
		 
		
25. Элементы математической теории оптимального управления
25.1. Постановка задачи оптимального управления экономической системой
В отличии от метода динамического программирования, в теории управления экономическими процессами управление осуществляется непрерывно.
Критерии оптимальности управления обычно связаны либо с получением наибольшей прибыли, либо с достижением минимальных экономических затрат, либо с обеспечением минимального времени процесса. Самым распространенным на практике является критерий минимальных экономических затрат.
Пусть исследуемый экономический процесс, подлежащий управлению, представляет собой перепрофилирование производства, организацию дополнительных цехов, предприятий и т.д. с целью увеличения выпуска продукции. Обозначим y(t) - объем выпускаемой продукции в единицу времени, который естественно будет изменяться во времени t при перепрофилировании производства.
Пусть далее функция u(t) характеризует управление экономическим процессом. Она может представлять собой текущие инвестиции в процесс перепрофилирования, количество рабочей силы, направляемой для этой цели в момент времени t, число единиц специальной техники и т.п. Ясно, что вид функции y(t) зависит от того, какой будет выбрана функция u(t).
Кроме того, очевидно, что в каждый момент времени t текущие экономические затраты g будут зависеть от вида функций y(t) и u(t), т.е.
g = g(y(t), u(t), t).
Чтобы найти полные экономические затраты нужно проинтегрировать g в пределах от момента начала исследуемого процесса t0 до момента его окончания tk. Тогда критерием оптимальности управления является минимизация интеграла
,
где управление u(t) принадлежит некоторому классу U возможных функций, а y(t) определяется начальным состоянием системы и видом управления, т.е. видом функции u(t).
Определенный интеграл в правой части равенства является числом, которое зависит от выбора функции u(t). Если каждой функции из некоторого множества функций поставлено в соответствие определенное число, то говорят, что задан функционал. В приведенном выше интеграле J(y(t), u(t)) является функционалом.
Как правило, скорость увеличения объема продукции при перепрофилировании производства является функцией вида управления и самого объема производства. То есть имеет место дифференциальное уравнение:
,
здесь производная по времени обозначена точкой.
Кроме того, естественно, известно состояние экономической системы (объем производства) в начальный момент:
y(t0) = y0
и задано состояние системы в конечный момент (т.е. объем производства, на который производство должно быть перепрофилировано в момент окончания процесса):
y(tk) = yk.
Таким образом математически задача оптимального управления экономической системой может быть поставлена следующим образом:
Требуется определить функции u(t) и y(t), минимизирующие функционал

При
 этом   y(tk)
= yk
,
а  функции  y(t)
 и  u(t)
 связаны  дифференциальным  уравнением
  
 с  начальным  условием y(t0)
= y0.
В этом случае функция 
u(t)
 называется оптимальным управлением 
и  обозначается  u*(t),
а  y(t)
называется функцией оптимальных
параметров производства  и  обозначается
 y*(t).
Следует отметить, что в литературе обычно рассматривается более общий случай, когда экономическая система характеризуется не одной переменной (в нашем случае объем производства), а несколькими. При этом управление также включает ряд управляющих параметров. В этом случае y и u представляют собой вектор-функции: y(t) = (y1(t), y2(t), … yn(t)); u(t) = (u1(t), u2(t), … um(t)). Мы же рассматриваем простейший случай n = m = 1.
Поставленная выше задача называется задачей Лагранжа. Принцип оптимальности Лагранжа, согласно которому отыскивается вид оптимальной функции управления, является развитием задачи нахождения условного и безусловного экстремумов.
Рассмотрим алгоритм решения задачи Лагранжа.
- 
Составляется функция Лагранжа. Очень часто эту функцию называют  - функционалом:
 
.
- 
Составляется функция Гамильтона (гамильтониан) H, которая учитывает скорости изменения рассматриваемых функций:
 
                  
,
где
 
- неизвестная  функция  времени, которая
 называется  неопределенным множителем.
Доказана
 следующая  теорема: Пусть гамильтониан
H(
,
y,
u,
t)
дифференцируем  по  u,
существует   его  экстремум  в точке u*
и соответствующая  функция  y*(t)
 является оптимальной, т.е. дает экстремум
гамильтониану H
. Тогда можно найти такое оптимальное
значение  *
 и  оптимальную  функцию 
,
 что экстремум  гамильтониана H
совпадет  с  минимальным  значением 
функционала J(y,u).
Иначе говоря, у этих функционала  и 
гамильтониана  оптимальный  вид  функций
y*(t)
  и
 u*(t)
 совпадает.
В соответствии с этой теоремой можно получить следующие необходимые условия экстремума:
  и
  
.
Решение
 системы  из  этих  двух  уравнений 
позволяет  получить  оптимальную  функцию
 управления  u*(t).
При  этом  по условиям задачи Лагранжа
начальное условие для  
 неизвестно.  Обычно  задается  лишь 
конечное  условие  в  виде
.
Пример. Задана некоторая система, процесс функционирования которой описывается дифференциальным уравнением
                               
,
определяющим скорость изменения его основной характеристики y = y(t) в зависимости от управления u(t).
Известны начальное и конечное состояния системы: t0 = 0; tk=1; y(t0) = 0, y(tk) = 1. Найти оптимальное управление u* и соответствующую ему функцию y*, которые доставляют минимальное значение функционалу
![]()
Решение.
По
условию задачи 
и g(y,u,t)
= u2
+ y.
Составим -функционал
 и  гамильтониан:
                       
	
      
;
                                   
.
Для вычисления неопределенного множителя (t) продифференцируем гамильтониан по u и приравняем к нулю. Имеем
.
Откуда
.
Далее
,
откуда
.
Так как по конечному условию
,
то
  
.
  Отсюда   
.
Таким образом, оптимальная зависимость неопределенного множителя *(t) будет иметь вид:
.
В
последнем выражении неизвестным является
 *.
Для его нахождения  воспользуемся
исходным дифференциальным уравнением
.
Подставляя в это уравнение
![]()
и интегрируя, получим
.
Воспользовавшись начальным условием y(0)=0, получим C1=0.
Таким образом, имеем оптимальную функцию производства:
.
Подставляя
в это выражение конечное условие y(1)=1,
вычисляем 
.
Окончательно, оптимальная функция будет
иметь вид:
,
а оптимальная функция управления:
.
Минимальное значение функционала J(y, u) равно:
![]()
    
![]()
     
.
25.2. Принцип максимума Понтрягина
При решении задачи Лагранжа или задачи оптимального управления предполагалось, что управление носит неограниченный характер. На практике управление всегда ограничено по величине. Это ограничение связано с конечным значением возможностей управления.
Пусть ограничение на управление имеет вид, изображенный на рис.25.1.
	 По задаче Лагранжа
                                                                     
         
     



450

- umax 0 +umax u

Рис. 25.1. Реальный и идеальный случаи управления
Тогда
в место управления u
необходимо
использовать, как показано на рис.25.1,
нелинейную функцию 
,
которая будет являться аргументом
функционала Гамильтона. При такой
нелинейности дифференцировать
гамильтониан нельзя.
Впервые
задачу Лагранжа с ограничением решила
группа ученых под руководством академика
Л.С. Понтрягина. Решение задачи явилось
обобщением принципа Лагранжа.![]()
Запишем формулировку задачи принципа максимума Понтрягина: дан объект управления, модель которого описывается дифференциальным уравнением
=
.
Даны начальные условия y(t0)=y0 и заданы ограничения. Рассмотрим два ограничения
q1 (yk)= 0;
q2 (yk)= 0.
Аналогично даны ограничения по скорости изменения функций
	=
;
  
          
=
.
В отличие от предыдущей задачи добавляется еще ограничения на функцию управления
;
.
Необходимо определить оптимальный вид функций y* и u*, которые обеспечивают минимальное значение целевой функции I(y*, u*) при выполнении всех перечисленных выше ограничений. Т.е.
I(y,u)=
.
При решении, аналогично задаче Лагранжа, составляются функционалы Лагранжа и Гамильтона:
=
I(y,
u)+
q1[yk]+
q2[yk],
H=![]()
![]()
+![]()
- g(y,u).
    
Далее воспользуемся теоремой, которую называют принципом максимума Понтрягина:
Если
при оптимальных функциях y*
и
u*существует
минимальное значение целевой функции
I(y*,
u*)
при
выполнении  всех перечисленных выше
ограничений, то тогда можно найти такие
оптимальные функции 
,
,
,
,
при которых функционал Гамильтона
принимает максимальное значение, т.е.
.
Заметим, что в последнем выражении для нахождения управляющей функции u* не производится дифференцирование гамильтониана, а ее значение отыскивается путем перебора.
Сделаем несколько замечаний:
- 
Постановка задачи Понтрягина отличается от задачи Лагранжа тем, что включается дополнительное ограничение на управление.
 - 
Принцип максимума позволяет найти максимум функционалов на концах отрезка, как это изображено на рис. 25.2, т.к. он не требует дифференцирования гамильтониана.
 
	
H	


- umax 0 +umax u
Рис.25.2. Вид функционала Гамильтона на отрезке
При этом, если управление u невелико и концентрируется на небольшом отрезке, не достигая границ ограничения, то принцип Понтрягина сводится к решению задачи Лагранжа. Если управление выходит на границу отрезка, то задача решается в постановке Понтрягина и максимум гамильтониана отыскивается путем простой подстановки.
Пример.
Дана система, описываемая уравнением
.
Известно
начальное условие y(0)=0
и ограничение 
.
Найти оптимальное управление 
и соответствующую ему функцию
,
которые доставляют минимальное значение
целевой функции 
I(y,u)=
min.
Заметим,
что в условии примера управляющая
функция не входит в подынтегральную
функцию. Кроме того, отсутствуют
ограничения на конечное условие  q
и скорость изменения функции 
.
Легко убедиться, что в этом случае
функционал Лагранжа совпадает с целевой
функцией  I(y,u).
Решение.
Приведем к постановке задачи Понтрягина.
Для этого обозначим 
и запишем гамильтониан в виде
H=![]()
u
 - y.
Применим к последнему выражению принцип Понтрягина
(
u
 -  y)
при ограничении
.
Выражение в скобках состоит из двух слагаемых, из которых второе не зависит от u. Тогда
(
u
 -  y)
= 
![]()
u
 при 
.
Следовательно,
 
.
По определению
.
Интегрируя, получим
.
Для вычисления постоянной воспользуемся соотношением
,
но
- функционал в условии задачи не зависит
от y(tk).
Поэтому полагаем 
=0.
Кроме того, по условию задачи tk =4, тогда
.
Откуда C1=-4. Следовательно
.
Построим эту функцию
	
	![]()







0 4 t
-4
Рис.25.3. График функции неопределенного множителя
Из
рис.25.3 видно, что на отрезке [0,4], на
котором производится минимизация
целевой функции I(y,u)
, множитель 
.
Так как 
,
то 
.
Подставив это значение в исходное
дифференциальное уравнение, найдем 
.
Интегрируя последнюю формулу, находим
.
С учетом начального условия  
получим 
.
Тогда
I(
)=
.
При любом другом управлении меньшее значение получить нельзя.
Пример.
Найти оптимальное управление в системе, описываемой уравнением
.
Дано
начальное условие y(0)=0
и ограничение 
.
Найти оптимальное управление 
и соответствующую ему функцию
,
которые доставляют минимальное значение
целевой функции
I(y,u)=
min.
Решение. Так как ограничения на конечные значения отсутствуют, то
I(y,u).
Обозначим
и составим
гамильтониан 
H=
u
 - (u2
+ y).
Применим принцип Понтрягина
(
u
 -  y
– u2)
при ограничении
.
Рассмотрим
в начале интервал
.
Необходимое условие экстремума дает
![]()
–2
u=0.
Откуда
при
.
Для
вычисления 
воспользуемся
.
Аналогично вычислениям в примере 2 получаем
.
Вид этой функции показан на рис.19.3 . Подставляя полученную функцию в выражение для u, получим
.
Но
,
тогда        
.
Откуда 2 < t
< 6.
По
условию задачи правый конец интервала
=4,
поэтому принимаем
2
< t
 4.
Теперь
рассмотрим случай, когда 
.
В соответствии с проведенными вычислениями
и рис.19.3 этот случай может быть только
на отрезке   0 
t
 2. Аналогично вычислениям в примере 2  
.
Из
рис.19.3 видно, что на отрезке [0,2], на
котором производится минимизация
целевой функции I(y,u)
, множитель 
.
Тогда 
.
Таким образом, управляющая функция будет иметь вид
![]()
Тогда, подставляя управляющую функцию в исходное уравнение, оптимальная система с точки зрения заданного критерия и ограничений будет описываться дифференциальным уравнением
![]()
На рис.25.4 показаны полученные функции.

	
		![]()
