Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
курсовая.docx
Скачиваний:
3
Добавлен:
29.02.2016
Размер:
96.73 Кб
Скачать

§1.Постановка задачи

В классе скалярных кусочно-непрерывных управляющих воздействий u(t), определенных на заданном временном промежутке T=, рассмотрим следующую квазилинейную задачу терминального управления:

J(u)=x(t*)→max, , x()=, (1.1)

, Hx(t*)+µh(x(t*))=g,

где µ-малый положительный параметр, x-n-вектор,g-m вектор (m<n). Остальные элементы задачи имеют соответствующее размеры, при этом A(t), b(t),

Предполагается также, что rank H=m.

Результаты, которые будут получены в дальнейшем, справедливы и для отрицательных значений µ, если только они достаточно малы по модулю. Поэтому будем считать областью изменения малого параметра некоторую окрестность нуля .

При некоторых достаточно общих предположениях оптимальное управление в задаче является релейным и сохраняет при этом структуру решения базовой задачи

, x()=, , (1.2)

Hx(t*)=g, J(u)=x(t*)→max,

которая формально получается из исходной при µ=0. Далее будет разработан и обоснован алгоритм, позволяющий для заданного натурального числа s,, построить релейное асимптотически субоптимальное управление s-го порядка в рассмотренной задаче. Точки переключения этого асимптотического приближения представляют собой полиномы Тейлора s-ой степени точек переключения оптимального управления, которые являются функциями малого параметра, причем функциями из класса Сp. Кроме того, будет показано, как можно использовать построенные асимптотические приближения для точного решения задачи (1.1) при данном значении малого параметра.

§2. Базовая задача

Первый этап алгоритма асимптотического решения задачи (1.1) состоит в нахождении оптимального управления в задаче (1.2). Причем заметим, что это задача в отличие от исходной является линейной.

Предположение 1.1. В задаче (1.2) существует оптимальное управление u0(t), t, которое является нормальным.

При этом предположении сопряженная переменная 0(t),соответствущая в силу принципа максимума оптимальному управлению, является решение начальной задачи

=0,

где 0 m-вектор множителей Лагранжа. Согласно принципу максимума

, tЗаметим, что коуправление представило также в виде t , а

Оптимальную траекторию, порожденную управление через .

Предположение 1.2. Коуправление , имеет конечное число нулей 01,…,t0t, занумерованных в порядке возрастания, при этом выполнены условия 0(t0j) rank(t0j), =m.

Тогда, как следует из (1.3), оптимальное управление является релейным: , а моменты 01,…,t0l и только они будут его точками переключения. Заметим также, что при сделанном предположении .

После решения базовой задачи введем в рассмотрение числа 0,1,…,l:0=k=(-1)k0,.

§3.Основная теорема

Прежде чем продолжить изложение алгоритма построения асимптотически субоптимальных управлений в задаче (1.1), докажем теорему, которая устанавливает структуру и асимптотические свойства решения этой задачи. Доказательство будет конструктивным, и поэтому предопределит дальнейшие вычисления. Оно основано на следующих соображениях.

Правдоподобной выглядит гипотеза о том, что при сделанных предположениях оптимальное управление в задаче (1.1) с достаточно малым по модулю µ является релейным и сохраняет структуру решения базовой задачи, т.е. имеет вид

1(µ),…,l(µ)), (1.4)

где

1,…,l )= (1.5)

Для того, чтобы доступное управление вида (1.4) было оптимальным в задаче (1.1), прежде всего необходимо, чтобы оно было допустимым. Это будет иметь место тогда и только тогда, когда моменты tj(µ), удовлетворяют системе уравнений

Hx (1.6)

где x ,,-траектория квазилинейной системы, порожденная управлением (1.5).

Далее, для оптимальности управления (1.4) необходимо, чтобы оно удовлетворяло принципу максимума, что будет иметь место только тогда , когда точки переключения tj(µ),являются нулями коуправления. Таким образом, если допустить, что оптимальное управление является нормальным, и –соответствующий ему m-вектор множителей Лагранжа, то этот вектор вместе с моментом tj(µ),должен удовлетворять системе уравнений

, (1.7)

где ,

*)=c-. (1.8)

Приведенные соображения лежат в основе доказательства теоремы, на которую опирается алгоритм асимптотического решения задачи (1.1).

Теорема. При выполнении предложений 1.1, 1.2 в задаче (1.1) с достаточно малым (по модулю) µ существует единственное оптимальное управление u0(t,µ), нормальным.Точки переключения tj(µ),этого управления и соответствующий ему в силу принципа максимума m-вектора множителей Лагранжа удовлетворяют системе уравнений (1.6), (1.7), причем tj(µ), tj(0)=t0j,, .

Доказательство. Прежде всего, убедимся, что система уравнений (1.6), (1.7) имеет решение. Для этого воспользуемся теоремой о неявной функции.

Введем в рассмотрении векторы y=( y0=(что позволяет записать систему (1.6), (1.7) в виде

R(y,µ)=0, (1.9)

где

R(y,µ)=

Вектор-функция R(y,µ) определена в области

где -некоторые достаточно малые положительные числа. При сделанных предположениях о гладкости функции, формирующих задачу (1.1), R(y,µ) принадлежит классу . В этом можно убедиться с помощью теоремы о дифференцируемости решений обыкновенных дифференциальных уравнений по начальных данных и параметрам, последовательно применяя ее на промежутках постоянства управления (1.5) к прямой и сопряженной (1.8) системы.

Заметим, что

u(t,t01,…,t0l)=u0(t), x(t,t01,…,t0l,0)=x0(t),

.

Тогда

Это означает, что R(y0,0)=0.

Матрица Якоби системы (1.9), при вычислении которой удобно пользоваться формулой Коши, имеет вид

, (1.10)

где )-( mматрица, ) -диагональная матрица l-го порядка, -( lматрица. В силу предположения 1.2 матрица (1.10) будет невырожденной.

Итак, для системы (1.9) или, что то же самое, (1.6), (1.7) выполнены все условия теоремы о неявной функции. Согласно этой теоремы, в некоторой окрестности нуля однозначно определены функции ,, ,удовлетворяющее (1.6) ,(1.7) и условиям , tj(0)=t0j, . Другими словами, при достаточно малом µ в задаче (1.1) существуют допустимое управление вида (1.4) и вектор Лагранжа ((t,) являются нулями функции (t,)=(t,)b(t), построенной по решению (t,), , сопряженной системы

= )=c (),

где(t,T,траектория прямой системы, порожденная управлением (t, tT.

Опираясь на предположение 1.2, с помощью теоремы о неявной функции (используется утверждение об однозначной разрешимости уравнений) нетрудно доказать, что при достаточно малом функция (t,, tT, обращается в нуль только в точках переключения управления (1.4), при этом (t,(t,T, что эквивалентно

(t,)b(t)(t,(t,)b(t)u, tT. (8.11)

Таким образом, управление (1.4) является нормальной экстремалью Понтрягина с m-вектором множителей Лагранжа (

Покажем, что экстремаль (t,), tT, будет оптимальным управлением, если мало. Предположим противное, тогда существует такая последовательность 0, что управление (t,tT, k=1,2,…, не является оптимальным в задаче(1.1) с . С помощью леммы Гронуолла нетрудно доказать, что при достаточно малом допустимые траектории прямой динамической системы в задаче (1.1) равномерно ограничены. Кроме того, эта система линейна по управлению, а множество значений управляющих воздействий представляет собой отрезок [-1,1], т.е. выпуклый компакт. Тогда , если в задаче (1.1) существует допустимое управление, то существует и оптимальное (в классе измеримых функций). Решение задачи (1.1) с =k обозначим через (t,k), t , и пусть (t, k), tT, - соответствующая оптимальная траектория. По предположению

Jk= J(( , k ))- J(( , k)) > 0, k = 1,2, … . (1.12)

Это приращение критерия качества модно представить в виде

(t, k)b(t)k) dt +O( k)+ k ()dt,k=1,2, …, ( 1.13)

где u (t, k)=(t, k)- (t, k), x(t, k) = (t, k) - (t, k), t .

В силу(1.11) первый интеграл в правой части равенства (1.13) при достаточно больших k неположителен. Отсюда и из (1.12) следует

)b(t)( )dt= 0,

что, в свою очередь, влечёт за собой сходимость последовательности функций )b(t) , t T, по мере к нулю. В дальнейшем сводимость по мере будем обозначать символом⇒. Поскольку ) = ()b(t), t T , равномерно сходится к коуправлению (t), , базовой задачи, которое обращается в нуль лишь в конечном числе точек, то ). Отсюда и из того, что ( )(t), следует u( ) (t).По теореме Рисса из любой последовательности измеримых функций, сходящейся по мере, можно выбрать подпоследовательность, сходящуюся почти всюду. Чтобы не усложнять обозначений, будем считать, что сама последовательность ( ), ,сходится почти всюду к (t), tT.Тогда ( ) → (t) равномерно на T.

Поскольку управление ( ), tT, k = 1,2, … , является оптимальным, то для него выполняется принцип максимума, т.е. существует такой нулевой вектор Лангранжа ( что почти всюду на T

(t,)b(t) (t,(t,)b(t)u, k = 1,2, … , (1.14)

где (t,), tT,-решение сопряженной системы = )=c (

Так как векторы Лагранжа определяются с точностью до положительного множителя, то без ограничения общности можно считать, что = , k = 1,2, …, где = (1, ). В этом случае из последовательности векторов () можно выбрать сходящуюся последовательность. Чтобы не усложнять обозначений, будем считать, что сама последовательность является сходящейся. Обозначим её предел через = (,,…,).

Понятно, что = 0. Тогда последовательность функций (t, ), t T, будет равномерно сходиться к решению (t), t T, начальной задачи

= (t), () = c , = ( …,).

Переходя к пределу в (1.14) при всюду на T

(t)b(t)(t) = (t)b(t)u. (1.15)

Поскольку моменты являются точками переключения управления (t), t , то из (1.15) следует

()b() = () - () = 0, j = .

Так как наряду с этим

( = () - (), j = ,

то при предположении 1.2 векторы будут коллинеарны. Отсюда с учётом равенства норм этих векторов получаем , и соответственно ,. Итак, (t, ), (t, )b(t) равномерно на Т. Используя этот факт, соотношения (1.14) и предположение 1.2, нетрудно доказать, что при достаточно большом k управление , , почти всюду имеет вид (1.5), где ) , где ) , тогда в силу однозначной разрешимости системы (1.9) в окрестности точки ( )

управление , , почти всюду совпадает с , если к достаточно велико, и как следствие J( . Полученное противоречие доказывает оптимальность , для достаточно малых .

Единственность оптимального управления доказывается аналогично, только неравенство (1.12) заменяется на равенство.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]