Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ШПОРА - КВИ.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
677.38 Кб
Скачать
  1. Функционалы, зависимые от многих функций: уравнения Эйлера, условие Лежандра.

Одним из обобщений простейшей вариационной задачи является задача отыскания экстремума функционала, зависящего от n функций (9)

при заданных граничных значениях для всех функций

. (10)

Требуется в классе функций C1[t0,t1] найти функции xi(t), i=1,2,…,n, проходящие через граничные точки (10) и доставляющие минимум функционалу (9).

Для получения необходимых условий экстремума рассматриваемого функционала будем варьировать лишь одну из функций xi(t), i=1,2,…n, оставляя все остальные функции неизменными. При этом функционал превращается в функционал, зависящий лишь от одной варьируемой функции, например, от xj(t) = и следовательно, функция, реализующая экстремум, должна удовлетворять уравнению Эйлера

.

Так как это рассуждение применимо к любой функции xj, j=1,2…,n ,то получаем систему дифференциальных уравнений Эйлера

, (11)

которая определяет совокупность необходимых условий экстремума вариационной задачи (9), (10).

Экстремали, соответствующие системе (11), содержат 2n постоянных интегрирования, находящихся из заданных граничных условий (10).

В современной литературе по теории оптимального управления полученный результат часто записывают в матричной форме. Введем в рассмотрение вектор и запишем функционалл (9) в следующем виде

Используя понятие производной скалярной функции от векторного аргумента Х

,

условия (11) можно записать в компактной матричной форме . (12)

(полный аналог скалярного уравнения Эйлера).

Используя матричные операции легко записать условия Лежандра для функционала (9). С этой целью введем в рассмотрение матрицу

, (13)

которая является аналогом скалярного выражения .

Для достижения на некоторой совокупности экстремалей минимума функционала (9) необходимо, чтобы все угловые миноры этой матрицы были неотрицательны, т.е.

, …, ,

где символ определителя. В математике условия (14) известны как необходимые и достаточные условия Сильвестра положительной определенности матрицы Г.

Для достижения максимума J неравенства (14) должны иметь противоположный знак.

Функционал (9) может содержать производные высших порядков. В этом случае система уравнений будет состоять из уравнений Эйлера-Пуассона.

  1. Применение классического вариационного исчисления к задаче оптимального управления, двухточечная краевая задача.

  2. Применение классического вариационного исчисления к задаче оптимального управления, уравнения Эйлера - Лагранжа в канонической форме.

Вспомним теперь формулировку задачи оптимального управления с закрепленными концами. Объект управления описывается уравнениями

.

Требуется найти вектор управляющих воздействий u(t) и соответствующую фазовую траекторию x(t) при условии, что X(t0) = X0, X(tk) = Xk и функционал

принимает экстремальное значение.

Очевидно, что сформулированная задача по существу является вариационной задачей и отличается от обычной вариационной задачи на условный экстремум только тем, что в нее входят два вида функций: функция X(t), характеризующая состояние системы, и функция управления U(t).Это отличие не принципиально и легко показать, что задача оптимального управления, удовлетворяющая основным положениям классического вариационного исчисления (отсутствие ограничений на фазовые координаты и управляющие воздействия, непрерывность и дифференцируемость управляющих воздействий), является общей задачей Лагранжа. Действительно, интеграл (9) можно рассматривать как функционал, зависящий от n+m функций x1,…,xn, u1,…,un.

Эти функции связаны дифференциальными уравнениями объекта (8), которые можно записать в виде уравнений связи

. (10)

Следовательно, для решения задачи оптимального управления, которая удовлетворяет основным положениям классического вариационного исчисления, можно использовать метод неопределенных множителей Лагранжа и записать необходимое условие экстремума функционала (9) при наличии ограничения (10) в виде уравнения Эйлера – Лагранжа. Согласно методу неопределенных множителей введем вспомогательный функционал

(11)

где

(12)

есть функция Лагранжа. Тогда уравнение Эйлера-Лагранжа будут иметь вид

(13)

В дальнейшем будем использовать, так называемую каноническую форму записи уравнений Эйлера-Лагранжа. Такая форма записи уравнения Эйлера-Лагранжа имеется в вариационном исчислении мы рассмотрим ее применительно к задачам оптимального управления.

Введем функцию, называемую гамильтонианом (функция Гамильтона).

(14)

(0=-1) и сравним ее с функцией Лагранжа (12). Выразим вспомогательную функцию L через гамильтониан H:

(15)

(т.е. к функции H добавлено слагаемое, которое отличает ее от функции L).

Запишем необходимое условие экстремума (уравнения Эйлера-Лагранжа) с использованием функции H. Для частных производных, которые входят в уравнения Эйлера-Лагранжа (13) согласно (15) имеем

(16)

Подставим найденные выражения в (13), получим уравнения Эйлера-Лагранжа в канонической форме:

Здесь уравнения (17а) являются уравнениями объекта (8). Уравнения (17б), записанные относительно вспомогательных переменных , образуют так называемую сопряженную к (17а) систему. Они согласно (14) имеют вид :

Уравнения (17в) являются алгебраическими. Действительно

Заметим, что значения функции, удовлетворяющие условию в виде (17в), называются стационарными значениями функции, а точки пространства аргументов, в которых эти условия выполняются - стационарными точками (стационарными называются точки, в которых производная функции равна нулю). Следовательно, оптимальное управление есть стационарная точка функции Гамильтона.

Уравнения (19) позволяют определить управление в виде функции

. (20)

П одставив (20) в (17а и б), получим систему дифференциальных уравнений:

(21)

X(t0)=X0 , X(tk)=Xk .

Общее решение такой системы, как известно, зависит от 2n параметров (начальных условий) поскольку управление найдено как функция (X и ). В задаче с закрепленными концами n параметров задано на левом конце фазовой траектории (X(t0)=X0), и n параметров на правом конце (X(tk)=Xk). Такая задача называется краевой.

Таким образом решение задачи оптимального управления оказалось сведенным к решению краевой задачи для систем дифференциальных уравнений. Отметим, что в силу только необходимости уравнений Эйлера-Лагранжа решения системы (17) не обязательно дают оптимальное управление, но только решение системы (17) могут претендовать на роль оптимального управления. С помощью уравнений Эйлера-Лагранжа обычно удается найти оптимальное управление и оптимальную траекторию системы, поскольку существование и характер экстремума функционала в конкретной задаче оптимального управления, как правило, известно заранее.

Пример. Определим из условия минимума функционала

(22)

оптимальное управление U(t) для объекта, описываемого уравнениями

составим функцию Гамильтона

. (24)

Уравнение Эйлера-Лагранжа имеет вид

(25)

Из последнего уравнения имеем (26)

Исключим из оставшихся двух уравнений . Для чего подставим уравнение (26) в первое уравнение (25)

,

откуда

Затем продифференцируем

После чего подставим во второе уравнение (25)

Окончательно имеем уравнение относительно x(t):

(27)

Решением этого уравнения является функция

(28)

где

Постоянные С1 и С2 определяются из граничных условий. Так как x()=0, то

(29)

и для выполнения (29) необходимо положить С1=0.

При t=0 имеем x(0)=x0, тогда

(30)

и для выполнения равенства (30) должно быть С2 = x0, следовательно

. (31)

Используя уравнение (23) – уравнение объекта, найдем

. (32)

Управление (32) найдено как функция времени и начальных условий – это так называемое программное управление.

В данном примере легко найти и управление в форме обратной связи. Из сравнений выражений (31) и (32) следует

(33)

закон обратной связи.

27

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]