Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
shpori_z_TK.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
985.16 Кб
Скачать

25. Принцип максимуму Гамільтона-Понтрягіна. Теорема (без доведення).

Розглянемо систему керування

(1) (2)

Критерій якості

(3)

(4)

(5)

Розглянемо таку оптимізовану задачу керування. Припустимо, що в цих всіх співвідношеннях - скалярна функція

- керування

- скалярні функції

- не залежить від

Треба знайти мінімум формула (3). Побудувати функцію Гамільтона для даної задачі:

(6)

(7)

Теорема. ( Принцип максимуму Гамільтона-Понтрягіна).

Нехай . Мають другі частинні похідні, неперервні за сукупністю змінних по своїх аргументах.

Функція Кусково неперервна при . Нехай - оптимальний розв’язок оптимальної задачі, сформульованої вище.

Тоді існують сталі та функції такі, що

1)

2) - розв’язок системи (7)

3) функція як функція керування при фіксованому досягає в області свого супремуму

(8)

4) , (9)

, (10)

(11)

(9), (10) – умови трансверсальності,

(11) – умови доповнюючої нежорсткості

26.Алгоритм принципу максимуму.

Центральна частина теореми це умова (8) Для оптимізаційної задачі будуємо функцію Гамільтона. Якщо існує розв’язок оптимізаційної задачі, то функція Н визначена на непорожній множині своїх аргументів.

Зафіксуємо х, ,to і знайдемо supH. Це зробимо в усіх точках t неперервності функції U. Якщо вдається знайти таку функцію U і довести, що ця функція U є єдиною, то ми можемо побудувати оптимізаційний розв’язок задачі про мінімізацію функціонала I(U) (1) (2)

(4)

(5)

Нам потрібно знайти , а

1) є V, t є [t0,t1]- знайшли вже

2)

3)x(t), ,U0-?

Розглянемо систему рівнянь (1) – (7) (7)

. (2n диференціальних рівнянь). Знайшовши розв’язок він би залежав від 2n довільних сталих. Для знаходження цих сталих можна використати умови , (9) , (10)

. (їх є 2n) в цих умовах є ще S+1 стала (а0,…,аs)

2n-умов 9, 10. r-умов (11).. (11)

s-r-умов (друге співвідношення (4)

Отже є 2n+S умов. Ще потрібна одна умова. Функція Гамільтона є однорідною функцією параметрів і а.

H(x, U, ,t, )= (x, U, ,t,a0) (3.12)

Звернемося до умови (3.8).

Нехай >0. Тоді з умов (3.8)

U(t, x, , )= (t, x, ,t,a0)

27.Оптимальний регулятор лінійної системи керування (на основі принципу максимуму).

Розглянемо лінійну систему керувань:

(4.1)

(4.2)

(4.3)

Немає ніяких обмежень.

Задача: Знайти min:I(U) .Будуємо функцію Гамільтона.

Вважаємо, що в 4.3 матриці Q1(t), Q2(t), Q3(t) є симетричними, при чому Q2(t) -додатно визначена.

Тут немає a0, немає gi(x0,x(t1)),тому ai=0,

Використаємо умову (3.8). Знайдемо для цього обчислимо gradUH(…)=0.

(4.4)

Ми знайшли в уявному вигляді:

(4.5) t є [t0,t1]

(4.6)

(4.7)

(4.2)

(4.8)

(4.9)

R(t)- невідома матриця

- розв’язок задачі

R(t1)x(t1)=-Q3x(t1)

28. Диференціювання функціоналів на траєкторіях систем керування з дискретним аргументом.

Розглянемо таку задачу.

Знайти мінімум функціонала

(2.1)

(2.2), j=1,2,…n

=0 (2.3)

Нехай рівняння (1.1) таке, що дозволяє у явному вигляді знайти функцію u. Якщо цю функцію підставити у , то одержали б функціонал вигляду (2.1)

Розглянемо наступний критерій функціонування системи.

(2.4)

(2.5)

(2.6)

(2.7 )

Щоб знайти похідну функціонала на траєкторії системи (2.5), введемо функцію

(2.8) – функція Гамільтона

Покажемо, що (2.9) на траєкторіях системи (2.3), а функція – це функція простір n, яка є розв’язком диф. рівнянь

(2.10)

(2.11)

Покажемо, що справджується (2.9) u(t) ~ x(t),t0,

Надамо цьому параметру u деякого приросту u(t)+δu(t) ~ x(t) + δx(t) δu(t) – варіація керування, δx(t)- варіація розв’язку.

Нехай ця траєкторія також виходить із точки . |

Розглянемо

= (2.12)

Якщо приріст функціонала можна подати у вигляді (2.12), то вектор (t)=

Покажемо, що цей має вигляд (2.9)

Нехай критерій якості функціонування системи керування має вигляд

. (6.1)

Математична модель системи керування задана у формі

, , , (6.2)

, , (6.3)

, . (6.4)

Умови (6.3) визначають обмеження на фазові змінні, а (6.4) – обмеження на керування.

Задача оптимального керування: знайти таке допустиме (кусково-неперервне або обмежено вимірне) керування , , щоб відповідна йому траєкторія

, ,

задовольняла умову: функціонал набуває мінімального значення або значення своєї точної нижньої грані.

Пару функцій називатимемо розв’язком задачі оптимального керування або оптимальним розв’язком.

У наведеній постановці задачі оптимального керування вважаються невідомими: вони залежать від керування і поряд з ним їх потрібно знайти. Таку задачу називають задачею з вільним часом.

Якщо і , то і задача (6.1)-(6.4) називається задачею про швидкодію.

Принцип оптимальності Беллмана. Якщо деяка траєкторія керованої системи (6.2) з’єднує дві точки та і є оптимальною траєкторією задачі (6.1)-(6.4), то траєкторія, яка з’єднує точки та , також буде оптимальною траєкторією при будь-якому виборі точки на оптимальній траєкторії .

Друге формулювання принципу оптимальності Беллмана. Нехай існує оптимальний розв’язок , задачі (6.1)-(6.4) і нехай довільний момент часу з проміжку . Тоді оптимальний розв’язок задачі (6.1)-(6.4) при визначається значенням при і не залежить від і при .

Третє формулювання принципу оптимальності Беллмана. Оптимальний розв’язок , задачі (6.1)-(6.4) збігається при з оптимальним розв’язком задачі, яка відрізняється від (6.1)-(6.4) лише тим, що початковий момент зафіксований і збігається з , а початкова точка фазової траєкторії зафіксована і збігається з , тобто

, (6.5)

де , – фіксовані.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]