Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
143
Добавлен:
12.05.2015
Размер:
6.2 Mб
Скачать

5.2. Метод максимуму л.С. Понтрягіна

Багато задач на знаходження оптимальних значень параметрів управління можна розв’язати з використаннямпринципу максимуму, розробленого академіком Л.С. Понтрягіним та його учнями – В.Г. Болтянським, Р.В. Гамкрелідзе та Е.Ф. Міщенком. Розглянемо приклад задачі на знаходження оптимальних параметрів управління.

Приклад

Рух ракети, яка запускається в космічний простір, описується її координатами , проекціями вектора швидкості на координатні осі. В цій задачі- маса ракети,- величина тяги,- кут між напрямом тяги та віссю. В цьому випадку рух ракети описується такою системою рівнянь:

,

,

,

в якій - секундна витрата маси;сумарні проекції сили тяжіння, опору атмосфери і т.д., які діють на ракету, включно із силою тяжіння.

Управління траєкторією ракети здійснюється за рахунок сили тяжіння двигуна; - параметри керування. Рух ракети обмежується певними початковими та кінцевими умовами. Наприклад, можна задати початкове положення, швидкість та маса ракети, що можна записати у вигляді:

,

,

,

де - фіксовані величини. Таким же чином задаються і кінцеві умови.

В технічних задачах виникає питання про знаходження найекономічнішої програми роботи моделі, наприклад, у випадку руху ракети програма буде більш економічною, чим меншу кількість палива буде витрачено. Це означає, що управління можна вибрати з умови мінімуму інтеграла

.

Функція , яка задовольняє всі обмеження і доставляє мінімальне значення інтегралу, називаєтьсяоптимальним управлінням. Далі введемо ряд понять, необхідних далі.Стан об’єкта задається, в кожний момент часу, числамиякі називаютьсяфазовими координатами об’єкта. Рух об’єкта, з математичної точки зору, полягає в тому, що його стан з плином часу змінюється, тобто величиниє змінними величинами, певними функціями часу. Цей рух об’єкта відбувається не самовільно, ним можна управляти, для цього об’єкт має засоби управління, їх кількісний вираз в кожний момент часу характеризуєтьсячисламиці числа називаютьсяпараметрами управління. Знаючи фазовий стан об’єкта в початковий момент часу, можна вибрати функції управління(для) і розрахувати рух об’єкта для, тобто можна знайти функції, які характеризують зміну фазових координат з плином часу. Тобто можна в певній мірі діяти шляхом вибору функцій керування. Величиниможна вважати координатами вектора), який називається векторнимпараметром керування. Величиниможна розглядати як координати вектора (точки)), яку називаютьфазовим станомоб’єкта. Кожний фазовий стан) є точкою- вимірного простору з координатами. Цей- вимірний простір називаєтьсяфазовим просторомоб’єкта, що розглядається, в ньому, у вигляді точок зображуються фазові стани об’єкта.

Для повного завдання руху об’єкта, слід задати його фазовий стан в початковий момент часу і вибрати функції керуваннядля, тобто вибрати векторну функцію

).

Ця функція називається управлінням. Завдання початкового фазового станута управлінняоднозначно визначає подальший рух об’єкта. Цей рух полягає в тому, що фазова точка

(),

зображує стан об’єкта, вона переміщується з плином часу, вона описує в фазовому просторі певну лінію, яка називається фазовою траєкторієюруху об’єкта, що розглядається. Пару векторних функцій, тобто управліннята відповідну фазову траєкторіюназиватимемопроцесом управлінняабо простопроцесом. Тобто станоб’єкта керуванняв кожний момент часу характеризується фазовою точкою). На рух об’єкта можна діяти за допомогоюпараметра управління ). Зміна величинз часом називаєтьсяпроцесом; процесскладається з управліннята фазової траєкторії. Процес повністю визначається, якщо задано управління, за умовита початковий фазовий стан.

Часто зустрічається така задача, пов’язана з об’єктами управління. В початковий момент часу об’єкт знаходиться в фазовому стані; необхідно вибрати таке управління, яке переведе об’єкт до завчасно заданого стану, відмінного від. В задачах такого типу вимагається, , щобперехідний процесбув «найкращим», наприклад, щоб тривалість переходу була найменшою. Такий «найкращий» перехідний процес називаєтьсяоптимальним процесом. Якщо мова йде про найменшу тривалість переходу, то такі процеси називаютьсяоптимальними з точки зору швидкодії.

Розглянемо систему диференціальних рівнянь

, (5.7)

яка описує поведінку певного об’єкта в часі. В момент часу змінніможуть означати координати точок, швидкості і т.п. Управління характеризується точками, якими можуть бути кількість палива, яке подається до двигуна, температура і т.п. Ці параметри задовольняють певні обмеження. Важається, що функціїнеперервні за сукупністю всіх аргументів і неперервно диференційовані за сукупністю фазових координат. За умови заданих початкових умов система (6.7) має єдиний розв’язок, якщо задати функціїіз значеннями з. Нехай вибрано припустиме управлінняі отримана фазова траєкторія з початковою умовою. Тоді система

, ,

має єдиний розв’язок за умови будь-яких початкових умов. З використанням отриманих функційбудується функція

.

Для оптимальності управління та траєкторіїнеобхідним є існування такої ненульової неперервної вектор-функції, яка відповідає функціям, що для будь-якогофункціязмінногодосягає в точцімаксимуму. В кінцевий моментмають місце співвідношення:

. (5.8)

Крім того, якщо задовольняють системи (6.6), (6.7), то функціїє сталими, а в умові (6.6) точкуможна замінити будь-якою іншою. Для оптимальних за швидкодією управліннята траєкторіїнеобхідним є існування такої ненульової неперервної вектор-функції, яка відповідає функціям, що для всіхфункція

змінної досягає максимуму в точці. В кінцевий момент часуматиме місце

. (5.9)

Якщо величини задовольняють систему

І виконується умова максимуму, то функція змінноїє сталою, а нерівність (6.9) можна перевіряти при будь-якому іншому значенні. З принципу максимуму Л.С. Понтрягіна можна отримати всі необхідні умови екстремуму – правило множників Лагранжа, умови Вейєрштрасса, Лежандра, рівняння Ейлера та ін.).

Приклад

Розглянемо задачу про оптимальну швидкодію для рівняння

|| ≤ 1,

у випадку, коли кінцевим положенням є початок координат. В цьому прикладі

,

.

В цих співвідношеннях є лінійною функцією від, її найбільше значення досягається, коли, або коли, причому, коли, та, коли(тоді). Останнє означає, що.

Таким чином оптимальне управління знайдено. Це Кусково-стала функція з двома інтервалами, де вона приймає сталі значення на кожному. На цих інтервалах приймає значення -1 та +1. Якщо, то, азростає за змінною. Оскільки, то, тобто кусок фазової траєкторії, який відповідає, є параболою. Аналогічно, коли, має місце

,

а є спадаючою функцією від,

,

тобто кусок фазової траєкторії, який відповідає управлінню , також є параболою. Оптимальна траєкторія, якщо вона існує, складається з кусків двох парабол, які належать вказаним сім’ям парабол, причому друга парабола повинна проходити через початок координат. Можна показати, що знайдені фазові траєкторії дійсно є оптимальними.

Соседние файлы в папке Холмская экзамен