- •Методи динамічної оптимізації
- •Математичне формулювання задачі
- •Геометрична інтерпретація задачі оптимального керування
- •1. Методи варіаційного обчислення в задачах оптимального керування
- •1.1. Основні поняття варіаційного обчислення
- •1.1.1. Диференціал функціонала
- •1.1.2. Види екстремумів функціоналів
- •1.1.3. Необхідні й достатні умови екстремума функціонала
- •1.2. Найпростіша задача варіаційного обчислення
- •1.3. Рівняння Ейлера
- •1.4. Рівняння Ейлера-Пуассона
- •1.5. Умови трансверсальності
- •1.6. Функціонали, що залежать від декількох функцій
- •1.7. Варіаційні задачі на умовний екстремум
- •1.7.1. Постановка задачі
- •1.7.2. Рівняння Ейлера-Лагранжа
- •1.7.3. Основні задачі класичного варіаційного обчислення
- •1.8. Канонічна форма рівнянь Ейлера. Рівняння Гамільтона
- •1.9. Необхідні умови в канонічній формі для задачі Лагранжа
- •1.10. Необхідні умови в канонічній формі для задачі Больца
- •1.11. Дискретне рівняння Ейлера
- •1.12. Область застосування методів варіаційного обчислення
- •1.13. Застосування варіаційного обчислення для рішення задач із обмеженнями
- •1.14. Приклади обчислення екстремумів функціоналів у задачах оптимального керування
- •2. Принцип максимуму
- •2.1. Постановка задачі
- •2.2. Сутність принципу максимуму
- •2.3. Формулювання принципу максимуму
- •2.3.1. Задача з рухливими границями
- •2.3.2. Принцип максимуму для неавтономних систем
- •2.4. Задача про граничну швидкодію
- •2.5. Властивості функції Гамільтона
- •2.6. Геометрична інтерпретація принципу максимуму
- •2.7. Дискретний принцип максимуму
- •2.8. Застосування принципу максимуму для рішення задач оптимального керування
- •2.8.1. Оптимальне по швидкодії сау
- •2.8.2. Лінійно- квадратичні задачі керування
- •2.8.3. Чисельні методи рішення задач оптимального керування
- •2.9. Область застосування принципу максимуму
- •3. Динамічне програмування
- •3.1. Принцип оптимальності
- •3.2. Безперервні системи. Рівняння Беллмана
- •3.3. Рішення рівняння Беллмана
- •3.4. Дискретна форма методу динамічного програмування
- •3.5. Зв'язок динамічного програмування із принципом максимуму й варіаційним обчисленням
- •З.6. Область застосування методу динамічного програмування
- •4. Синтез оптимальних сау
- •4.1. Керованість і спостережуваність об'єктів
- •4.2. Аналітичне конструювання регуляторів
- •4.3. Синтез оптимальних сау об'єктами із запізнюванням у керуванні
- •4.4. Синтез оптимальних сау при ненульових заданих значеннях стану
- •4.5. Синтез оптимальних сау при наявності постійно діючих збурювань
- •4.6. Оцінка стану об'єкта керування. Регулятори стану
- •4.7. Спостерігачі зниженого порядку
2. Принцип максимуму
В 1956 р. в роботах Понтрягіна Л.С. був сформульований і доведений метод рішення задач оптимального керування, названий принципом максимуму.
Принцип максимуму є розширенням класичного варіаційного обчислення на випадки, коли керуючі впливи обмежені і являють собою кусково-безперервні функції.
Так
як функції керування
допускають розриви першого роду, то
координати
не
є гладкими, і канонічні рівняння
Гамільтона не можна застосовувати для
знаходження оптимальних керувань у
тому виді, у якому вони представлені в
класичному варіаційному обчисленні.
Через розриви першого роду варіація функції може бути великою, тоді буде великою також варіація функціонала, і при обчисленні його приросту треба враховувати нелінійні члени.
Було
введене поняття голчастої
варіації,
що являє собою імпульс малої тривалості
,
і обмеженої амплітуди. Оптимальне
керування з такими голчастими варіаціями
буде кусково-безперервне, тобто належить
до того класу функцій, у якому шукається
керування.
Строге доведення принципу максимуму з використанням поняття голчастої варіації керування досить складне й докладно викладено в літературі.
Ми розглянемо тільки деякі наочні докази, які пояснюють принцип максимуму.
Слід
зазначити, що принцип максимуму
створювався спеціально для рішення
задач керування. Тому на відміну від
класичного варіаційного обчислення,
де функції
й
рівноправні, у принципі максимуму
розглядають роздільно простір керування
розмірності
й простір станів розмірності
,
у яких виділяє області
,
причому
- замкнута, і
належить до класу кусково-безперервних
функцій, а
може бути відкритою або замкнутою
залежно від постановки задачі, а
-
безперервні функції. Приналежність
функцій
і
до різних класів має принципове значення
й викликає необхідність розглядати
простори
й
.
При доведенні принципу максимуму варіації піддається тільки керування, а результат розглядається на траєкторіях .
2.1. Постановка задачі
Об'єкт керування заданий рівнянням
де - замкнута область;
- обмежена відкрита область;
- належить до класу кусково-безперервних функцій.
Нехай
- стан об'єкта в робочому режимі.
- довільний стан, у який об'єкт попадає під дією несподіваного збурювання.
Задача керування полягає в тому, щоб повернути об'єкт із будь-якої точки в робочий стан , забезпечивши мінімум критерію
Формулювання необхідних умов оптимальності видозмінюється залежно від постановки задачі.
Розрізняють задачі з вільним або фіксованим часом, вільними або фіксованими границями.
Тип задачі може визначатися видом критерію оптимальності.
2.2. Сутність принципу максимуму
У класичному варіаційному обчисленні однією з необхідних умов існування екстремума функціонала є виконання рівності
Це справедливо для гладкої функції, заданої у відкритій області.
Для
замкнутої області зміни аргументу
,
у якій
,
максимальне (мінімальне) значення
функції
буде досягатися тільки на границі
припустимої області
,
тобто при
або
,
якщо в області
.
Ця гіпотеза одержала назву «принцип
максимуму» і потім була строго доведена.
У принципі максимуму вводиться в розгляд функція Гамільтона некласичного варіаційного обчислення
Допоміжні
змінні
задовольняють системі рівнянь
Система
(2.4) називається спряженою стосовно
системи (2.1). Вектор-функції
безперервні всюди, мають безперервні
похідні за винятком точок, у яких
припустиме керування терпить розрив.
При
оптимальній
функція
досягає максимуму на екстремалях
,
,
,
звідки й випливає принцип максимуму:
необхідно так підібрати
,
де
- замкнута область, щоб
досягала максимального значення.
Вздовж всієї траєкторії справедлива основна умова принципу максимуму
Вектор
пов'язаний з поверхнями рівня функціонала
так само, як вектор
у класичному варіаційному обчисленні.
дорівнює по модулю градієнту функціонала
,
але протилежно спрямований. Однак цей
зв'язок при доведенні принципу максимуму
не використовується. Для доведення
важливо лише існування якихось функцій
,
що задовольняють сполученій системі й
умові максимуму. Тому принцип максимуму
вільний від обмежень, що накладаються
характером
.
