- •ВВЕДЕНИЕ
- •1. ПРИМЕРЫ И КЛАССИФИКАЦИЯ ЗАДАЧ ПРИНЯТИЯ РЕШЕНИЙ. ОБЗОР МЕТОДОВ
- •2. ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
- •2.1. Основные понятия
- •2.2. Порядок решения экстремальных задач
- •3. ДИНАМИЧЕСКИЕ ЗАДАЧИ ПРИНЯТИЯ РЕШЕНИЙ
- •3.1. Постановка задачи оптимального управления
- •3.2. Функционал, его свойства, необходимые и достаточные условия достижения экстремума
- •3.3. Вариационные задачи на безусловный экстремум
- •3.4. Вариационные задачи на условный экстремум
- •3.5. Каноническая форма уравнений Эйлера. Принцип максимума
- •3.6. Практические примеры применения принципа максимума
- •3.6.1. Синтез программы управления мягкой посадкой космического летательного аппарата
- •3.6.2. Синтез системы стабилизации, оптимальной по быстродействию
- •3.6.3. Расчетный пример
- •4. МАТЕМАТИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
- •4.1. Линейное программирование: постановка задачи, основные понятия, графическая интерпретация
- •4.2. Симплекс-метод
- •4.2.1. Алгебраический вариант
- •4.2.2. Табличный вариант
- •4.3. Решение задач дискретного линейного программирования
- •4.4. Двойственная задача линейного программирования
- •4.5. Нелинейное программирование
- •4.5.1. Обобщенный метод множителей Лагранжа, условия Куна-Таккера
- •4.5.2. Численный метод зондирования пространства параметров
- •4.5.3. Методы безусловной оптимизации
- •4.5.4. Методы безусловной оптимизации первого и второго порядка
- •4.5.5. Прямые методы условной оптимизации
- •4.5.6. Непрямые методы условной оптимизации
- •4.5.7. Применение симплекс-метода для решения целочисленных задач нелинейного программирования
- •5. СТРАТЕГИЧЕСКИЕ МАТРИЧНЫЕ ИГРЫ
- •5.1. Основные термины и допущения. Формализация задачи. Принципы поиска решения
- •5.2. Общие методы решения стратегических матричных игр
- •5.2.2. Способы упрощения стратегических матричных игр
- •5.2.3. Решение стратегических матричных игр методом линейного программирования
- •5.2.4. Итерационный алгоритм Брауна-Робинсон
- •5.3. Примеры решения стратегических матричных игр
- •6. СТАТИСТИЧЕСКИЕ МАТРИЧНЫЕ ИГРЫ
- •Библиографический список
- •ОГЛАВЛЕНИЕ
ям, будет лежать на кривой χ+ (правой ветви кривой χ* на рис. 17, в), оптимальное по быстродействию управление будет иметь вид
1; если точка (x10, x20) окажется на кривой χ− – вид 2; левее кривой
χ*, объединяющей χ+ и χ− – вид 3; правее кривой χ* – вид 4.
В первых двух случаях переключение отсутствует, в последних двух - имеет место одно переключение в момент времени, когда
фазовая траектория достигает кривой χ*. Следовательно, кривая χ* является на фазовой плоскости (рис. 17) линией переключения для
оптимального управления. Уравнение кривой χ* дает условие переключения для оптимального управления:
x1 = − x2 x2 . 2um
Теперь можно записать уравнение оптимального по быстродействию закона управления следующим образом:
u(x |
|
)= u |
|
|
|
|
x2 |
|
x2 |
|
|
|
|
|
|
|
|
|
|||||||
, x |
m |
sign |
− x |
− |
|
|
|
. |
||||
|
|
|||||||||||
|
|
|
|
|
||||||||
1 |
2 |
|
|
1 |
|
2um |
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
Структурная схема оптимальной по быстродействию системы стабилизации показана на рис. 18.
Рис. 18
3.6.3. Расчетный пример
Пример 26. Объект управления описывается уравнениями
х1 = x2 , |
x2 = u . |
(33) |
|
|
|
Управление подчинено ограничению −1≤ u ≤ 2 . |
|
|
Требуется определить оптимальное управление и |
соответст- |
55
вующую траекторию (x1, x2 ), обеспечивающие стабилизацию
объекта за минимальное время (x1 (T)=x2 (T)=0, T → min ) при начальных условиях x1 (0)= –1,5; x2 (0)=3.
С учетом результатов, полученных в п. 3.6.2, отметим, что оптимальное управление в данной задаче может принимать значения
–1 и 2, причем возможно не более одного переключения. Возмож-
ные варианты: |
|
|
2) u= –1, t [0; T]; |
|||
1) u=2, t [0; T]; |
||||||
3) |
2 |
t [0; τ), |
4) |
-1 |
t [0; τ), |
|
u = |
t (τ; T]; |
u = |
2 |
t (τ; T]. |
||
|
-1 |
|
|
|||
|
|
|
|
|
|
Законы изменения переменных состояния объекта при воз-
можных значениях управляющего сигнала будут иметь вид: |
|
||||
u=2: x2 =2t+c1 , x1 =t2 +c1 t+c2 , |
|
|
|
(34) |
|
u= –1: x2 = –t+c3 , x |
= −t2 / 2 + c |
t + c |
4 |
. |
(35) |
1 |
3 |
|
|
|
Применим сначала формальный численный метод решения задачи.
Предположим, что имеет место один из простейших случаев, когда оптимальное управление постоянно. Тогда для полного решения задачи требуются три неизвестные: две константы, например, c1 и c2 , а также T по имеющимся четырем граничным условиям. Решение, очевидно, может быть найдено по любым трем из них. Признаком допустимости решения окажется его соответствие четвертому условию.
Рассмотрим первый из указанных выше вариантов управления
(u=2): x1 (0) = c1 = –1,5; x2 (0) = c2 = 3; x1 (T)=2T–1,5=0,
T=0,75. Проверим выполнение оставшегося граничного условия: x1 (T)=T2 +c1 T+c2 =0,5625–1,125+3=2,4375 ≠0. Вариант не соответствует условиям задачи.
Аналогичный вывод может быть получен и для второго варианта (u= –1).
Перейдем к более трудоемким для расчета вариантам. Для третьего варианта
2 t [0; τ), |
|
|
|
|
2t + c |
t [0; τ], |
|||||
u = -1 t (τ;T]; |
x2 |
= |
-t + c1 |
t [τ;T]; |
|||||||
|
|
|
|
|
|
|
|
|
3 |
|
|
|
t2 |
+ c t |
+ c |
2 |
|
t [0; τ], |
|||||
x1 |
|
|
1 |
|
|
|
|
|
|||
= - |
t2 |
+ c |
3 |
t |
+ c |
4 |
t [τ;T] |
||||
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|||
|
2 |
|
|
|
|
|
|
|
|
|
56
требуется найти шесть неизвестных: четыре константы, а также
значения τ и T. Для их определения используем четыре граничных условия и два условия припасовывания:
x1 (0)=c2 = –1,5, x2 (0)=c1 =3, x1(T)= - T22 +c3T +c4 = 0 ,
x2 (T)=–T+с3 =0;
x1(τ+0 )= − τ22 +c3τ+с4 = x1(τ−0 )= τ2 +3τ−1,5 ,
x2 (τ+0 )= −τ + c3 = x2 (τ−0 )= 2τ + 3 .
Полученная система уравнений имеет отрицательные значения
τ. Данный вариант не дает решения задачи. Для четвертого варианта
−1 t [0; τ), |
x2 |
|
−t + c1 t [0; τ], |
||||||
u = |
2 t (τ;T]; |
= |
2t + c3 t [τ; T]; |
||||||
|
|
|
|
||||||
|
|
|
|
2 |
|
|
|
|
|
|
x1 |
t |
|
+ c1t + c2 |
|
t [0; τ], |
|||
|
= - |
2 |
|
||||||
|
|
|
2 |
+ c3t + c4 |
|
t [τ; T] |
|||
|
|
t |
|
|
|
аналогично находим:
x1 (0)=c2 =-1,5, x2 (0)=c1 =3, x1 (T)=T2 +с3 T+c4 =0, x2 (T)=2T+с3 =0;
x1 (τ+0 )= τ2 + c3τ + с4 = x1 (τ−0 )= −τ2 / 2 + 3τ −1,5 , x2 (τ+0 )= 2τ+c3 = x2 (τ−0 )= −τ+3.
Получаемое квадратное уравнение для τ дает решения: τ1=1,
τ2=5. Им соответствуют T1=0, T2=6. Допустимым, очевидно, является только второе решение. Определив на основе используемых условий с3 и c4 , получим окончательный ответ:
|
−1 |
t [0; 5), |
|
− t + 3 |
t [0; 5], |
|
|||
u |
= |
2 |
t (5; 6]; |
x2 |
= |
t [5; 6]; |
|
||
|
|
|
2t −12 |
|
|||||
|
|
|
|
t |
2 |
3t −1,5 t [0; 5], |
|
||
|
|
|
|
(36) |
|||||
|
|
x1 |
= - |
2 + |
|||||
|
|
|
|
2 |
−12t + 36 t [5; 6]. |
|
|||
|
|
|
t |
|
|
Достигнутое значение критерия оптимальности Tmin=6.
Более удобным и наглядным оказывается решение рассматриваемой задачи с использованием фазовой плоскости. Воспользу-
57
емся некоторыми результатами, полученными для задачи о максимальном быстродействии в п. 3.6.2.
Уравнения фазовых траекторий для рассматриваемого приме-
ра:
при u=2: x1 −c2 = 14 (x22 −c12 ); при u=–1: x1 −c2 = − 12 (x22 −c12 ).
Через начало координат проходят траектории χ+, описываемая
уравнением |
x |
= x2 |
/ 4 и χ−, описываемая уравнением |
|
1 |
2 |
|
x1 = −x22 / 2 . Вместе они образуют на фазовой плоскости кривую
χ (рис. 19, а). Оптимальный по быстродействию вариант управления определяется положением точки, соответствующей начальным условиям, относительно данной кривой.
На рис. 19 для удобства решения задачи на кривые χ+ и χ− в соответствии с (34)...(35) нанесены точки с интервалом в единицу времени.
Положение начальной точки позволяет установить, что реше-
-1 t [0; τ),
ние задачи достигается при управлении u = ( ]
2 t τ; T .
Смещение кривой χ− до совмещения с начальной точкой (рис. 19, б) позволяет графически найти значения τ=5, T=6,
x1(τ)=1, x2(τ)= –2. Далее соотношения (34)...(35) позволяют легко получить полные результаты решения задачи (36).
Рис. 19
58