
- •Раздел 1. Методологические основы теории оптимальных процессов
- •Раздел 1. Методологические основы теории оптимальных процессов
- •§1. Формализация задач оптимального управления
- •§2. Примеры моделирования задач управления
- •§3. Классификация задач оптимального управления
- •§4. Классы допустимых управлений
- •§5. Примеры задач оптимального управления
- •Вопросы для самопроверки
§5. Примеры задач оптимального управления
Для демонстрации области применения теории оптимальных процессов приведем краткое описание некоторых задач оптимального управления, которые, благодаря их типичности, часто встречаются во многих учебниках по теории оптимальных процессов. Эти задачи относятся к различным областям человеческой деятельности: технике, экономике, экологии и др. Но в то же время они являются "учебными" и служат, в основном, для иллюстрации некоторых теоретических положений. Очевидно, задачи и модели, представляющие непосредственный практический интерес, должны быть более подробными, глубокими и сложными. Учебные задачи – это первое приближение к реальным практическим задачам, их упрощенный аналог.
Максимизация дальности полета аппарата в атмосфере. Рассматривается летательный аппарат, положение которого описывается следующими параметрами: дальность и высота полета, величина и угол наклона к горизонту вектора скорости. Роль управлений играют угол атаки и функция, отвечающая возможности изменять в полете геометрию крыльев (т.е. их эффективную площадь). Требуется найти такие управляющие функции, которые доставляют максимум дальности полета.
С точки зрения приведенной в §3 классификации, данная задача является детерминированной задачей Майера с фазовыми ограничениями, нефиксированным временем окончания и подвижным правым концом траектории. К этому же классу относится и следующая задача. Заметим, что в этом примере, как и в рассматриваемых далее, ограничения на фазовые переменные обязательно включают в себя условия неотрицательности. Помимо этого, здесь могут использоваться ограничения на максимальную высоту полета, развиваемую скорость и т.п.
Задача о максимальной высоте подъема вертикально взлетающей в атмосфере ракеты-зонда. Состояние ракеты задается значениями высоты, скорости и массы. Задача состоит в выборе тяги, которая максимизировала бы высоту подъема при свободной продолжительности полета.
Задача ракетодинамики в однородном поле (задача об оптимальном в смысле расхода топлива движении ракеты в пустоте). Рассматривается управляемый ракетный аппарат, фазовое состояние которого задается координатами в трехмерном пространстве, вектором скорости и значением массы. Управление осуществляется выбором направления и абсолютного значения тяги ракеты. Требуется так управлять ракетой, чтобы в фиксированный (конечный) момент времени она достигла заданной точки, имея определенную скорость и израсходовав минимум топлива (т.е. имея максимально возможную массу).
В результате формализации получаем задачу Майера, которая отличается от предыдущих фиксированным временем окончания и закрепленными концами.
Устранение колебаний спутника на круговой орбите. Для ориентации спутников вдоль вертикали часто используется эффект собственной устойчивости, обусловленный слабым градиентом поля тяготения. Этот эффект приводит к колебаниям при отклонении от положения равновесия, которые требуется погасить с наименьшими затратами топлива, если сглаживание колебаний производится с помощью ракетного двигателя. В качестве фазовых переменных берутся угол и скорость отклонения оси спутника относительно текущего радиуса-вектора центра масс на орбите, управлением является тяга реактивного двигателя.
Данная задача представляет собой задачу с минимизацией интегрального критерия качества (подынтегральная функция обычно представляется в виде суммы квадратов отклонений фазовых переменных от состояния равновесия), фазовыми ограничениями, закрепленными концами и нефиксированным временем окончания.
Определение состава и боевого порядка системы локальной противовоздушной обороны. Рассматривается система ПВО, состоящая из нескольких типов оборонительного оружия для отражения различных приемов налета, доступных противнику. Необходимо определить, сколько оружия и какого типа должно быть предусмотрено в системе обороны. Состояние системы определяется бюджетом, выделенным для ее создания и эксплуатации, управлением является выбор средств обороны и вариантов их размещения. Каждое оружие характеризуется первоначальной стоимостью и стоимостью эксплуатации, его эффективность описывается математическим ожиданием числа атакующих целей, пораженных до достижения ими рубежа бомбометания. При этом система ПВО должна минимизировать бомбовый потенциал (т.е. число бомб), пропущенный к обороняемым объектам за все рассматриваемое время.
Данная задача – стохастическая задача Лагранжа с фазовыми ограничениями, подвижным правым концом траектории и неограниченной продолжительностью.
Тактическое воздушное сражение. Рассматривается тактическое воздушное сражение определенной продолжительности между воздушными силами двух противников, наносящими удары по аэродромам или поддерживающими наземные силы. Обе стороны в любой момент операции распределяют свои силы для одновременного выполнения этих двух задач. Каждая сторона испытывает определенные потери в результате аварий, катастроф и т.д. и, кроме того, теряет самолеты пропорционально интенсивности вражеских атак на ее аэродромы. Для каждого из противников заданы пополнения как функции времени. Целевые функционалы представляют собой разности между общими числами самолетовылетов для поддержки наземных сил той и другой стороны за время операции.
Математическая модель рассматриваемой задачи является дифференциальной игрой двух лиц с фазовыми ограничениями, фиксированным временем, интегральными критериями качества и подвижными правыми концами траекторий.
Анализ танковой дуэли. Рассматриваются два танка, движущиеся навстречу друг другу по прямой линии. Каждый из них может выбирать скорость, которая изменяется от минимального до максимального значения и играет роль управления. Фазовой переменной служит расстояние между танками. В зависимости от этого расстояния определяются вероятности того, что тот или иной танк будет поражен в конце дуэли. (Эти вероятности зависят от бронезащищенности, эффективности оружия и т.п.) Очевидно, что каждый танк будет максимизировать вероятность поражения противника.
Эта ситуация моделируется стохастической дифференциальной игрой с противоположными интересами, где правый конец траектории подвижен, а время окончания нефиксировано.
Распределение температуры в тонком стержне конечной длины с теплоизолированными концами. Состояние объекта описывается функцией распределения температуры по длине стержня и во времени, роль управления играет плотность тепловых источников. Задача состоит в отыскании такого управления, для которого распределение температуры как можно быстрее достигает заданного состояния.
Эта задача является частным случаем задачи Лагранжа – задачей на быстродействие. В данном случае в этой задаче имеются ограничения на фазовые переменные (т.е на температуру стержня), оба конца траектории закреплены, а время окончания процесса нефиксировано (и подлежит минимизации).
Оптимальный режим процесса ферментации. Рассматривается процесс выращивания бактерий в условиях ограничения по питательному субстрату. Фазовыми переменными являются концентрации бактерий (биомассы) и продуктов их метаболизма (целевых продуктов), а управлением – концентрация субстрата. Критерий оптимальности – съем целевого продукта за определенное время или полученный за это время доход от реализации данного продукта.
По введенной классификации эта задача – детерминированная задача Лагранжа с фазовыми ограничениями, фиксированным временем окончания и подвижным правым концом.
Задача об оптимальном управлении возрастной структурой популяции. Рассматривается непрерывная модель возрастной структуры популяции, разделенной на две возрастные группы. Управление заключается в том, что в обеих группах может происходить "пополнение-изъятие", а целью управления является максимизация дохода от урожая, за вычетом издержек на пополнение. Фазовыми переменными здесь, очевидно, являются численности популяций, а саму модель можно трактовать, например, как процесс эксплуатации некоторого водоема посредством выпуска мальков и отлова взрослых экземпляров рыбы.
После формализации получается задача Лагранжа (максимизируется суммарный доход на всем рассматриваемом промежутке времени) с фазовыми ограничениями (численность популяции не может быть отрицательна и в то же время не должна превосходить некоторого предела, за которым начинается перенаселенность) и подвижным правым концом траектории.
Управление рубками на ограниченной территории леса. Рассматривается лесозаготовительное предприятие, действующее на определенном участка леса, на котором произрастают различные породы деревьев. Фазовыми переменными служат мощность предприятия и площадь леса, занятая каждой породой; управлениями являются инвестиции и интенсивность рубок; целевой функционал представляет собой прибыль леспромхоза за все время его функционирования. Уравнение динамики леса может учитывать смену одних пород другими, естественный прирост, деятельность предприятия, возникновение пожаров и т.п.
Получившаяся задача – задача Лагранжа с подвижным правым концом и ограничениями на фазовые переменные (условия неотрицательности, максимально возможная мощность предприятия, ограничения на площадь леса).
Задача об оптимизации мясозаготовок. На ферме имеется стадо скота. Ежегодно часть стада отправляется на мясозаготовки, причем доход фермы зависит от количества проданного скота. Численность стада возрастает за счет естественного прироста и уменьшается в результате мясозаготовок. Фазовой переменной выступает количество скота на ферме в конце каждого года после мясозаготовок, управляющим параметром – количество проданного на мясо скота. Требуется определить, каким образом ферма может получить максимальный доход за несколько лет при определенном минимуме ежегодных мясозаготовок и заданном значении поголовья скота на конец планового периода.
Математическая модель этой задачи является дискретной детерминированной задачей Лагранжа с ограничениями на фазовые переменные, фиксированным временем окончания и закрепленными концами (известно начальное поголовье и задан план на конец рассматриваемого периода). Критерий качества определяется как сумма ежегодных доходов, получаемых от мясозаготовок.
Сотрудничество организаций в выполнении совместного проекта. Несколько организаций приступают к выполнению заказа, состояние которого выступает в качестве фазовой переменной. При этом задано начальное состояние проекта и состояние, при достижении которого заказ считается выполненным. Весь объем работ разбивается на части и поручается различным исполнителям (организациям). Ставится задача выполнения заказа за возможно более короткий срок при заданных затратах. Управление интерпретируется как скорость выделения капитала для каждой отдельной организации, а каждая организация пытается минимизировать время выполнения своей части заказа. Подобная постановка может встречаться при составлении и реализации планов капитального строительства в случае нескольких субподрядных организаций.
В результате формализации получаем многокритериальную задачу оптимального быстродействия (т.е. дифференциальную игру) с закрепленными концами и нефиксированным временем окончания.
Задача оптимального распределения капитальных вложений в отрасли на заданном интервале планирования. Состояние отрасли описывается величиной основных производственных фондов, количество которых растет за счет капитальных вложений и уменьшается за счет физического и морального износа. Капитальные вложения в отрасль играют роль управлений, а критерий оптимальности процессов одновременно учитывает экономию капиталовложений, с одной стороны, и увеличение основных производственных фондов отрасли к концу рассматриваемого срока – с другой. Эту задачу можно обобщить на случай нескольких отраслей. Тогда распределение капитальных вложений нужно осуществить не только во времени, но и между отраслями, которые являются "конкурентами".
Эта задача является задачей Больца с подвижным правым концом и фиксированным временем окончания.
Оптимальное распределение ресурсов. Некоторая заданная начальная сумма денег затрачивается на приобретение оборудования двух типов А и В. С помощью этого оборудования организуется производство. Распределяя имеющиеся средства между различными типами оборудования, к концу срока эксплуатации получаем определенный экономический эффект. Затем амортизированное оборудование реализуют (частично или полностью), а вырученные средства используют как начальную сумму для следующего цикла, и т.д. Требуется найти такую стратегию распределения средств для покупки оборудования типов А и В в каждом цикле, чтобы обеспечить наибольший экономический эффект после фиксированного числа производственно-экономических циклов.
В результате моделирования получаем дискретную задачу Лагранжа (максимизируется сумма экономических эффектов по всем циклам), в которой, в отличие от предыдущей, правый конец траектории подвижный. Управляющими параметрами являются распределения средств между разными типами оборудования, а в роли переменных состояния выступают количества единиц оборудования типов А и В в каждом цикле.