
- •Раздел 1. Методологические основы теории оптимальных процессов
- •Раздел 1. Методологические основы теории оптимальных процессов
- •§1. Формализация задач оптимального управления
- •§2. Примеры моделирования задач управления
- •§3. Классификация задач оптимального управления
- •§4. Классы допустимых управлений
- •§5. Примеры задач оптимального управления
- •Вопросы для самопроверки
§2. Примеры моделирования задач управления
Пример 1.1 (о мягкой посадке ракеты на Луне). Пусть в момент t = 0 ракета массы m находится на высоте h над поверхностью Луны и имеет скорость, направленную вниз. Зная предельное значение силы тяги двигателя и коэффициент пропорциональности расхода топлива к силе тяги двигателя, построить математические модели следующих задач:
выбрать такой режим работы двигателя, чтобы в некоторый заданный момент времени t =T ракета совершила мягкую посадку на поверхности Луны;
мягкую посадку совершить с минимальным расходом горючего.
Прежде всего, введем необходимые обозначения: x(t) – высота ракеты над поверхностью Луны в момент t, t[0,T]; u(t) – сила тяги двигателя в момент t; q(t) – расход топлива в момент t; – коэффициент пропорциональности q(t) и u(t); umax – предельное значение силы тяги двигателя (const). Тогда математическая модель задачи I (задачи управления) выглядит так:
Здесь x(t) – фазовый параметр, u(t) – параметр управления, U = [0,umax] – множество допустимых значений управляющих параметров, l – ускорение свободного падения на Луну.
Модель задачи II (задачи оптимального управления): к приведенной выше модели добавляется функционал качества
,
где J – общий расход топлива на отрезке [0,T].
В
этой задаче место (точка) посадки ракеты
не фиксировано, так как конечное условие
x(T) = 0
выполняется на всей поверхности Луны.
Поэтому из всех траекторий
(управлений
),
приводящих ракету на поверхность Луны,
нужно найти оптимальные в смысле
функционала J.
Однако даже если точка посадки была бы фиксирована, то все равно имеет смысл ставить оптимизационную задачу, так как существует множество траекторий (управлений), приводящих ракету в момент t =T в заданную точку.
Пример 1.2 (об экономическом росте). Одной из важных задач ведения хозяйства на макроуровне (на уровне национальной экономики) является так называемая задача об экономическом росте, т.е. поддерживание роста экономических показателей на длительный период времени. Эту задачу можно формализовать и исследовать методами теории оптимальных процессов. Модель основывается на тенденциях уровня жизни, оцениваемых величиной потребления на одного рабочего. Цель управления состоит в выборе допустимой траектории на одного рабочего, вдоль которой достижима максимальная полезность от потребления товаров.
Горизонт
экономического планирования есть
[t0,T].
Для любых t[t0,T]
введем в рассмотрение следующие величины:
за фазовое состояние экономики возьмем
капиталовооруженность на одного
рабочего (k(t));
через
обозначим выпуск продукции, приходящийся
на одного рабочего (в стоимостном
выражении); c(t)
– потребление на одного рабочего (в
стоимостном выражении);
– коэффициент поддержания
капиталовооруженности на прежнем
уровне.
Считается известным начальный уровень капиталовооруженности k0 и задан конечный (к концу планового периода) уровень капиталовооруженности kT – цель управления.
Скорость изменения фазового состояния можно задать следующим уравнением:
С точки зрения центрального планирующего органа (правительства), обладающего властью над развитием всей экономики, управляющим параметром является c(t). Очевидно, должно быть:
0 c(t) f(k(t)), t[t0,T].
Задача
управления: найти такую непрерывную
функцию (управление)
,
которая в любой момент времени t
удовлетворяет приведенным выше
неравенствам и приводит систему из
состояния k(t0) = k0
в состояние k(T) = kT.
Для того, чтобы поставить оптимизационную задачу, вводят так называемую функцию полезности:
– число, оценивающее полезность (качество) потребления в момент t в объеме c(t).
Теперь оптимизационную задачу можно получить, присоединив к задаче управления требование о максимизации "суммарной" на [t0,T] полезности:
Недостаток
такого критерия заключается в том, что
полезность "будущего" (для t(t0,T])
потребления оценивается точно так же,
как полезность "сегодняшнего"
(t = t0)
потребления. Поэтому применяют такой
прием, как дисконтирование
полезности, т.е. "приведение"
полезности в любой момент t(t0,T]
к моменту t0.
Это достигается введением под интегралом
дисконтирующего множителя
,
так что для любого t(t0,T]
величина
есть оценка полезности W(c(t)) в момент t0. Эта оценка убывает с удалением t от t0, т.е. "близкое" потребление оценивается выше, чем "далекое".
Итак, задача оптимального управления, как модель задачи оптимального экономического роста, получается присоединением к задаче управления функционала вида