
- •Казаков о.Л., Царькова н.И.
- •Содержание Введение………………………………………………………………….. 4
- •Введение
- •1. Модели оптимизации в экономике
- •1.1. Задача об использовании ресурсов (оптимального планирования производства)
- •1.2. Задача определения объема выпуска валовой продукции
- •1.3. Задача оптимального распределения валовых капитальных вложений
- •1.4. Задачи условной оптимизации
- •1.5. Метод множителей Лагранжа
- •Вопросы для самопроверки
- •Примеры решения задач
- •Задания для самостоятельной работы
- •2. Экономика как объект математического моделирования
- •2.1. Схема производства и распределения продукции, накопления и потребления
- •2.2. Классификация моделей экономических систем
- •2.3. Разновидности структурных схем управления экономическими системами
- •2.4. Формализованная производственно-технологическая модель экономики
- •2.5. Задачи оптимизации и оптимального управления в экономике
- •Вопросы для самопроверки
- •3. Модели оптимального управления в экономике
- •3.1. Задача оптимального управления развитием экономики
- •3.2. Модель развития экономики: магистральная теория
- •3.3. Задача оптимального управления распределением валовых капитальных вложений
- •3.4. Общий вид задачи оптимального управления
- •3.5. Метод решения задачи оптимального управления
- •3.6. Принцип максимума Понтрягина
- •3.7. Синтез оптимального управления
- •Вопросы для самопроверки
- •Примеры решения задач
- •Задания для самостоятельной работы
- •Заключение
- •Приложения
- •Приложение 2. Планирование центром оптимального распределения капитальных вложений между предприятиями методом динамического программирования
- •Приложение 3. Применение метода дп для поиска оптимального управления предприятием
- •Приложение 4. Учет начальных условий. Траектория выхода на магистраль
- •Приложение 5. Постановка задачи и критерии оптимального управления в динамических системах
- •Приложение 6. Построение траекторий управляемых процессов Непрерывные системы
- •Дискретные системы
- •Приложение 7. Поиск оптимального управления непрерывными детерминированными процессами методами Лагранжа-Понтрягина
- •Приложение 8. Принцип максимума для дискретных систем
- •Приложение 9. Постановка и решение задачи оптимального управления непрерывными процессами методом дп в общем виде
- •Список литературы
Приложение 7. Поиск оптимального управления непрерывными детерминированными процессами методами Лагранжа-Понтрягина
В общем виде управляемая динамическая система описывается системой дифференциальных уравнений первого порядка вида
, (П.7.1)
где xi – переменные состояния системы,
uj – управляющие воздействия,
fi – известные функции,
.
Заданы также интервал управления t = 0 ¸ T и начальное состояние системы .
Необходимо определить управляющий вектор , при котором в определенном смысле достигается наилучший результат, например, нужно минимизировать функционал вида
. (П.7.2)
Пусть непрерывные функции fi , f0 и F непрерывно дифференцируемы по xi и uj. Если на управляющие воздействия не накладываются ограничения, то такая задача нахождения оптимального управления принадлежит классу вариационного исчисления и относится к задаче Лагранжа.
Если на управляющие воздействия uj накладываются ограничения двух видов:
управляющие воздействия могут изменяться в допустимых пределах ½uj½£ uдоп ,
управляющие воздействия могут претерпевать разрывы первого рода, -
то такая задача нахождения оптимального управления может быть решена с использованием принципа максимума Понтрягина.
В методе Лагранжа для решения оптимизационной задачи вводятся два вида вспомогательных функций:
функция Гамильтона, определяемая по выражению
,
(П.7.3)
где fi – функции в выражении (П.7.1),
f0 – подынтегральная функция в выражении (П.7.2),
pi – присоединенные функции, определяемые в результате решения следующей системы дифференциальных уравнений:
,
(П.7.4)
или в векторной форме:
где
матрица
разностью m
´
m.
Из (П.7.4) следует:
. (П.7.5)
Уравнения (П.7.4) и (П.7.5) представляют собой каноническую или гамильтонову форму записи уравнений Эйлера-Лагранжа, играющих важную роль в классическом вариационном исчислении. В теории классического вариационного исчисления доказывается следующая теорема, определяющая необходимые условия оптимальности:
при
оптимальном управлении системой,
описываемой (П.7.1), когда минимизируется
функционал (П.7.2), обращаются в нуль
частные производные
то есть должны выполняться условия:
(П.7.6)
Для поиска вектора оптимального управления методом Лагранжа необходимо вначале определить присоединенные функции pi. Они определяются в результате решения дифференциальных уравнений (П.7.4). Для этого необходимо знать граничные условия для присоединенных функций pi. Эти граничные условия определяются в зависимости от конкретных особенностей задачи оптимального управления.
Если требуется минимизировать функционал вида:
, (П.7.7)
то есть речь идет о минимизации линейной комбинации координат системы в конце процесса управления, то граничные условия для присоединенных функций определяются из выражения:
pi(T) = - ci , i = 1 ¸ m.
Если нужно минимизировать нелинейную функцию координат xi(T), а именно:
J = F(xi(T)) = min, i = 1 ¸ m,
где F – нелинейная функция, дважды дифференцируемая по всем аргументам xi, тогда граничные условия для присоединенных функций определяются из выражений:
.
Если нужно минимизировать функционал вида:
,
(П.7.8)
в котором терминальная функция F = 0, то граничные условия для присоединенных функций равны нулю в точке t = T, то есть:
pi(T) = 0, i = 1 ¸ m.
Условие трансверсальности. Часто в задачах оптимального управления задаются определенные условия для системы в конце процесса управления, в точках xi(T). Если вместе с основной задачей оптимального управления в виде функционала (35) должны выполняться условия в конце процесса управления, заданные в виде:
Fj(xi(T)) = 0, j = 1 ¸ m,
причем функции Fj дважды дифференцируемы по всем xi, тогда граничные значения для присоединенных функций при t = T определяются из условия трансверсальности
где
-
неизвестные множители Лагранжа,
определяемые из граничных условий
системы в конце процесса управления.
Пример 1. Динамическая система описывается системой дифференциальных уравнений вида:
Заданы также промежуток или интервал управления t = 0 ¸ 1 и начальное состояние системы x1(0) и x2(0). Необходимо найти оптимальное управление uоп, при котором достигается условие
.
Решение. Для данного критерия оптимального управления функция Гамильтона имеет вид:
система присоединенных функций равна:
Граничные условия для присоединенных функций в этом примере равны нулю в конце процесса управления, то есть p1(1) = 0, p2(1) = 0, так терминальная функция в функционале J равна нулю.
Так
как
и
то
тогда
,
откуда
так как
то
Но
следовательно
Тогда
функция Гамильтона примет вид
Оптимальное управление найдем из условия
следовательно
откуда
Действительно, интеграл
при
и равен
Пример 2. Динамическая система описывается системой дифференциальных уравнений вида
Задано начальное состояние системы x1(0) = 0 , x2(0) = 0. Необходимо на интервале управления системой t = 0 ¸ 1 обеспечить два условия:
минимизировать интеграл
и обеспечить конечное состояние системы, заданное выражениями
,
.
Из этих выражений следуют конечные состояния координат системы x1(1) = 1, x2(1) = 1.
Решение. Функция Гамильтона для этого примера примет вид:
Присоединенные функции определим из формулы (П.7.4)
и
получим
следовательно
следовательно
Для определения коэффициентов с1 и с2 воспользуемся условием трансверсальности
где lj – неизвестные множители Лагранжа, обеспечивающие заданное конечное состояние системы. Из этого выражения имеем: p1(1) = - l1, p2(1) = - l2 .
Тогда p1(t) = - l1, p2(t) = l1t + c2.
При t = 1 имеем равенство: -l2 = l1 × 1+ c2, откуда c2 = - l1 - l2 , тогда p2(t) = l1t - l1 - l2.
Подставим эти выражения в формулу для функции Гамильтона и получим:
Из условия получения оптимального управления методом Лагранжа имеем:
Откуда
Неизвестные множители l1 и l2 определим из условия, чтобы при t = 1 обеспечить заданное конечное состояние координат системы: x1(1) = 1, x2(1) = 1.
Для этого осуществим интегрирование уравнений состояния системы с учетом ее начального состояния x1(0) = 0 и x2(0) = 0.
Из
второго уравнения
имеем
.
После интегрирования этого выражения получим:
При t = 0 x2(0) = 0, следовательно c2 = 0.
Тогда
Подставим
это выражение в первое уравнение системы
и после интегрирования выражения
получим:
При t = 0 x1(0) = 0, следовательно c1 = 0.
При t = 1 имеем x1(1) = 1, x2(1) = 1. Подставим в уравнения для x1(t) и x2(t) эти значения при t = 1 и получим:
Решение
этой системы дает искомые множители
Лагранжа:
.
Тогда окончательный результат для оптимального управления примет следующий вид:
Траектория оптимального управления uоп и координат x1оп, x2оп системы на интервале управления t = 0 ¸ 1 приведена на рис.10.
Рис. П.7.1 Траектория оптимального управления для примера 2
Отличие
принципа максимума Понтрягина от метода
Лагранжа состоит в том, что из-за
ограничений на управление и наличия в
управляющих функциях разрывов первого
рода условия (П.7.6) в строгом математическом
смысле не выполняются. Эти условия в
принципе максимума Понтрягина заменяются
на другое более общее положение, а
именно: чтобы управляющий вектор
решил поставленную оптимизационную
задачу минимизировать функционал J,
необходимо существование не равного
тождественно нулю вектора присоединенных
функций
с соответствующим граничным условием,
который вместе с вектором управления
на всем интервале управления обеспечивал
бы максимум функции Гамильтона, то есть:
.
(П.7.9)
Если нужно максимизировать функционал J, то указанное относительно H условие максимума заменяется условием минимума H, то есть:
.
(П.7.10)
Существенное преимущество принципа максимума по сравнению с классическим вариационным исчислением (метод Лагранжа) состоит в том, что он применим для любого множества U.
Задачи со свободным конечным временем. В ряде задач оптимального управления конечное время t1 = T не задано, тогда говорят о задачах со свободным конечным временем.
Частным случаем таких задач является задача на быстродействие, когда надо минимизировать функционал
.
При
этом f0
º
1, тогда получим
,
т.е. минимизируем интервал управления.