Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ГИА.docx
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
1.05 Mб
Скачать

12. Метод решения задачи оптимального управления. Задачи оптимального управления и двойственные (сопряженные) к ним.

Ответ:

Уравнение движения управляемой системы:    (i  = 1,…n),  xi – фазовые координаты, 

xi(t0) = xi0 – начальное условие, fi – непрерывная кусочно-диф-я функция

  д.б. допустимыми, т.е. принадлежать мн-ву допустимых уравнений     - ограничение.

Критерий качества процесса:  

Оптимальное управление должно переводить управляемый объект их некоторого начального состояния в определенное конечное, удовлетворяя в каждый момент заданным ограничениям и доставлять экстремум max или min функционалу цели, зависящему от управления фазовой траекторией.

Выделяют 3 типа задач по способу задания краевых условий:

1.     Задача с закрепленными концами

2.     Задача с подвижными концами

3.     Задача со свободным концом

1) Необходимо определить управляющую вектор-функцию u(t), переводящую систему   за промежуток времени tÎ[t0,T] из области x(t0)ÎS0(t0) в область х(Т)ÎSТ(Т) при ограничении u(t)ÎV, минимизирующую функционал:

                                                                             терминальная часть

Предполагаем непрерывную дифференцируемость функций: f(x,u,t) и Ф(x,T).

Это задача с подвижными концами (возникает, если t0 и Т заданы, а х(t0) и х(Т) лежат на некоторой гиперповерхности пр-ва n-измерений.

2) х(t0) = х0, х(Т) = х1,  , в остальном аналогично задаче 1. Это задача с  закрепленными концами (предполагает начальное х(t0) и конечное х(Т) фазовые состояния, заданными единственным образом). Если заданы t0 и Т, то имеем задачу с фиксированным временем. В задачах с нефиксированным временем Т не задано.

3) х(t0) = х0, х(Т)ÎST,  , в остальном аналогично задаче 1. Это задача с одним подвижным концом (возникает, когда х(t0) или х(Т) не заданы).

 Основные подходы к решению задачи опт. управления.

1.     Принцип максимума Понтрягина (используется для непрерывных процессов).

2.     Динамическое программирование (для дискретных)

Но, т.к. любой непрерывный процесс можно представить в виде дискретного и наоборот, то для любой задачи актуальны оба подхода.

1. Принцип максимума Понтрягина. Пусть {u*(t),x*(t)} есть оптимальный процесс в системе   и качество управления оценивает функционал  , тогда функция, называемая гамильтонианом системы

 H(t, x*(t),y*(t),u(t)) = 

удовлетворяет условию   внутри области допустимых управлений для всех t, удовлетворяющих неравенству t0 < t < t1;

на границе области допустимых управлений гамильтониан системы как функция переменного u(t)ÎV в каждой точке t непрерывности управления u*(t) достигает максимума при u = u*(t), т.е.H(t, x*(t),y*(t),u*(t)) = sup (max) H(t, x*(t),y*(t),u(t)) (uÎV), где n-мерные функции x*(t),y*(t) являются решением канонической системы диф. уравнений.

;     при начальном условии х(t0) = х0 и граничном условии 

2. Динамическое программирование можно определить как набор математических процедур, используемых при анализе многошаговых процессов принятия решения. Этот метод имеет в своей основе принцип оптимальности:

1)      Опт. управление зависит только от положения системы в момент управления и от цели управления и не зависеть от предыстории системы.

2)      Выбор траектории, переводящей систему из одного положения в другое, не зависит от состояния системы в моменты, предшествующие управлению.

3)      Участок оптимальной траектории, начиная с любого момента времени и до конца процесса, сам по себе явл. оптимальной траекторией. Одним из следствий принципа оптимальности явл. невозможность получить оптимальную траекторию в целом, если в какой-то момент времени управление отклонилось от оптимального.

Рассм. дискретный процесс с фиксированным числом шагов и свободным правым концом. Задача состоит в назначении управления u(t), t = 0,1,…,N-1; u(t)ÎV; управляемый объект:  , х(t0) = х0; функционал качества  .

Решается задача при помощи приема обратного движения от конца к началу процесса. Полагаем, что нам известны значения функционала на всех предшествующих шагах Þ нужно минимизировать функционал на последнем шаге. Значение ф-ла на последнем шаге:  , u(N-1)ÎV. Предпоследний шаг:  , u(N-2)ÎV.

Итак, получаем рекуррентное соотношение:

,

с помощью которого решаем задачу.

Формулы перехода от непрерывной системы к дискретной:

 Þ   Þ x(t + 1) = x(t) + f(x,u)Dt

и функционал: 

13. Задача оптимального управления развитием экономики. Задача оптимального управления распределением капитальных вложений. Достаточные условия оптимальности для процессов управления с непрерывным и дискретным временем и их обобщение.

Ответ:

Задача оптимального управления развитием экономики

Предлагается оценивать развитие экономики объемом валового продукта  .

Чем больше будет валового продукта  , судя по производственно-технологической схеме экономики (см. рис.2), тем больше его пойдет на производственное потребление  , тем больше будет конечного продукта  , а следовательно, увеличатся и непроизводственное потребление  , и валовые капитальные вложения  . Последнее будет способствовать через чистые капитальные вложения   росту ОПФ и, в итоге, опять-таки валового продукта  .

Воспользуемся приведенными в 1.2 соотношениями для представления зависимостей валового продукта  .

Валовый продукт   разделяется на производственное потребление   и конечный продукт  :

.

Производственное потребление   выражается через валовый продукт   с помощью коэффициента прямых материальных затрат  :

.

Тогда

.

Конечный продукт   разделяется на валовые капитальные вложения   и непроизводственное потребление  :

.

Подставляя это выражение, получаем:

.

Для упрощения будем рассматривать так называемую открытую модель Леонтьева, в которой не учитываются амортизационные отчисления  , составляющие совместно с чистыми капитальными вложениями   валовые капитальные вложения  :

.

Тогда валовые капитальные вложения   пропорциональны приросту валового продукта   с коэффициентом приростной фондоемкости  :

.

Подставляя эту зависимость, получаем:

.

После элементарных преобразований итоговое выражение примет вид дифференциального уравнения:

.

В этом уравнении устанавливается связь во времени   между валовым продуктом как функцией времени   и непроизводственным потреблением также как функцией времени  .

Если функция валового продукта   устанавливает состояние развития экономики, то тогда функция непроизводственного потребления   может служить управлением развития экономики.

Исходя из этого, может быть сформулирована постановка задачи оптимального управления развитием экономики.

Суть этой задачи сводится к тому, что необходимо выбрать вид функции непроизводственного потребления  , устанавливающей его объем в каждый момент времени, которая бы определяла вид функции валового продукта  , характеризующей развитие экономики. Указанный выбор должен соответствовать критерию оптимальности управления развитием экономики.

Установим промежуток времени (период) управления от начального момента времени   по конечный момент времени  :

 .

Будем характеризовать состояние функцией валового продукта  , а управление - функцией непроизводственного потребления  .

Зададим начальное состояние валового продукта   и пределы возможного управления непроизводственным потреблением:

 .

Используя результаты предыдущих рассуждений, опишем связь состояния и управления так называемым уравнением движений:

.

В качестве критерия оптимальности состояния за счет использования оптимального управления выберем следующий максимизируемый показатель:

.

По существу это целевая функция задачи оптимизации, аргументами которой служат функции состояния - валового продукта   и управления - непроизводственного потребления  . Поэтому она называется целевым функционалом.

Целевой функционал включает два слагаемых. Первое слагаемое состоит из суммарного (интеграл) дисконтированного непроизводственного потребления за весь период управления:

.

В этом слагаемом  - взвешиваемая функция дисконтирования с коэффициентом дисконтирования  .

Второе слагаемое, называемое терминальным членом целевого функционала, состоит из величины объема выпуска валового продукта   в конечный момент времени   периода управления.

Весовые коэффициенты   и   определяют приоритеты непроизводственного потребления и валового продукта:

.

Целевой функционал выражается числовым значением, которое максимизируется за счет выбора соответствующего вида функции управления - непроизводственного потребления   и получаемого при этом с помощью уравнения движения вида функции состояния - валового продукта  .

Таким образом, постановка задачи оптимального управления развитием экономики сводится к установлению периода управления (начального и конечного моментов времени), к определению, что будет являться состоянием (валовый продукт) и управлением (непроизводственное потребление), к заданию начального состояния (объема валового продукта в начальный момент времени периода управления) и пределов изменения управления (минимального и максимального объемов непроизводственного потребления), к аналитическому описанию связи (уравнения движения) состояния (валового продукта) и управления (непроизводственного потребления), и наконец, к выбору показателя оптимальности (целевого функционала).