Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методы и системы оптимального управления. Ч. 2

.pdf
Скачиваний:
2
Добавлен:
24.11.2025
Размер:
720.19 Кб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ Белорусский национальный технический университет

Кафедра «Информационные системы и технологии»

А. А. Лобатый В. Ю. Степанов Е. А. Хвитько

МЕТОДЫ И СИСТЕМЫ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

Пособие для студентов специальностей

1-53 81 02 «Методы анализа и управления в технических и экономических системах»,

1-53 81 05 «Распределенная автоматизация на основе промышленных компьютерных сетей»

В 3 частях

Часть 2

Рекомендовано учебно-методическим объединением по образованию в области автоматизации технологических процессов, производств и управления

Минск

БНТУ

2020

1

УДК 681.5:681.3 (075.8) ББК 14.2.6

Л68

Р е ц е н з е н т ы:

заведующий кафедрой ПОСТ, канд. техн. наук, доцент В. А. Рыбак; главный научный сотрудник ОИПИ НАН РБ, д-р техн. наук,

профессор В. В. Старовойтов

 

Лобатый, А. А.

Л68

Методы и системы оптимального управления: пособие для сту-

дентов специальностей 1-53 81 02 «Методы анализа и управления в технических и экономических системах», 1-53 81 05 «Распределенная автоматизация на основе промышленных компьютерных сетей» : пособие : в 3 ч. / А. А. Лобатый, В. Ю. Степанов, Е. А. Хвитько. –

Минск : БНТУ, 2020. – Ч. 2. – 64 с. ISBN 978-985-583-384-1 (Ч. 2).

Целью данного пособия является освещение ряда задач по следующим тематикам: задачи, в которых на управление накладываются ограничения в виде неравенств (за счет применения принципа максимума Понтрягина), динамическое программирование, аналитическое конструирование оптимальных регуляторов, оптимизация управления методами вариационного исчисления. Также в пособии рассмотрены вопросы синтеза регуляторов линейных систем управления, синтез дискретных регуляторов, синтез регуляторов нестационарных систем.

Часть 1 данного издания была выпущена в 2020 году.

 

УДК 681.5:681.3 (075.8)

 

ББК 14.2.6

ISBN 978-985-583-384-1 (Ч. 2)

© Лобатый А. А., Степанов В. Ю.,

ISBN 978-985-583-264-6

Хвитько Е. А., 2020

 

© Белорусский национальный

 

технический университет, 2020

2

 

СОДЕРЖАНИЕ

 

ВВЕДЕНИЕ.............................................................................................

4

1.

Принцип максимума Понтрягина .....................................................

5

2.

Динамическое программирование..................................................

15

3.

Аналитическое конструирование оптимальных регуляторов......

22

4.

Оптимизация управления методами

 

вариационного исчисления..................................................................

26

5.

Синтез регуляторов линейных систем управления.......................

32

6.

Синтез дискретных регуляторов.....................................................

43

7.

Синтез регуляторов нестационарных систем ................................

56

ЛИТЕРАТУРА......................................................................................

64

3

ВВЕДЕНИЕ

Целенаправленное воздействие на объект или систему с участием или без участия человека называют управлением, а систему, обеспечивающую управление, – системой управления. В ряде современных практических задач, где применяются системы управления, часто возникает ситуация, когда необходимо использовать управление, на которое накладываются ограничения в виде неравенств.

Рассматриваемые ранее в первой части пособия задачи оптимизации максимального быстродействия сводятся к одной обобщенной задаче. Для этого функционал качества рассматривается не только в конечный момент времени, но и в текущий момент, а для многомерных задач определение оптимального управления представляет собой значительную трудность.

Далее рассматривается динамическое программирование, которое вместе с принципом максимума является одним из основных аналитических методов поиска оптимального управления. В отличие от принципа максимума оно позволяет определить оптимальное управление с обратной связью. Метод применим для оптимизации дискретных процессов. Показано, что в основу метода динамического программирования положен принцип оптимальности Беллмана, справедливый для дискретных и непрерывных систем.

Затем рассматривается аналитическое конструирование оптимальных регуляторов, что является синтезом оптимального управления для объекта, описывающегося линейной моделью, и квадратичного функционала качества.

В следующем разделе пособия рассматривается раздел математики, в котором ставятся задачи исследования максимума или минимума функционала и определение функций, на которых эти максимум и минимум достигаются (методы вариационного исчисления); а вторая часть настоящего пособия посвящена рассмотрению вопросов синтеза регуляторов линейных систем управления, синтеза дискретных регуляторов, синтеза регуляторов нестационарных систем. При синтезе регуляторов используются положения и понятия теории автоматического управления: управление, управляемые переменные, качество управления, которые и будут подробно рассмотрены в данном пособии.

4

1.Принцип максимума Понтрягина

Вряде практических задач на управление накладываются ограничения в виде неравенств, решение таких задач дает принцип максимума – математический метод, разработанный Понтрягиным и его учениками. Постановка задачи следующая – поведение математической модели объекта управления (ОУ) описывается обыкновенным дифференциальным уравнением, которое имеет вид:

– в векторной форме

x(t) f (x,u,t);

(1)

– в скалярной форме

 

xk (t) fk (x1...xn ,u1...um , t).

(2)

Начальное условие x(t0) = x0.

Структурная схема процесса управления представлена на рис. 1.

 

 

 

 

 

 

 

 

 

 

x0

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x(t)

 

 

 

 

 

 

dx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u(t)

 

 

 

f (x,u,t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 1. Структурная схема процесса управления

Множество управлений образует кусочно-непрерывные функции u(t) со значениями в области допустимых значений Uдоп.

Функционал качества в общем случае запишем в виде (задача Больца):

tк

F0(x,u,t)dt,

 

J0 0(x,tk )

(3)

t0

 

 

где 0 и F0 – заданные непрерывно-дифференцируемые функции. Постановка задачи следующая. Требуется найти такую тройку d (x ,u ,t ), где x – оптимальная траектория; u – оптималь-

5

ное управление; t – оптимальный момент времени окончания процесса, чтобы выполнялось условие:

 

 

 

 

J0(d ) minJ0(d ).

 

 

(4)

Иначе в эквивалентной форме можно записать:

 

J

0

(t

, x

,u (t)) min J

0

(t

, x

,u(t)),

(5)

 

0

0

u(t) Uдоп

0

0

 

 

 

 

 

 

 

 

 

 

где t0, x0 – начальные значения времени t и фазовых координат вектора состояний x.

Рассматриваемые ранее в первой части пособия типовые задачи оптимизации (максимального быстродействия или терминальная задача) сводятся к одной обобщенной задаче. Для этого функционал качества рассматривается не только в конечный момент времени, но и в текущий. При этом функционал J0 принимается за дополнительную xn+1 фазовую координату.

Рассмотрим разные критерии:

1. Максимальное быстродействие. Время t считается xn+1 координатой, определяемой уравнением:

xn 1

1, (xn 1)0

xn 1(t0) t0.

(6)

Таким образом, задача минимизации времени управления tk–t0 сводится к минимизации xn+1 фазовой координаты.

2. Терминальный критерий (задача Майера). Новая фазовая координата имеет вид:

 

xn 1

J0(tk ) φ0(x, tk ),

(7)

xn 1

n

d

(8)

dx0 fk (x1...xn ,u1...um ,t).

 

1

k

 

3. Задача Лагранжа (интегральный критерий). Новая фазовая координата:

6

xn 1(t) J0

tk

F0(x,u,t)dt,

 

 

(9)

 

t0

 

 

xn 1 F0(x1...xn , u1...um , t).

(10)

Таким образом, задача оптимизации функционала качества J0 сводится к минимизации в момент времени tk фазовой координаты xn+1 расширенного векторного состояния по отношению к управлению u. При этом на конечное состояние объекта могут накладываться различные ограничения. Ограничения могут иметь следующий вид:

q j (x1(tk ),..., xn (tk )) 0, j

1,r

,

(11)

где qj – некоторые дифференцируемые функции.

Для поиска экстремума функции при наличии ограничений в виде равенств используется метод множителей Лагранжа. В соответствии с этим методом задача оптимизации сводится к описанию экстремума функции следующего вида:

r

xn 1(tk ) jq j (x1(tk )...xn (tk )), (12)

j 1

где λj – неопределенные множители Лагранжа.

Таким образом, необходимо найти u(t) Uдоп, при котором функ-

ционал π будет минимален.

Решение задачи оптимизации управления было получено Понтрягиным и его учениками благодаря открытому ими принципу максимума, связавшему оптимальный функционал π с динамикой процесса. Эта связь была установлена через так называемую функцию Гамильтона, как назвал ее Понтрягин, или функцию Понтрягина, как называют ее в настоящее время, которая имеет вид:

n

n 1

 

H (x,u, ,t) i fi n 1 fn 1

 

i fi.

(13)

i 1

i 1

 

 

7

В данном случае имеют место следующие обозначения: fi – правая часть выражения (1) для xi (i = 1…n);

fn+1 – правая часть уравнения для xn+1;

xn+1 определяется в зависимости от задачи оптимизации. Неопределенные функции ψi удовлетворяют уравнению:

n 1

 

df j

 

 

 

 

 

 

 

i 1,n 1.

 

i

j

 

,

(14)

dx

j 1

 

i

 

 

 

 

 

Для коэффициентов ψi заданы конечные условия, определяемые выражением:

 

d

r

 

dq j

 

 

 

 

 

 

 

 

i 1,n 1;

 

i (tk )

 

 

j

 

 

,

(15)

dx

dx

i

 

i

j 1

 

 

 

 

 

 

 

 

n 1(tk ) 1.

 

 

 

 

(16)

Основная идея принципа максимума состоит в том, что для оптимального управления u(t) и соответствующих координат xi(t), для которых функционал π имеет минимальное значение, функция Понтрягина H имеет максимум по отношению к управлению u(t) по всему интервалу [t0, tk].

Принцип максимума был обоснован математически как необходимое условие оптимальности для нелинейных систем и как необходимое и достаточное для линейных систем. Таким образом, задача сводится к определению максимума функции H.

Используя (13), для функции H можно переписать уравнение для фазовых координат (1) и уравнения для вспомогательных функций ψi (14) в так называемой канонической форме. Для этого продифференцируем (13) по ψi:

 

dH

fi (x,u,t) xi (t),

i

 

 

 

(17)

 

1,n 1.

 

d i

 

 

 

 

 

 

 

 

 

 

 

Дифференцируя (13) по xi, получим:

 

 

 

 

 

 

 

dH

n 1

 

df j

 

 

 

 

 

 

 

 

 

 

i 1,n 1.

 

 

dx

 

i

 

i ,

(18)

 

dx

 

i

j 1

 

i

 

 

 

 

 

 

 

8

Выражения (17) и (18) позволяют привести уравнения (13) и (14) к следующей так называемой канонической форме уравнений Гамильтона (Понтрягина):

xi

dH

,

i

 

 

 

 

(19)

1,n 1;

 

 

d i

 

 

 

 

 

 

i dH ,

i

 

 

 

1,n 1.

(20)

 

dxi

 

 

 

 

 

 

Таким образом, имеем две системы уравнений. Для xi заданы начальные условия, а для ψi – конечные условия, определяемые (12). Уравнение (13) показывает, что при поиске u(t) необходимо решать так называемую двухточечную краевую задачу, когда в системе уравнений часть условий заданы в момент времени t0, а часть – в конечный момент времени tк. Аналитические решения возможны только для систем малых размерностей, однако современные численные методы позволяют решать более сложные задачи.

Доказательство необходимых условий оптимальности (по принципу максимума) основано на рассмотрении так называемой игольчатой вариации. Большинство практических задач – это задачи со свободным правым концом и заданным временем переходного процесса. Понтрягин предложил решение как игольчатую вариацию отклонения управления от оптимального значения (рис. 2).

uj

u j (t)

*

(t)

 

 

u j

t 0 t

 

t

tk

Рис. 2. Игольчатая вариация оптимального управления

9

Достаточно строгое доказательство принципа максимума получено методом вариационного исчисления. При этом рассмотрены вариации (бесконечно малые приращения). Выразив зависимость между этими вариациями, легко увидеть, что:

t H(x,u, ,t) H(x ,u , ,t) .

(21)

 

 

 

При этом очевидно, что оптимальное управление имеет место при выполнении неравенства

H (x ,u , ,t) H (x,u, ,t).

(22)

Оптимальное управление определяется выражением:

dH 0,

i

 

.

 

1,m

(23)

dui

 

 

 

 

Недостающие краевые условия для коэффициентов ψi определяются из условий трансверсальности (от лат. «transversus» – поперечный). В математике это условие оптимальности в вариационных задачах с подвижными концами. В принципе максимума это дополнительное условие, позволяющее решать практические задачи. Рассмотрим задачу со свободным правым концом, когда

xn 1(tk ) 0.

 

 

 

(24)

В то же время

 

 

 

 

 

 

 

xn 1(tk ) t[H (x,u, ,t) H (x ,u , ,t)].

(25)

На основании выражений (21) и (22) получим:

 

 

 

n

 

x

x

n 1

 

 

H (x,u, ,t) t

i

i

t n 1

 

t.

(26)

 

t

i 1

 

t

 

 

При малых вариациях t t

следует, что x x.

 

10