
книги из ГПНТБ / Уткин, В. И. Скользящие режимы и их применения в системах с переменной структурой
.pdfРАЗДЕЛ I
НЕКОТОРЫЕ ВОПРОСЫ ТЕОРИИ СКОЛЬЗЯЩИХ РЕЖИМОВ
В этом разделе будут рассмотрены динамические си стемы, описываемые дифференциальными уравнениями с разрывной правой частью. Разрывность уравнений дви жения обусловлена наличием скалярного или векторного параметра, называемого в дальнейшем управлением, ком поненты которого претерпевают разрывы на некоторых поверхностях, заданных в пространстве координат систе мы. Уравнения движения таких систем обычно задают движение вне поверхностей разрыва и не определены иа самих поверхностях. Как уже отмечалось во введении, в таких системах может возникнуть скользящий режим, характеризуемый тем, что во время этого движения тра ектория изображающей точки не может покинуть любую сколь угодно малую окрестность какой-либо поверхности или пересечения нескольких поверхностей. В главе II на основе физических соображений будут выделены случаи, когда уравнения вне поверхностей разрыва позволяют однозначно выписать уравнения движения вдоль пересе чения поверхностей скользящего режима, и рассмотрены различные ситуации, когда такая однозначность не имеет места.
В главе III на основе определения устойчивости Ля пунова дается определение скользящего режима и получе ны условия его возникновения для различных векторных случаев. Необходимость такого исследования обусловле на тем, что в векторном случае условия возникновения скользящего режима не являются столь очевидными, как это имело место в скалярном случае (напомним, что в ска лярном случае эти условия имели наглядную геометри ческую интерпретацию и предполагали направление фа зовых траекторий в окрестности поверхности разрыва навстречу друг другу).
На основе описанных в главах II и III методов иссле дования разрывных систем в главе IV будет проведено
42 |
УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ |
[ГЛ. II |
обсуждение проблемы синтеза систем автоматического управления с желаемыми динамическими свойствами на основе преднамеренного введения в систему скользя щих движений.
г л а в а и
УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ
В РАЗРЫВНЫХ СИСТЕМАХ
§1. Постановка задачи. Метод эквивалентного управления
Рассмотрим векторный случай разрывной динамиче ской системы, описываемой уравнениями
х — f (х, t, и). |
(2.1 |
В уравнении (2.1) х и / — «-мерные векторы-столбцы с компонентами соответственно хг, . . ., хп и flt . .
Xi — координаты системы, / г — непрерывные функции по всем аргументам, и — пг-мериый вектор-столбец, называе мый в дальнейшем управлением, каждая компонента ко торого U; претерпевает разрывы на поверхности st (х) = 0:
_ |
jut |
(Х, |
t) при |
S| (х) |
О, |
|
1 |
|
(х, |
t) при st (х) < |
0 |
(£ = 1, - . тп), |
|
где и?" (х, |
£), |
и г |
(х , t), |
(х) |
— некоторые непрерывные |
функции (ut+ =f= u f) *).
Заданные таким образом уравнения движения опре деляют поведение системы вне границ разрыва и, вообще говоря, оставляют открытым вопрос о том, что происхо дит, когда изображающая точка попадает на эти границы. Может оказаться, что при начальных условиях, лежащих на пересечении поверхностей разрыва, дальнейшая тра ектория на некотором конечном интервале времени не по-
*) Все дальнейшие рассуждения можно применить и для не стационарных поверхностей разрыва, уравнения которых s2 (х, t) — = 0 явно зависят от времени. Этот случай сводится к рассматривае
мым здесь и далее случаям за счет введения |
новой координаты |
9!S$ |
d.Tn+i |
х„ +1 = f и добавления к системе (2 .1) уравнения —j -— = 1 ,
§ 1] ПОСТАНОВКА ЗАДАЧИ 43
кидает любую сколь угодно малую окрестность этого пе ресечения. В частности, для скалярного случая такое дви жение, названное ранее идеальным скольжением, возни кает, когда траектории системы в окрестности поверхно сти разрыва направлены навстречу друг другу (рис. 5).
Задача состоит в том, чтобы разумно доопределить уравнения идеального скольжения по уравнениям, задан ным вне поверхностей разрыва и уравнениям самих по верхностей. С формальной точки зрения возможны любые доопределения, позволяющие описать движение в скользя щем режиме. (Во введении приводится краткий обзор и анализ некоторых из таких возможных доопределений.)
В дальнейшем для доопределения уравнений идеаль ного скольжения мы будем использовать формальный прием, который назовем методом эквивалентного управле ния. Сущность этого метода состоит в следующем: произ водные по времени от функций s; (я), определенные в силу системы (2.1), приравниваются нулю, и полученная таким образом система уравнений решается относительно ком понент вектора управления; решение этой системы, на зываемое эквивалентным управлением, подставляется в исходную систему (2.1) и полученные в результате такой процедуры уравнения применяются в качестве уравнений идеального скольжения.
При решении вопроса о том, какой из всевозможных методов доопределения уравнений идеального скольже ния более естественно принять *), представляется разум ным следующий путь рассуждений. Сам факт неопреде ленности уравнений возник только потому, что в исходных уравнениях, в частности в уравнениях (2.1), мы пренебрег ли различного рода малыми неидеальностями, которые от личают реальные системы от ее идеального описания. В связи с этим надо ввести в рассмотрение различные ма лые неидеальности (типа запаздывание, гистерезис, ма лые инерционности и т. д.), выписать уравнения, отли чающиеся от исходных уравнений (2.1) учетом этих неидеальностей, и устремить затем неидеальности к нулю. При учете таких неидеальностей возникает вполне опре деляемое уравнениями движение вблизи поверхности раз
*) Как мы увидим ниже, в частности, метод Филиппова и ме тод эквивалентного управления могут привести к различным урав нениям скольжения.
и УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ £гл. it
рыва («реальное скольжение»), которое в пределе, при стягивании неидеальностей к нулю, должно перейти в «идеальное скольжение». Если бы оказалось, что при раз ных неидеальностях или в зависимости от способа перехода к пределу появляются разные предельные уравнения, то было бы естественно считать, что задача доопределения уравнений идеального скольжения по уравнениям, опи сывающим систему вне поверхностей разрыва, не имеет единственного решения. Но если такой предельный пере ход может быть сделан независимо от вида неидеальиости, т. е. может быть показано, что при любых неидеальностях определенного класса получаются одинаковые предельные уравнения, естественно считать, что полученные так уравнения и являются искомыми.
С точки зрения приведенных рассуждений способ доопределения Филиппова был обоснован лишь для ска лярного случая и лишь с помощью предельных перехо дов для частных случаев неидеальностей *)Л Эти же неидеальиости использовались в работах [23, 78] для обо снования предлагаемых авторами иных способов доопре деления уравнений скольжения. В связи с этим остается открытым вопрос о правомерности той или иной процеду ры доопределения уравнений идеального скольжения (в том числе и процедуры Филиппова) даже в скалярном случае для других видов неидеальностей.
Что касается векторного случая, то автору неизвест ны работы, в которых предлагались бы процедуры, поз воляющие в явной форме выписать уравнения скольже ния по пересечению поверхностей разрыва **).
*) В одном из них предполагалось наличие гистерезисной петли, во втором — малого запаздывания, в третьем — малых инерцион ностей и реализовалось стремление их к нулю (см. главу I).
**) Метод Филиппова был разработан им применительно к ска лярному случаю. В [104] было высказано замечание о том, что ана логичным образом можно решать задачу и в векторном случае, однако в векторном случае метод Филиппова не был подтвержден какими-либо предельными переходами даже для частных видов неидеальностей. Здесь же уместно отметить, что процедуры, анало гичные методу эквивалентного управления, без обоснования с по мощью предельных переходов использовались для векторного слу чая в системах с переменной структурой в работах [100, 110], для скалярного случая — в работе [90], а в работе [23] приводится ее обоснование для частного случая разрывной системы со скаляр ным управлением.
§ 1] ПОСТАНОВКА ЗАДАЧИ 45
В следующем далее § 2 сначала рассматривается век торный случай разрывной системы с линейным вхожде нием управления. Показано, что независимо от вида введенных в исходную систему иеидеальностей и способа перехода к пределу предельные уравнения всегда опре деляются однозначно, и эти уравнения совпадают с урав нениями, полученными в результате формального приме нения метода эквивалентного управления.
Затем в § 3 рассматривается скалярный случай нелиней ной по управлению системы и показывается, что в зависи мости от вида иеидеальностей предельные уравнения могут отличаться друг от друга. Выделяется класс неидеальностей, для которого возможна искусственная линеариза ция систем по управлению, и следовательно, становится правомерным применение метода эквивалентного управ ления для получения уравнения скольжения. Обсуж даются вопросы грубости различных предельных пере ходов по отношению к малым параметрам, характеризую щим всегда присутствующие в системе неучтенные малые запаздывания, инерционности и т. д.
Затем в главе II рассматриваются векторные случаи
разрывных |
систем |
общего |
вида |
с нелинейным |
вхож |
||
дением управления. |
В таких системах |
даже для фик |
|||||
сированного вида |
иеидеальностей |
могут |
иметь |
место |
|||
различные |
предельные |
уравнения |
в |
зависимости |
|||
от того, |
каким образом |
осуществляется |
предельный |
||||
переход. |
|
класс |
нелинейных |
систем и класс |
|||
В § 4 приводятся |
иеидеальностей, для которых, так же как и в скаляр ном случае, возможна искусственная линеаризация, что и позволяет однозначно получить уравнения сколь
жения. |
вырожденные случаи линейных |
|
В § 5 разбираются |
||
по векторному управлению систем, в которых |
экви |
|
валентное управление |
не находится однозначно. |
В за |
висимости от характера вырождения уравнения скольже ния могут быть определены как однозначно, так и неодно значно, либо скользящий режим в системе вообще не может возникнуть.
В заключение (§ 6) поясняется физический смысл эк вивалентного управления, с помощью которого опреде ляются уравнения скольжения.
46 |
УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ |
[1*Л. II |
§ 2. Системы, линейные по управлению
Рассмотрим частный случай системы (2.1), когда век торное управление входит в него линейно, т. е. система описывается уравнением
х = / (х, t) + В (х , t) ы, |
(2.2) |
где х и / — 7г-мерные векторы-столбцы, В (х , t) — матри ца размерности п X т, и — ттг-мерньш вектор управле ния, каждая компонента которого претерпевает разрывы на своей поверхности, заданной уравнением st (х) = 0 *):
lilt (X, t) При S( (х) > О,
(2.3)
\щ (х , t) при s; (х) -< 0.
Предполагается, что функция / (х, t), а также функция В (х, t) и вне поверхностей разрыва удовлетворяют ус ловию Липшица. В системах такого рода могут возникать скользящие движения,! которые в отличие от скалярного случая лежат не на одной поверхности разрыва, а на их пересечении. Оставляя пока в стороне вопрос о том, при каких условиях такое движение возникает, формально применим описанный в § 1 настоящей главы метод экви валентного управления для составления уравнений сколь зящего движения в этом векторном случае. С этой целью
введем в рассмотрение m-мерный вектор s = |
(sj, . . sm). |
|
В |
соответствии с методом находится пЭ1(в |
из уравнения |
s |
= 0, которое в силу системы (2.2) имеет вид |
|
|
Gf + GBugHa — 0, |
(2.4) |
где G — матрица размерности т X п, строки которой яв ляются векторами-градиентами функций s-,. (х). Предпо лагая, что detGB =f= 0 для любых х и t, находим
ыэкв = - |
(GB)-'Gf. |
(2.5) |
В результате подстановки |
нэкв в исходную |
систему (2.3) |
получаем уравнение |
|
(2.6) |
х — f — В (GBy'Gf, |
*) Класс допустимых функций si(x) будет указан ниже при изучении уравнений скольжения по пересечению поверхностей разрыва.
| 2] СИСТЕМЫ, ЛИНЕЙНЫЕ ПО УПРАВЛЕНИЮ 47
которое при начальных условиях s (х (0)) = 0 и прини мается в качестве уравнения идеального скольжения. Существенно, что в силу самого метода s (х) = 0 и при выбранных начальных условиях все траектории системы (2.6) будут лежать на многообразии пересечения всех по верхностей разрыва размерности п — т. В соответствии с этим вместо системы уравнений скольжения (2.6) п-го порядка можно записать систему уравнений скольжения (п — т)-то порядка. Опишем процедуру получения такой системы. Так как в скользящем режиме величина s тож дественно равна нулю, из системы тпалгебраических урав нений s = 0 выразим какие-либо пг координат через остальные п — тп координат. Согласно теореме о неявной функции такие координаты, например xn_m+1, . . ., хп, всегда найдутся, если ранг матрицы G, составленной из градиентов функций s, (х), равен тп. Это условие выпол няется, так как для рассматриваемой системы delGB ф 0. Подставим в первые п — тп уравнений системы (2.6) вы численные таким образом координаты xn_,rt+1, . . ., х„, а остальные тпуравнений отбросим. В результате получим систему (п — т)-го порядка, которая и будет описывать движение в скользящем режиме.
Для того чтобы обосновать справедливость получен ных уравнений скольжения, необходимо в соответствии с приведенной в § 1 схемой рассуждений организовать над лежащий предельный переход, который предполагает введение в систему неидеальностей с последующим стрем лением этих неидеальностей к нулю. Наличие неидеально стей в управлении независимо от их природы приведет к тому, что в системе возникнет так называемый реальный скользящий режим, во время которого в отличие от идеального скольжения фазовые траектории принадежат некоторой конечной A-окрестности многообразия s (х) =
= |
0, т. е. |
|
|
|
|
|
Г |
ТП |
|
|
И * ) К А. N |
= у |
2 * ? - |
(2.7) |
|
|
|
1=1 |
|
Будем считать, что г (s, х) — |
расстояние от любой точки |
|||
из окрестности (2.7) до многообразия s (х) = |
0 оценивает |
|||
ся |
неравенством |
|
|
|
г (S, х) < ; Р А, |
(2.7а) |
48 |
УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ |
[ГЛ. II |
где Р — некоторое положительное число *). В этом слу чае движение системы будет описываться уравнением, отличным от исходного уравнения (2.2):
х = / (ж, t) + В (ж, t) й (ж, t), |
(2.8)' |
где функция управления й уже включает неидеальности любого рода и о ней известно лишь, что она обеспечивает выполнение условия (2.7). Кроме того, предполагается, что решение системы (2.8) существует (например, функция В (ж, t) й удовлетворяет условию Липшица, либо кусоч но-непрерывна и ограничена). Последнее предположение естественно, так как неидеальности, которые обычно су ществуют в реальных системах, не выводят нас за пределы этой гипотезы. Приведенное здесь уравнение (2.8) вместе с неравенством (2.7) задает множество динамических си стем, так как может оказаться, что для целого класса уп
равлений и фазовые траектории принадлежат Д-окрестно- сти многообразия s (х) = 0. Доказательство того факта, что при стремлении Д к нулю решение всех этих систем стремится к одному и тому же пределу, и означало бы ре шение поставленной задачи.
Т е о р е м а . Если
1) на интервале [0, Т] какое-либо решение ж (t) системы (2.8) таково, что фазовая траектория лежит в А-окрест- ности многообразия s (х) = 0, т. е. справедливо неравен ство (2.7),
2) для правой части уравнения (2.6), полученного с по мощью метода эквивалентного управления
х * = / (ж*, t)—В (х*, t) [G (ж*) В (ж*,- f)]-1G (ж*) / (ж*,г)**), (2.9)
существует постоянная Липшица L,
3) частные производные функции В (х, t) [G (х)-В (x,t)\~l по всем аргументам существуют и ограничены в лю бой ограниченной области,
*) Такое Р существует, например, если все градиенты от функ ций Si (х) по норме ограничены снизу какой-либо постоянной поло жительной величиной.
**) Для того чтобы различать решения систем (2.8) и (2.9), вектор состояния в (2.9) обозначен через %*,
§ 2] |
СИСТЕМЫ, ЛИНЕЙНЫЕ ПО УПРАВЛЕНИЮ |
49 |
4) для функции / (х , t) + В (х , t) и, которая входит в правую часть уравнения (2.8), описывающего реальное сколъжение, существуют такие положительные числа М и N , что
\f(x, t) + В (х, t)u(x, <)||<М + W|*|, |
(2.10) |
то для любой пары решений уравнений (2.8) и (2.9) с на чальными условиями
И 0 )-* * (0 )| | < Р Д |
(2.11) |
существует такое положительное число Н, что |
|
Iх (t) — х* ( t) I яд для ге[0,Г]. |
(2.12) |
Д ля доказательства теоремы следует оценить по норме разность решений уравнений, описывающих движение в идеальном и реальном скользящем режиме. Для реального скользящего режима величина
s уже не равна нулю, как это предполагалось при использовании метода эквивалентного управления. Поэтому управление и, опре деленное в силу системы (2 .8), будет отличаться от и0КВ:
и= — (GB)-JG/ + (GB)-1 s,
исоответственно уравнение реального скользящего режима, полу ченное в результате подстановки и в (2 .8),
х = / (х, t) — В (х, t) [G (х) В (х, t)]_1G (ж) f (х, t) -|-
- f B(x,t)[G (ж) В (ж, f)]-1 s (2.13)
также отличается от уравнения (2.6) или (2.9) дополнительным чле ном В (ж, t) [G (ж) В (ж, Z)]- 1s. Разумеется, уравнение (2.13) содер
жпт все учитываемые неидеальности — от них зависит величина S. Уравнение (2.13) описывает реальные скользящие движения с уче том неконкретизированных неидеальностей, и при стремлении Д к нулю его решение будет описывать идеальное скольжение. (При этом следует иметь в виду, что стремление Д к нулю, вообще говоря,
вовсе не означает стремления к нулю величины s.)
Прежде чем переходить к сравнению решений уравнений (2.6) и (2.13), запишем эквивалентные им интегральные уравнения
/
ж* (f) = ж* (0) + у / (г* , Т) _ в (х*, т) [G (ж') В (ж*, т) ] '1 X
X G(x*)/ (ж*, Т)МТ, (2 .6а)
t
х (t) = ж (0) + J {/ (ж, Т) — В (ж, г) [G (ж) В (ж, y)]-'G (ж) / (ж, Т)} dy +
о
t
+ 5 В (*. г) [С (.г-) В (ж, т) ] - 1i dy. (2.13а)
о
50 |
УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ |
1ГЛ. II |
Проинтегрировав последнее слагаемое в (2.13а) по частям, оценим по норме разницу решений (2.13а) и (2.6а) с учетом условий теоремы:
I
И * ) - * • ( » ) !< Р А + $ £ [ * - * ,1*г + |
|
+ р ( * . Т) [ G (*)В (*,Т)Г>* |
+ |
t |
|
+ 5 | £ * ( * . Т) \G(*) В (х, |
t)]-i I - 1|^ IIЙТ. (2.14) |
Решение уравнения (2.13а) или эквивалентного ему уравнения (2.8) ограничено на конечном интервале времени [0, Т]. Это следует из того, что при выполнении условия (2 .10) решение уравнения (2 .8) удовлетворяет неравенству
Т
II * (0 И<II* (0)II + Л/Т + ^ N\\x\\dt.
о
Согласно лемме Веллмана — Гронуолла [28] из этого неравенства и следует ограниченность решения уравнения (2.8), или (2.13а):
II * (0 К ( I* (0) II + МТ) eNT (f е [0, Г]).
Тогда в силу ограниченности решения х (i), а также пн. 1) — 3) теоремы неравенство (2.14) может быть представлено в виде
t
II * (0 - X* (t) К Sb + L X - **| dTl |
(2.15) |
о
где S — положительная величина, зависящая от вида функций, входящих в правые части уравнений (2.8) и (2.13), от начальных условий, времени Т и постоянной Р. Применяя лемму Веллмана — Гронуолла к нер\венству (2.15), но [учим
1И 0 -**(*) К # д |
( * е [ 0 ,Г ]), |
где Я = SeLT, что и доказывает теорему.
Утверждение теоремы означает, что при достаточно близких начальных условиях в системах (2.8) и (2.9) бу дут также близки и решения этих систем. Так как урав нение (2.9) описывает идеальное скольжение по пересе чению поверхностей разрыва, а уравнение (2.8) реальный скользящий режим в окрестности этого пересечения (т. е.