книги из ГПНТБ / Коваленко И.Н. Полумарковские модели в задачах проектирования систем управления летательными аппаратами
.pdfАвтопилот обладает способностью обучаться опти мальному и субоптимальному управлению в ранее не встречавшихся обстоятельствах. Улучшения , в поведе нии, которые явились следствием приспособления к опре деленной обстановке, «вспоминаются», когда самолет вновь ів нее попадает. Это происходит независимо от то го, сколько времени истекло с тех пор, как система впер вые столкнулась с этими обстоятельствами.
Таким образом, в трехконтурном автопилоте исполь зуется стратегия выборки информации о передаточных числах АП из ДЗУ БЦВМ и избирательного поощрения с целью поддержания относительно постоянных характе ристик управления при существенных вариациях внут ренней и внешней среды ЛА. При изменении параметров объекта контур самонастройки перестраивает передаточ ные числа аналогового автопилота. Самообучающийся контур корректирует те априорные допущения о свойст вах объекта, которые оказались неточными.
Приведем некоторые подробности устройства и рабо
ты трехкоитурного автопилота. |
качества для |
синтеза |
|
Основной контур. Критерий |
|||
оптимальной системы был взят в виде |
|
||
/= М |
Кс* - І и - |
12,4Ѳ)2 dt |
(2. 43) |
где сж = (1—e~3l)hc |
— желаемый выход; |
|
/гс — ступенчатый управляющий вход ной сигнал;
100
jy — отклонение от расчетного значе-' ния нормального ускорения;
0 — угловая скорость тангажа. Отметим, что из-за ошибок измерений и порывов вет
ра jy и 0 в выражении (2.43) — случайные функции. Ми нимизация функционала (2.43) распадалась на две са мостоятельные задачи. Первая заключалась в оптималь ной оценке состояния объекта, основанной на измерениях
величин jy и 0. Во второй - задаче требовалось найти оптимальное управление ® предположении, что шум от сутствует. При таком подходе функционал качества не содержит случайных переменных.
В результате решения задачи минимизации был по лучен закон управления, в котором используются-опти мальные оценки. В простейшем случае, когда уравнения движения линейные с постоянными коэффициентами, ми нимизация дает закон управления в виде
8В= |
АГ^.а+ЛГаѲ+АГз ^ |
+ К,сж+ КьІгс, (2.44) |
где /(і, . . . , / < 5 |
— коэффициенты усиления; |
|
бв, а — углы отклонения от расчетных значений |
||
|
соответственно угла отклонения рулевого |
|
|
органа бв*, угла атаки а*; |
|
Z a— производная подъемной силы по углу а; |
||
Wn— скорость порыва |
ветра. |
Для удобства математического моделирования было признано целесообразным использовать величины Zacs,
0 и МУЗ 18, а не а, 0 и Wa. Состояние системы определя лось с помощью фильтра Калмана с постоянными коэф фициентами, который сглаживает измерения с шумом и
дает на выходе а, 0 и Wu (или, точнее, 2Ка, 0 и \КП/318). Коэффициенты фильтра устанавливались заранее и.явля лись оптимальными только для одного режима полета.
Для получения закона управления (2.44) и началь ных значений коэффициентов усиления для всего диапа зона изменений условий полета применялась теория оп тимального управления, основанная на использовании метода наименьших квадратов (подробнее об этом см.
[18]).
Контур адаптации состоит из устройства идентифика ции и обучаемого функционального преобразователя (см. рис. 2.14).
101
Устройство идентификации работает от измеряемых величин (скорости тангажа и нормального, ускорения) и известных входов. Его входными величинами являются четыре обобщенных параметра ßi, ß2, ß3 , ß4 , характеризу
ющие объект управления. |
Эти параметры связаны с |
производными М ^ Ма, |
Л1/;, Za следующим обра |
зам: |
|
М а; ßa — ^6ВН |
|
? ' з = = ~ 2 Г 4~ М а ; |
(2. 45) |
р4— Z a . |
Рис. 2. 16. К описанию процесса обучения для определения переда точных чисел автопилота
Задача устройства идентификации — настроить эти параметры так, чтобы поведение модели приближалось (в соответствии с выбранным критерием качества) к'по ведению ЛА. Уравнения устройства идентификации вы ведены с применением байесовского подхода.
Структура другого звена контура адаптации — обуча емого функционального преобразователя — иллюстриру ется на рис. 2. 14. Над множеством идентифицированных параметров объекта осуществляется фиксированное (не
102
зависящее от времени) преобразование, в результате ко торого получается другое множество величин, т. е. Ф= = 7’(ß) • Полученные величины умножаются на веса, а по лучающиеся в результате произведения суммируются. Таким образом
* < - 2 |
*>і]фу |
j - i |
|
Для генерирования каждого коэффициента усиления |
|
обучаемый функциональный |
преобразователь должен |
располагать набором весовых коэффициентов. Первона чально преобразователь был обучен с помощью коэффи циентов усиления, значения которых для 37 режимов полета были получены аналитически. Весь диапазон из менения условий полета квантовался на участки по ско рости— 0,2 М и по высоте-— 3 048 м. Для каждого из этих режимов были подсчитаны значения ß* и затем вы числены соответствующие коэффициенты усиления.
Диапазоны изменения величин |
и рассчитанных ко |
||||||||||
эффициентов |
|
указаны в табл. 2. 3 и 2. 4. |
|
|
|||||||
Система обучалась с при |
|
|
|
|
|
||||||
менением метода наискорей |
|
|
|
|
|
||||||
шего |
спуска. |
Сходимость |
|
|
Таблица. |
2.3 |
|||||
процесса |
обучения иллюст |
Параметр |
|
|
|
||||||
рируется |
графиками |
на |
Диапазонзначений |
||||||||
объекта |
|||||||||||
рис. |
2. 16. |
Максимальная |
|
|
|
|
|
||||
относительная ошибка в вы |
Рі |
от —3,1 |
до —0,369 |
||||||||
числении |
передаточных |
чи |
|||||||||
сел дана |
здесь |
в зависимо |
ß2 |
от —58,9 до —2,79 |
|||||||
от |
3,99 |
до |
71,6 |
||||||||
сти от числа полных циклов |
ß3 |
||||||||||
h |
от —2,02 |
до —0,217 |
|||||||||
обучения |
(каждый цикл со |
|
|
|
|
|
|||||
ответствует |
определенному |
|
|
|
|
|
|||||
режиму полета Ф-101Б). |
|
|
|
|
|
|
|||||
Контур обучения (см. рис. 2.15). Задача контура — |
|||||||||||
руководить глобальным поведением |
системы и опреде |
лять возможно ли существенное улучшение качества ее работы. Для этого применяется градиентный поиск с ис пользованием малых возмущений коэффициентов усиле ния. Когда приращение «улучшения» превысит некоторый , заданный порог, производится переобучение функцио нального преобразователя таким образом, чтобы он вы давал «усовершенствованный» набор весовых коэффици-' ентов для данного режима полета.
103
\
|
Т а б л и ц а 2. 4 |
Выходныевеличиныфункционального |
Желаемыйдиапазон |
преобразователя |
значений |
Коэффициент усиления в цепи об ратной связи (по углу атаки) К і
Коэффициент усиления в цепи обратной связи (по Ѳ) К г ...........
Коэффициент усиления в цепи обрат- |
||||||
ной связи от внешнего возмущения |
||||||
(скорости |
|
порыва |
ветра) |
/Сз |
■ • |
|
Коэффициент |
усиления |
предвари |
||||
тельного |
фильтра |
(от |
управляюще |
|||
го сигнала) |
К і . • |
■ ' ..... |
||||
Коэффициент |
усиления |
разомкнутой |
||||
цепи (от |
управляющего |
сигнала) |
от — 1,92 до —20,7
от 1,111до 27,8
от —0,104 до —0,464
от —0,0685 до — 1,87
Кв ............... от —0,00663 до —0,146
Критерий качества системы «выражен функционалом
„k'
г ?
где cn(k) — измеренное значение нормального ускорения ( + 12,4 0) в момент времени kT\ cm(k) — желаемый вы ход. Экспоненциальный сомножитель используется для учета старения информации *.
Задача заключается в выборе таких значений коэффи циентов усиления автопилота, при которых минимизиру ется показатель качества.
Градиент функционала по передаточным числам в це пях обратной связи имеет вид
k' |
(си (к) - сж) укСц (к). |
V*/ = 2 |
|
к=0 |
|
Градиент измеряемого выходного сигнала vÄc„(/e) нельзя получить непосредственно. Однако можно полу
чить величину v kc(k), где с(к) — выходной сигнал моде ли устройства идентификации. Поэтому предполагалось, что
VKc„(A)~V*c {к).
1Устареваниеданныхвсегдаимеетместоприконечномвременинаблю дения(накопления)сигналовивызываетсяизменениемзначенийизмеряемых параметроввпроцессеполета.
104
Поскольку известны и ошибка системы и приближен ное значение.градиента, для коррекции передаточных чи сел в контуре обучения можно использовать метод на искорейшего спуска.
В системах управления космическими аппаратами длительного действия (2—3 года) и возможно в некото рых других конструкциях представляется целесообразной такая структура БЦВМ, при которой информация от многочисленных датчиков поступает сначала не в про цессор, а в буферную память (БП), где записывается и ждет выборки по запросу процессора (рис. 2. 17). Если
і------------------------- |
1 |
В о з п у щ е н и я
Рис. 2. 17. Структурная схема САУ с БЦВМ:
ИМ—исполнительныймеханизм
все ячейки БП заняты, то вновь поступившая информа ция теряется. РІз БП она может поступать в процессор, если в нем закончилось решение задачи. Эти задачи от ветственны. Поэтому естественно требовать, чтобы веро ятность потери информации не превышала заранее за данной малой величины. Эту величину вместе с требуе мыми значениями характеристик надежности следует записывать в задание на проектирование системы.
При известном темпе поступления и известном ха рактере задач можно сформулировать такие требования к быстродействию БЦВМ и ее математическому обеспе чению, которые исключали бы образование очереди. Од нако, на любом этапе развития вычислительной техники мы сталкиваемся с противоречием между требуемым и
105
физически реализуемым быстродействием, и поэтому об разование очереди заявок вполне реально.
Е сли принять точку зрения о полезности БЦВМ с та
кой структурной организацией, то возникают вопросы -связанные:
—с выбором характеристик для оценки -качества функционирования такой БЦВМ;
—с вычислением ее конструктивных параметров, в
частности, необходимого объема буферной памяти. Анализ БЦВМ можно провести, рассмотрев ее как
систему массового обслуживания с накопителем заявок. Основные результаты в этой области были получены в книге [35].
Будем полагать, что входящий поток заявок (т-раз- /рядных двоичных слов), поступающих в БП, — стацио нарный пуассоновский с интенсивностью %. В буферной памяти могут храниться п таких слов. Если поступившее ■слово застает БП полностью занятой, то оно теряется. Процессор обращается к БП в случайные моменты вре мени и принимает для обработки накопившуюся в БП к этому моменту информацию в двоичном коде. Время решения задачи считается случайной величиной с пока зательным законом распределения. Плотность обслужи вания заявок равна ц.
С учетом этих предположений рассматривается фазо вое пространство состояний БЦВМ, отличающихся друг от друга по числу записанных в БГ? заявок. Эволюция состояний образует однородный по времени марковский процесс и описывается системой линейных дифференци альных уравнений с постоянными коэффициентами:
Я0= - ^ 0.(*)+ |
р 2 Я*(*); |
|
|
Й=1 |
|
|
|
(2.46) |
£ * = — + |
+ |
1 < £ < « ; |
P n = - p P n { t ) + bPn-ir(t), |
. |
где PK(t) — вероятность того, что в момент t в БП хра нится k заявок.
Эта система является статистически устойчивой при
106
(Х/р) <1; следователы-ю, у нее существует установивший ся режим. В этом режиме поведение системы описывает ся системой алгебраических уравнений.
- Ф П + 2 ^ = 0 ;
(2.47)
— ('Ь '-П ^ + 'У Ѵ і-О , 1 < £ 0 ;
- Р « + № и—1= 0 ,
где ÜJ= (X/p.)= Wofic.
Поскольку время переходного процесса в такой СМО пренебрежимо мало по сравнению с временем работы БЦВМ, то именно установившийся режим будет пред ставлять для нас главный интерес.
Решение системы (2.47) имеет вид:
Р ь |
4* |
|
при |
(2.48) |
||
(J, + |
1)*+1 |
|||||
|
|
|
||||
|
Р п |
|
(Ф+ і)л |
(2.49) |
||
|
|
|
|
Поскольку потеря заявки (отказ от обслуживания) может произойти :в результате заполнения .всей БП, ве роятность ее будет определяться соотношением
Р |
~ Р |
(Iіп |
(2. 50) |
— ■ |
|||
пот |
" |
(Ф+1)" |
|
Из этой формулы при заданных производительности процессора и РПот определяется необходимый объем БП
п = ____Р пог_____ |
(2.51) |
In ф — In (<Ь + 1) |
|
Среднее число заявок в БП определяется по формуле
y = ^ k P k. |
(2.52) |
ft- 1 |
|
107
Пример 2.4. Структура проектируемой БЦВМ |
представлена н а' |
|
рис. 2. 17. |
|
|
Исходные данные. |
|
|
1. Вероятность потери информации в результате заполнения БП |
||
не должна превышать Япот = 10~3. |
\ |
|
2. Математическое ожидание времени решения одной задачи в |
||
процессоре t 0о с = 2 |
с. |
|
3. Плотность заявок на входе БП Х=5 с-1. |
|
|
Определить необходимый объем БП. |
|
|
Решение. |
' |
|
1. Определяем |
|
іЬ= х7о6с= 2-5 = 10.
2. По формуле (2.51) находим
In Ю -з
п= ------------------= 75. In 10— In 11
На рис. 2. 18 и 2. 19 представлены графики зависимостей п от ф при Р Пот=10-2 и Рпот=Ю _3 соответственно. На графике рис. 2. 19 обращает на себя внимание крутое возрастание объема БП при ф>30.
|
|
|
|
п |
О |
|
|
|
гмо |
|
|
|
180 |
|
ІО |
|
|
|
ПО |
|
|
|
60 |
|
ю |
|
|
|
|
|
|
|
О |
|
0 1 |
2 |
3 . |
ш |
|
Рис. 2. 18. График зависимости |
Рис. 2. 19. График зависимости |
|||
п от приведенной плотности по- |
. п от ф при Япот= Ю"3 |
|||
тока заявок |
ф |
при |
Р Пот = Ю~2 |
|
В заключение заметим, что рассмотрение БЦВМ и вычислительных систем с разделением времени с пози ций теории массового обслуживания как многофазных СМО — перспективное направление исследований (см. например, работы [3, 48]). Оно находится на одной из своих начальных стадий и предстоит проделать большую работу, раньше чем результаты этого направления мож но будет рекомендовать для структурного синтеза БЦВМ.
Подведем итоги изложенному.
'1. Прежде чем делать выбор в пользу адаптивной системы, необходимо удостовериться в том, что она обла дает явными' преимуществами по сравнению с хорошо спроектированной и тщательно отработанной в ходе ис пытаний более простой стационарной системой. Таким' образом удастся избежать неоправданного обстоятельст вами летной эксплуатации усложнения оборудования.
108
Нужно иметь в виду, что контур адаптации может быть «введен в заблуждение» как некоторыми из своих собственных неисправностей (преимущественно типа «КЗ»), так и внешними факторами: флуктуацией питаю щего напряжения, турбулентностью атмосферы, упруги ми колебаниями конструкции ЛА. Следствием этих явле ний может стать ложная адаптация.
2. Адаптация как метод обеспечения надежности сис тем оказывается целесообразной при неполной начальной информации об объекте, возмущающих воздействиях и начальных условиях. Ее применение эффективно в соче тании со структурной избыточностью на микро- и макро уровнях.
3.Интегро-дифференциальные уравнения вида (2. 10)
иуравнения Колмогорова являются адекватными моде лями надежности адаптивных систем. Они позволили свя
зать в единый ансамбль такие характеристики адаптив ной системы, как скорость адаптации, суммарные интен сивности отказов в основном контуре и контуре самона стройки со свойствами окружения и требованиями к ка честву регулирования. В результате их решения получе ны характеристики безотказности адаптивной системы: вероятность безотказной работы и математическое ожи дание времени до первого попадания в поглощающий экран.
4. Изучение переходных вероятностей дает возмож ность проследить эффект запаздывания адаптации отно сительно изменений среды, наблюдаемый при работе адаптивных систем с обратной связью по критерию ка чества.
Таким образом, анализ решений системы интегродифференциальных уравнений вида (2.10) и уравнений Колмогорова позволят наблюдать не только результат адаптации (достижение цели в меняющемся окружении), но и некоторые черты ее процесса.