Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Коваленко И.Н. Полумарковские модели в задачах проектирования систем управления летательными аппаратами

.pdf
Скачиваний:
9
Добавлен:
23.10.2023
Размер:
7.56 Mб
Скачать

Автопилот обладает способностью обучаться опти­ мальному и субоптимальному управлению в ранее не встречавшихся обстоятельствах. Улучшения , в поведе­ нии, которые явились следствием приспособления к опре­ деленной обстановке, «вспоминаются», когда самолет вновь ів нее попадает. Это происходит независимо от то­ го, сколько времени истекло с тех пор, как система впер­ вые столкнулась с этими обстоятельствами.

Таким образом, в трехконтурном автопилоте исполь­ зуется стратегия выборки информации о передаточных числах АП из ДЗУ БЦВМ и избирательного поощрения с целью поддержания относительно постоянных характе­ ристик управления при существенных вариациях внут­ ренней и внешней среды ЛА. При изменении параметров объекта контур самонастройки перестраивает передаточ­ ные числа аналогового автопилота. Самообучающийся контур корректирует те априорные допущения о свойст­ вах объекта, которые оказались неточными.

Приведем некоторые подробности устройства и рабо­

ты трехкоитурного автопилота.

качества для

синтеза

Основной контур. Критерий

оптимальной системы был взят в виде

 

/= М

Кс* - І и -

12,4Ѳ)2 dt

(2. 43)

где сж = (1—e~3l)hc

— желаемый выход;

 

/гс — ступенчатый управляющий вход­ ной сигнал;

100

jy — отклонение от расчетного значе-' ния нормального ускорения;

0 — угловая скорость тангажа. Отметим, что из-за ошибок измерений и порывов вет­

ра jy и 0 в выражении (2.43) — случайные функции. Ми­ нимизация функционала (2.43) распадалась на две са­ мостоятельные задачи. Первая заключалась в оптималь­ ной оценке состояния объекта, основанной на измерениях

величин jy и 0. Во второй - задаче требовалось найти оптимальное управление ® предположении, что шум от­ сутствует. При таком подходе функционал качества не содержит случайных переменных.

В результате решения задачи минимизации был по­ лучен закон управления, в котором используются-опти­ мальные оценки. В простейшем случае, когда уравнения движения линейные с постоянными коэффициентами, ми­ нимизация дает закон управления в виде

8В=

АГ^.а+ЛГаѲ+АГз ^

+ К,сж+ КьІгс, (2.44)

где /(і, . . . , / < 5

— коэффициенты усиления;

бв, а — углы отклонения от расчетных значений

 

соответственно угла отклонения рулевого

 

органа бв*, угла атаки а*;

Z a— производная подъемной силы по углу а;

Wn— скорость порыва

ветра.

Для удобства математического моделирования было признано целесообразным использовать величины Zacs,

0 и МУЗ 18, а не а, 0 и Wa. Состояние системы определя­ лось с помощью фильтра Калмана с постоянными коэф­ фициентами, который сглаживает измерения с шумом и

дает на выходе а, 0 и Wu (или, точнее, 2Ка, 0 и \КП/318). Коэффициенты фильтра устанавливались заранее и.явля­ лись оптимальными только для одного режима полета.

Для получения закона управления (2.44) и началь­ ных значений коэффициентов усиления для всего диапа­ зона изменений условий полета применялась теория оп­ тимального управления, основанная на использовании метода наименьших квадратов (подробнее об этом см.

[18]).

Контур адаптации состоит из устройства идентифика­ ции и обучаемого функционального преобразователя (см. рис. 2.14).

101

Устройство идентификации работает от измеряемых величин (скорости тангажа и нормального, ускорения) и известных входов. Его входными величинами являются четыре обобщенных параметра ßi, ß2, ß3 , ß4 , характеризу­

ющие объект управления.

Эти параметры связаны с

производными М ^ Ма,

Л1/;, Za следующим обра­

зам:

 

М а; ßa — ^6ВН

? ' з = = ~ 2 Г 4~ М а ;

(2. 45)

р4— Z a .

Рис. 2. 16. К описанию процесса обучения для определения переда­ точных чисел автопилота

Задача устройства идентификации — настроить эти параметры так, чтобы поведение модели приближалось (в соответствии с выбранным критерием качества) к'по­ ведению ЛА. Уравнения устройства идентификации вы­ ведены с применением байесовского подхода.

Структура другого звена контура адаптации — обуча­ емого функционального преобразователя — иллюстриру­ ется на рис. 2. 14. Над множеством идентифицированных параметров объекта осуществляется фиксированное (не

102

зависящее от времени) преобразование, в результате ко­ торого получается другое множество величин, т. е. Ф= = 7’(ß) • Полученные величины умножаются на веса, а по­ лучающиеся в результате произведения суммируются. Таким образом

* < - 2

*>і]фу

j - i

 

Для генерирования каждого коэффициента усиления

обучаемый функциональный

преобразователь должен

располагать набором весовых коэффициентов. Первона­ чально преобразователь был обучен с помощью коэффи­ циентов усиления, значения которых для 37 режимов полета были получены аналитически. Весь диапазон из­ менения условий полета квантовался на участки по ско­ рости— 0,2 М и по высоте-— 3 048 м. Для каждого из этих режимов были подсчитаны значения ß* и затем вы­ числены соответствующие коэффициенты усиления.

Диапазоны изменения величин

и рассчитанных ко­

эффициентов

 

указаны в табл. 2. 3 и 2. 4.

 

 

Система обучалась с при­

 

 

 

 

 

менением метода наискорей­

 

 

 

 

 

шего

спуска.

Сходимость

 

 

Таблица.

2.3

процесса

обучения иллюст­

Параметр

 

 

 

рируется

графиками

на

Диапазонзначений

объекта

рис.

2. 16.

Максимальная

 

 

 

 

 

относительная ошибка в вы­

Рі

от —3,1

до —0,369

числении

передаточных

чи­

сел дана

здесь

в зависимо­

ß2

от —58,9 до —2,79

от

3,99

до

71,6

сти от числа полных циклов

ß3

h

от —2,02

до —0,217

обучения

(каждый цикл со­

 

 

 

 

 

ответствует

определенному

 

 

 

 

 

режиму полета Ф-101Б).

 

 

 

 

 

 

Контур обучения (см. рис. 2.15). Задача контура —

руководить глобальным поведением

системы и опреде­

лять возможно ли существенное улучшение качества ее работы. Для этого применяется градиентный поиск с ис­ пользованием малых возмущений коэффициентов усиле­ ния. Когда приращение «улучшения» превысит некоторый , заданный порог, производится переобучение функцио­ нального преобразователя таким образом, чтобы он вы­ давал «усовершенствованный» набор весовых коэффици-' ентов для данного режима полета.

103

\

 

Т а б л и ц а 2. 4

Выходныевеличиныфункционального

Желаемыйдиапазон

преобразователя

значений

Коэффициент усиления в цепи об­ ратной связи (по углу атаки) К і

Коэффициент усиления в цепи обратной связи (по Ѳ) К г ...........

Коэффициент усиления в цепи обрат-

ной связи от внешнего возмущения

(скорости

 

порыва

ветра)

/Сз

Коэффициент

усиления

предвари­

тельного

фильтра

(от

управляюще­

го сигнала)

К і . •

■ ' .....

Коэффициент

усиления

разомкнутой

цепи (от

управляющего

сигнала)

от — 1,92 до —20,7

от 1,111до 27,8

от —0,104 до —0,464

от —0,0685 до — 1,87

Кв ............... от —0,00663 до —0,146

Критерий качества системы «выражен функционалом

k'

г ?

где cn(k) — измеренное значение нормального ускорения ( + 12,4 0) в момент времени kT\ cm(k) — желаемый вы­ ход. Экспоненциальный сомножитель используется для учета старения информации *.

Задача заключается в выборе таких значений коэффи­ циентов усиления автопилота, при которых минимизиру­ ется показатель качества.

Градиент функционала по передаточным числам в це­ пях обратной связи имеет вид

k'

(си (к) - сж) укСц (к).

V*/ = 2

к=0

 

Градиент измеряемого выходного сигнала vÄc„(/e) нельзя получить непосредственно. Однако можно полу­

чить величину v kc(k), где с(к) — выходной сигнал моде­ ли устройства идентификации. Поэтому предполагалось, что

VKc„(A)~V*c {к).

1Устареваниеданныхвсегдаимеетместоприконечномвременинаблю­ дения(накопления)сигналовивызываетсяизменениемзначенийизмеряемых параметроввпроцессеполета.

104

Поскольку известны и ошибка системы и приближен­ ное значение.градиента, для коррекции передаточных чи­ сел в контуре обучения можно использовать метод на­ искорейшего спуска.

В системах управления космическими аппаратами длительного действия (2—3 года) и возможно в некото­ рых других конструкциях представляется целесообразной такая структура БЦВМ, при которой информация от многочисленных датчиков поступает сначала не в про­ цессор, а в буферную память (БП), где записывается и ждет выборки по запросу процессора (рис. 2. 17). Если

і-------------------------

1

В о з п у щ е н и я

Рис. 2. 17. Структурная схема САУ с БЦВМ:

ИМ—исполнительныймеханизм

все ячейки БП заняты, то вновь поступившая информа­ ция теряется. РІз БП она может поступать в процессор, если в нем закончилось решение задачи. Эти задачи от­ ветственны. Поэтому естественно требовать, чтобы веро­ ятность потери информации не превышала заранее за­ данной малой величины. Эту величину вместе с требуе­ мыми значениями характеристик надежности следует записывать в задание на проектирование системы.

При известном темпе поступления и известном ха­ рактере задач можно сформулировать такие требования к быстродействию БЦВМ и ее математическому обеспе­ чению, которые исключали бы образование очереди. Од­ нако, на любом этапе развития вычислительной техники мы сталкиваемся с противоречием между требуемым и

105

физически реализуемым быстродействием, и поэтому об­ разование очереди заявок вполне реально.

Е сли принять точку зрения о полезности БЦВМ с та­

кой структурной организацией, то возникают вопросы -связанные:

с выбором характеристик для оценки -качества функционирования такой БЦВМ;

с вычислением ее конструктивных параметров, в

частности, необходимого объема буферной памяти. Анализ БЦВМ можно провести, рассмотрев ее как

систему массового обслуживания с накопителем заявок. Основные результаты в этой области были получены в книге [35].

Будем полагать, что входящий поток заявок (т-раз- /рядных двоичных слов), поступающих в БП, — стацио­ нарный пуассоновский с интенсивностью %. В буферной памяти могут храниться п таких слов. Если поступившее ■слово застает БП полностью занятой, то оно теряется. Процессор обращается к БП в случайные моменты вре­ мени и принимает для обработки накопившуюся в БП к этому моменту информацию в двоичном коде. Время решения задачи считается случайной величиной с пока­ зательным законом распределения. Плотность обслужи­ вания заявок равна ц.

С учетом этих предположений рассматривается фазо­ вое пространство состояний БЦВМ, отличающихся друг от друга по числу записанных в БГ? заявок. Эволюция состояний образует однородный по времени марковский процесс и описывается системой линейных дифференци­ альных уравнений с постоянными коэффициентами:

Я0= - ^ 0.(*)+

р 2 Я*(*);

 

 

Й=1

 

 

 

(2.46)

£ * = — +

+

1 < £ < « ;

P n = - p P n { t ) + bPn-ir(t),

.

где PK(t) — вероятность того, что в момент t в БП хра­ нится k заявок.

Эта система является статистически устойчивой при

106

(Х/р) <1; следователы-ю, у нее существует установивший­ ся режим. В этом режиме поведение системы описывает­ ся системой алгебраических уравнений.

- Ф П + 2 ^ = 0 ;

(2.47)

— ('Ь '-П ^ + 'У Ѵ і-О , 1 < £ 0 ;

- Р « + № и—1= 0 ,

где ÜJ= (X/p.)= Wofic.

Поскольку время переходного процесса в такой СМО пренебрежимо мало по сравнению с временем работы БЦВМ, то именно установившийся режим будет пред­ ставлять для нас главный интерес.

Решение системы (2.47) имеет вид:

Р ь

4*

 

при

(2.48)

(J, +

1)*+1

 

 

 

 

Р п

 

(Ф+ і)л

(2.49)

 

 

 

 

Поскольку потеря заявки (отказ от обслуживания) может произойти :в результате заполнения .всей БП, ве­ роятность ее будет определяться соотношением

Р

~ Р

(Iіп

(2. 50)

— ■

пот

"

(Ф+1)"

 

Из этой формулы при заданных производительности процессора и РПот определяется необходимый объем БП

п = ____Р пог_____

(2.51)

In ф — In (<Ь + 1)

 

Среднее число заявок в БП определяется по формуле

y = ^ k P k.

(2.52)

ft- 1

 

107

Пример 2.4. Структура проектируемой БЦВМ

представлена н а'

рис. 2. 17.

 

 

Исходные данные.

 

1. Вероятность потери информации в результате заполнения БП

не должна превышать Япот = 10~3.

\

2. Математическое ожидание времени решения одной задачи в

процессоре t 0о с = 2

с.

 

3. Плотность заявок на входе БП Х=5 с-1.

 

Определить необходимый объем БП.

 

Решение.

'

 

1. Определяем

 

іЬ= х7о6с= 2-5 = 10.

2. По формуле (2.51) находим

In Ю -з

п= ------------------= 75. In 10— In 11

На рис. 2. 18 и 2. 19 представлены графики зависимостей п от ф при Р Пот=10-2 и Рпот=Ю _3 соответственно. На графике рис. 2. 19 обращает на себя внимание крутое возрастание объема БП при ф>30.

 

 

 

 

п

О

 

 

 

гмо

 

 

 

180

ІО

 

 

 

ПО

 

 

 

60

ю

 

 

 

 

 

 

О

0 1

2

3 .

ш

 

Рис. 2. 18. График зависимости

Рис. 2. 19. График зависимости

п от приведенной плотности по-

. п от ф при Япот= Ю"3

тока заявок

ф

при

Р Пот = Ю~2

 

В заключение заметим, что рассмотрение БЦВМ и вычислительных систем с разделением времени с пози­ ций теории массового обслуживания как многофазных СМО — перспективное направление исследований (см. например, работы [3, 48]). Оно находится на одной из своих начальных стадий и предстоит проделать большую работу, раньше чем результаты этого направления мож­ но будет рекомендовать для структурного синтеза БЦВМ.

Подведем итоги изложенному.

'1. Прежде чем делать выбор в пользу адаптивной системы, необходимо удостовериться в том, что она обла­ дает явными' преимуществами по сравнению с хорошо спроектированной и тщательно отработанной в ходе ис­ пытаний более простой стационарной системой. Таким' образом удастся избежать неоправданного обстоятельст­ вами летной эксплуатации усложнения оборудования.

108

Нужно иметь в виду, что контур адаптации может быть «введен в заблуждение» как некоторыми из своих собственных неисправностей (преимущественно типа «КЗ»), так и внешними факторами: флуктуацией питаю­ щего напряжения, турбулентностью атмосферы, упруги­ ми колебаниями конструкции ЛА. Следствием этих явле­ ний может стать ложная адаптация.

2. Адаптация как метод обеспечения надежности сис­ тем оказывается целесообразной при неполной начальной информации об объекте, возмущающих воздействиях и начальных условиях. Ее применение эффективно в соче­ тании со структурной избыточностью на микро- и макро­ уровнях.

3.Интегро-дифференциальные уравнения вида (2. 10)

иуравнения Колмогорова являются адекватными моде­ лями надежности адаптивных систем. Они позволили свя­

зать в единый ансамбль такие характеристики адаптив­ ной системы, как скорость адаптации, суммарные интен­ сивности отказов в основном контуре и контуре самона­ стройки со свойствами окружения и требованиями к ка­ честву регулирования. В результате их решения получе­ ны характеристики безотказности адаптивной системы: вероятность безотказной работы и математическое ожи­ дание времени до первого попадания в поглощающий экран.

4. Изучение переходных вероятностей дает возмож­ ность проследить эффект запаздывания адаптации отно­ сительно изменений среды, наблюдаемый при работе адаптивных систем с обратной связью по критерию ка­ чества.

Таким образом, анализ решений системы интегродифференциальных уравнений вида (2.10) и уравнений Колмогорова позволят наблюдать не только результат адаптации (достижение цели в меняющемся окружении), но и некоторые черты ее процесса.

Соседние файлы в папке книги из ГПНТБ