Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Коваленко И.Н. Полумарковские модели в задачах проектирования систем управления летательными аппаратами

.pdf
Скачиваний:
9
Добавлен:
23.10.2023
Размер:
7.56 Mб
Скачать

х(0)>0. Дополним график функции x = x(t) (рис. 1.2) в точках разрыва отрезками прямых, параллельных оси Ох так, чтобы в результате получилась непрерывная кри­

вая на плоскости

(t, х) . Проведем в этой плоскости пря­

 

 

мую

x = tn•

Наимень­

 

 

шее значение t, при ко­

 

 

тором X (t) = tn, обозна­

 

 

чим ы„. Множество мо­

 

 

ментов времени

{ип}

 

 

назовем процессом вос­

 

 

становления с изменен­

 

 

ным

временем.

Если,

 

 

в

частности,

x ( t ) = t ь

Рис. 1.2. График

случайной функ­

тогда un= t „ ,

 

0.

 

Вначале дадим фи­

ции x( t)

зическую интерпрета­

 

 

цию

замены

времени.

Представим себе, что имеется бесконечный запас элемен­ тов с ресурсами надежности £0, іь • • •. Èn,__ Когда ре­ сурс надежности п-го элемента исчерпывается, этот эле­ мент отказывает и немедленно заменяется (п+1)-м элементом. Обозначим через y(t) ресурс надежности эле­ мента, служащего в момент L Если ресурс надежности исчерпывается со скоростью, равной единице, то у (t) бу­

дет функцией, которая в

интервалах (tn, tn+\)

убывает

с единичной скоростью

(рис. 1.3,а). В этом

случае

y{t )=yt (см. выше). Если же ресурс надежности исчер­ пывается со скоростью y{t), тогда у'(t) = —ij(t) в интер­ валах между скачками процесса y(t). Если процесс х(() имеет производную, то х'(і) =у(і).

Так, например, представим себе устройство периоди­ ческого действия, отказы которого возможны в интерва­ лах длины ті, сменяющихся интервалами длины to, в ко­ торых отказы невозможны. Поведение функции у (f) в этом случае будет таким, как показано на рис. 1.3,6. Описанная ситуация характерна для практики эксплуа­ тации сложных систем.

Предположим, что процесс восстановления является стационарным и É (+0) =0. Пусть, далее x(t) непрерывно дифференцируема с вероятностью, равной единице. Обоз­ начим через \(t)dt вероятность того, что в интервале (t, t+dt) произойдет восстановление для процесса {ип}. Тогда

Х (0=-^ -М [х, (<)].

(1.120)

40

Фиксируем некоторые

Т\ <Т2 и обозначим через

Я {Tu Т2) вероятность того, что в интервале

(Ти Т2) не

произойдет ни одного восстановления процесса {ип}.

Для соответствующей формулы понадобятся функции:

оо

 

 

~®(*) = -L ^

[ l - F ( x ) ] d x ;

(1.121)

Я

 

 

G{z) = P { { x { T J - x { T $ < z ) .

(1 .1 2 2 )

Рис. 1.3. Ресурс надежности элемента как функция времени

Формула для q{T\, Т2) имеет вид

Ч{Тг> Тъ) = ]

®{z)dG{z).

(1.123)

о

 

 

 

Рассмотрим произвольное число

моментов

времени

Т\ <Т2< .. .<Тт и обозначим

через

Я(Гь..., Tm)dTi...dTm

вероятность события, состоящего в том, что в каждом из

интервалов

ь T\ + d T

{ ) (Tm, Tm+dTm)

происходит

одно восстановление процесса {«в }.

совместную

Обозначим через р{аи...,ат-]\ &і,...,&,„)

плотность вероятности случайных величин

 

•^(А)

x{t^), x(ta)

х((%), .. . , х(£т)

 

 

х' ) , . . . , x ’ (tm),

 

предположив, что такая плотность существует. При этом предположении справедлива формула

ЦТѵ . . . , Т п)=

 

— j" • • • J bx. . . bmH (ß-x).. .H (am—x) p (Ox,. . . ,

 

b , , . . . , bm)da i . . . d b m,

(1.124)

где H { t ) — функция восстановления процесса (АД.

41

Пусть при тех же условиях \.\,(Tu...,Tm)dT[...dTm— ве' роятность события, состоящего в том, что в каждом^ из интервалов (Ти T\ + d T \ ) (7\„, Tm+dTm) произойдет по одному восстановлению процесса {м,Д, а в промежу­ точных интервалах (T\ + dTu 7\);...; + d T m~i, Tm) не будет ни одного восстановления. Тогда справедлива

формула

(в предположении,

что

обладают плот­

ностью)

 

-

1

 

|Х(7V . . . ,

7\J =

 

= "т” ^

' \ Ь1ЬѴ - bmF'

 

P (al’ ■■■’ ам-1;

 

bv . . . , b„,)dav .. dbm.

(1.125)

Альтернирующие процессы восстановления

Пусть v(t) — определенный при

0 случайный про­

цесс. траектории которого представляют собой ступенча­ тые функции со значениями «О» п «1». Допустим, что су­ ществует последовательность моментов t \ < t 2< . . . < t n<..~,

вкаждый из которых процесс изменяет свое состояние. Возможны два случая: 1) v ( t ) = 0, 0<^<^; 2) v(t) = 1,

0< /< г‘|. В первом случае ѵ (/)= 0 в интервалах (to, (з),

(U,

v ( t ) =

1 в интервалах (ti,to), {h, U),.... Во вто­

ром случае \ ( t )

=0 .в интервалах ( f,, t2),

(із, /4 ),...; v(t)

= 1

в интервалах (t2, і з ) , (t^, / 5 ) , . . . .

и і21\,—— не­

 

В обоих случаях предположим, что t\

зависимые случайные величины. Если в интервале (0,£і) v(t) = 1 с вероятностью р, то Р (Л < 0 = С?0(Л; если v(t) = = 0 с вероятностью q = 1—р, то Р <t) —Fo{t).

Длина каждого интервала (tn, Л1+1 ) ( п ^ \ ) , если в

этом интервале ѵ(Т)=0 распределена по закону P{tn+X— —tn< t) =F(t); если же v(t) = 1, то закон распределения P(tn+\tn< t ) = G(t). Определенный таким образом про­ цесс v(t) называется альтернирующим процессом восста­ новления.

Обозначим через p(t) вероятность того, что ѵ(£) = 1. Для того, чтобы вычислить эту вероятность, введем вспо­ могательный альтернирующий процесс восстановления, у которого F(t) и G(t) — те же, что и у процесса v(t), но в качестве р и G0(t) взяты соответственно «1» и G(t). Обозначим через po{t) .вероятность того, что вспомога­ тельный процесс принимает значение «1» в момент t.

42

Пусть Ho(l') — функция восстановления простого про­

цесса восстановления с функцией распределения

вида

 

 

і

 

 

 

 

^ (S « < 0 =

J F{ t ~x ) dQ { x ) .

 

(1.126)

 

 

U

 

 

 

Тогда

 

 

 

 

 

 

Po{t )=l —O(0 +

j [l — Q{t —x)]d.H0{x).

(1.127)

 

 

и

 

 

 

Функцию р(і) можно найти по формуле

 

 

 

 

t

 

 

 

p(t) = p [ l —Оо(0] + 1 p 0{t — x)dR{x),

(1.128)

 

 

О

 

 

 

где

 

 

 

 

 

 

Rif) = P j Qü{t — x)dF{x)-\-qF0 (é).

 

 

 

о

 

 

 

 

Если

хотя бы одно из распределений F(t)

или G(t)

является нерешетчатым, то при

-о о

 

 

 

Н т/7(0 = ----^— ,

(1.129)

 

 

То + Tj

 

 

- где т0 = j

tdF (t), тх = j' tdO (t)

и хотя бы одна

из

вели­

U

U

 

 

 

 

чин т0 или тх конечна.

 

 

 

 

1.5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ

ПРОЦЕССОМ

 

 

ВОССТАНОВЛЕНИЯ

 

 

 

 

Пусть имеется некоторое множество S управлений s. Если мы выберем управление s £ S, то происходит неко­ торый процесс случайной длительности |(s) с ограничен­ ным по всему множеству 5 положительным математичес­ ким ожиданием x(s) и ,в течение этого времени выраба­ тываются случайные значения iii(s),...,rim(s) некоторых числовых характеристик.

Так, например, допустим, что поставлена в эксплуата­ цию новая система. Управление s определяется режимом ее эксплуатации, профилактическими работами, функци-

43

опальным контролем, ремонтом пли заменой элементов системы. Через случайное время |(s) система выйдет из строя и должна будет замениться новой. Тогда числовы­ ми характеристиками, выработанными за период £(s), будут следующие:

T|I (S) — объем работы, выполненной системой, .в опре­ деленных единицах;

il2 (s) — затраты на эксплуатацию системы.

По истечении времени £(s) процесс повторяется, т. е. мы снова выбираем управление (скажем, s'), в результа­ те чего происходит процесс случайной длительности |(s') и вырабатываются характеристики гр (s') ,...,r]m(s'). Пред­ положим, что этот процесс повторяется до бесконечности, так что имеем последовательность управлений s0= s', Si = =s',...sn... п соответствующую последовательность дли­

тельностей процессов £(s0), !(si),.-.,£(s„),-.. и числовых характеристик г| (su) , т| (si) , . . . , 1 1 (s„),..., где

ri(s)= (ri1(s ),..., \,(s )).

Основным предположением будет следующее. Если sn

фиксировано,

то случайный івектор

{^(sn),

r)(s71)} не за­

висит от совокупности случайных векторов

{ (|(s t) , ті (si));

— lj.

Интервал (0, £(s0))

назовем нулевым;

интервал

(£(s„_i), £(sn) ) — п-м циклом (п ^ І).

Если

рассмотреть моменты A, = i(si)+ ... + i(s n) ПРН

n^. О, то эти моменты, вообще говоря, не будут образовы­ вать процесс восстановления. Однако, легко понять, ес­ ли si= s 2= ... = 5n=..., тогда это будет процесс восстанов­ ления.

В общем случае мы исключим из рассмотрения управ­ ления, при которых с положительной вероятностью

1іпП„<со.

Таким образом, всегда 1іпН„= оо.

П-*-оо

ft-*-со

Рассмотрим функционирование системы в течение времени Т. Пусть tnT ^ T<tjvr +i• Тогда можно опре­ делить суммарные значения характеристик:

'’li {Г)—

(5о)+ • • ■+ 'Пі(5уѵг)-j- ѴФ (SNT+1 );

 

 

(1.

130)

(Г ) 11m(S0)+ •■+ Лm(SArT) -f-б^ТЦ^Л^-І-і),

 

где О ^Ѳ у^І;

— величины, точное значение ко­

торых мы определять не будем.

 

44

Записанные равенства можно интерпретировать сле­ дующим образом. Если па отрезке времени [О, Т] уложи­ лось некоторое число циклов, то суммарное значение ха­ рактеристики r|j за время Т есть сумма значений этой характеристики по данным циклам плюс некоторая часть значений Ртой характеристики по циклу, не уложившему­ ся полностью на отрезке {О, Г].

Теперь сформулируем следующую задачу. Обозначим

~ y r\i(T) = Zj {и, Т)\

(1.131)

где и (so, s 1 ,...,sn,...).

Обозначим через 50 множество стратегий и, для кото­ рых существуют такие постоянные Zj(u), что для любого

е > 0

Р (I г } (и, Т) - г, (и) |< е) —>1 (Г —>оо).

Требуется выбрать стратегию и £ S0 таким образом, чтобы вектор {z\ (и) ,...,2 т_і (и) } принадлежал некоторо­

му выпуклому множеству Ф и при этом функция zm(u) была бы минимально возможной.

Типичным примером является требование минимиза­ ции z m(u) при условии, что

(и)1 < у < / п — 1.

Будем считать, что множество 5 замкнуто и допуска­ ет операцию смешивания. Последнее означает следую­ щее. Пусть S i , . .. ,s N управления из множества 5. Тогда

существует рандомизированное управление, при котором Si применяется с вероятностью ри где PU--->PN — любое распределение вероятностей. Нам понадобится лишь од­ но следствие этого свойства, а именно такое: множество векторов {t(s), i()i(s),...,Tj}m(s) } является выпуклым, где

M[ily(s)] = ^y(s);

l < y ' < m-

(1.132)

Будем считать, что эти величины конечны для любого s € S и пусть

*(S) = № L(S),-.->US))-

(1-133)

Далее можно определить

Ь * № = ^ Т Т ’ 1 < / < т - T(S)

Предположим, что выполнены следующие условия.

45.

1.Для любой последовательности управлений {sn}

последовательность

случайных

векторов

{(E(s,:)>

1]! (s;), • • ■, Tlm(Sj))}

удовлетворяет

закону больших чи­

сел в следующем виде.

 

 

 

П

 

 

 

 

Если 2 х isi)

°°і то

 

 

і~0

 

 

 

 

i«=0

f=0

i“0

0

(/z—» oo);

J

 

2

Vs/)-M

2

^(Si) >sii * (5/)

-> 0

при лю­

1=0

j=0

 

/=0

 

 

бом e)>0 (/z—<• oo).

 

 

 

 

2.

Ж [1 Лу (-s)H <

c* (5);

 

 

 

где c> 0 — константа.

 

 

 

 

Предположим, что

 

 

 

 

 

Ф* (sH:) =

min

= lim m

.

(1. 133)

 

 

se//

T ( S )

6-vo іб/-/Е T ( S )

 

 

где s* — некоторый элемент множества 5;

H — множество тех s, для которых^* (•s),...,<j'^_1(s))€ Ф; Н е — множество тех s, для которых (Ій* (s),..., (s))

принадлежит е-окрестности Ф£ множества Ф1.

Теорема 1. Стратегия «*=(s*, s *,.... s*,...) принад­ лежит So и является решением поставленной задачи.

Эта теорема носит экзистенциальный характер. Сле­ дующая же теорема указывает способ построения опти­

мальной стратегии.

 

 

 

такие

Теорема 2. В условиях теоремы 1 существуют

вещественные числа Ло, Яі, Х г , Х т, что

задача

мини­

мизации ojim*(s) при условии

(i[4

* (s), ... ,

і]эП_і* (s) ) б Ф

эквивалентна задаче минимизации суммы

 

 

 

т

 

 

 

а 0s)= V (s)+

2

M V )

 

 

о

І=1

 

 

 

по множеству 5.

 

 

 

 

1 Совокупность векторов, каждый из которых либо входит в Ф, либо находится на расстоянии, меньшем е, от некоторого вектора из множества Ф, называется в-окрестностыо множества Ф.

46

Приведенная теорема позволяет во многих практи­ ческих случаях сводить задачу построения оптимальной решающей функции с неаддитивной функцией убытка

кзадаче с аддитивной функцией убытка.

Вкачестве примера рассмотрим задачу выбора опти­ мального плана профилактики, решенную в гл. IV иным методом.

Пусть время X жизни элемента распределено по за­ кону F ( t ) = P ( X < t ) . Если элемент отказал, то он заме­ няется новым, причем среднее время замены равно Ts. Если произведена профилактика ранее отказа элемента, то средняя длительность профилактики равна T,n< T s. Требуется оптимальным образом выбрать функцию рас­ пределения G(x) момента Y проведения профилактики с тем, чтобы максимизировать вероятность застать эле­ мент'в исправном состоянии.

Обозначим через т среднюю длительность цикла между возвращениями элемента в исходное состояние, а через ф — среднее время пребывания элемента в нера­ бочем состоянии (замены или профилактики) в течение одного цикла. Тогда готовность элемента

r _ P ( X < Y ) T s + P ( X > Y ) T m '

 

X

 

 

По теореме 2 максимизация Р равнозначна максими­

зации функции

 

 

л = х0т + X, [Р (V < г ) г , + я ( * >

n V J =

=

X0jf \ \ - F m \ - G { t ) ] d t + P{X<Y) Ts+ P { X > Y ) T , ^ +

+

Х1[Р(Ѵ<Е)ГІ+ P{X>Y) Tm] - Х0 f [1- Я (t)][\ -G(t)[dt +

 

О

 

+(Xo+Xx) JTs J [1-0(t)]dF{t)+Tm ( l - f [1-G{t)\dF(t)

=

X0 f [l-P W ][l-O (0 ]^ + (X 0+X1) ( r ,- 7 ’J Cf [1 - 0 ( t ) IX

 

6

ö

 

X d.F{t) + (X0+Xx)7V = ] (X0 [1-

F(t)} X

 

6

 

Tm)F' (/)) [1 ~ G 00] ^-KXu-h^i) 7'/n-

47

Если Ао и Ао + Аі одного знака, то решение будет вы­

рожденным. Так,

если А0> 0 и Ао + Аі>0,

следует поло­

жить G ( t ) =0

для

всех t, т. е. время

профилактики

равно оо.

и А0 + Аі<0, нужно положить G(t) = 1 при

Если А0< 0

всех t > 0. Очевидно, оба этих случая не реальны.

Если Ао< 0 и Ао + Аі>0, тогда решение будет одним из двух предыдущих.

Остается случай Ао>0, а Ло + Аі<0.

Р'(П

монотонно возрастающая функция, то

Если 1- F{t)

уравнение

 

 

*0П -

F (0] + (Xo+XJ (Г, -

T J F' (()

имеет единственный корень у = Y (~^~j

в некотором интер­

вале изменения Лі/А0.

Поскольку при t < y выражение в фигурных скобках положительно, а при t > у отрицательно, то оптимальным будет выбор

0 ( / ) = Г °

при 1< Т ,

\ 1

при f^>y.

Остается рассмотреть

первоначальное выражение

для Р, в которое подставлено последнее выражение G(t), и найти его максимум по у.

1.6. ПРАВИЛА ОСТАНОВКИ

Предположим, что наблюдается некоторая последова­

тельность случайных величин

| 2, • • •, £п, • ■■■Правилом

остановки

процесса

наблюдения

называется

функция

ѵ(!і, g2, •••,

In,--.),

принимающая

значения 0,

1, 2,...

иимеющая следующий смысл. Пусть ѵ (хи х2, ... х„,...) =

=т. Тогда, если g, = JCI....... gm = xm, процесс наблюдения случайной последовательности заканчивается на пг

шаге, т.

е. наблюдаются только случайные

величины

Ь, • • •, Im,

а величины £т+ь lm+i, ■■■уже не наблюдаются.

Чтобы правило остановки имело реальный смысл,

нужно потребовать, чтобы v(xh ..., xm,...)

не

зависела

ОТ Xm+1,

Xm+2, ... при условии,

что ѵ(Хі, .... xm, . . . ) = m .

Другими словами, решение об

остановке

процесса на­

блюдений должно приниматься на основании уже имею­ щихся, а не будущих наблюдений,

48

\

Если v(gi, g2, ■■•, i«,...) =0, то это означает, что при­ нято решение вообще не производить наблюдений над случайIIыми величинами.

Рис. 1.4. «Дерево» процесса реализации случайных величин

Правила остановки хорошо представить в том слу­ чае, когда каждая из случайных величин может прини­ мать лишь конечное число значений. В этом случае, как

Фп

Рис. 1.5. К

рассмотрению

Рис. 1.6. Система барьеров для блуж-

правнла

остановки

дающей частицы

показано на рис. 1.4, процесс реализации случайных величин gi, g2, ■■• можно представить в виде «дерева». Каждой вершине 1-го ранга соответствует некоторое зна­ чение gi; каждой вершине 2-го ранга — некоторое значе­ ние пары (gi, g2) и т. д. Правило остановки в этом случае

можно

интерпретировать как «обрубывание» веток «де­

рева»

(рис. 1.5).

 

Нужно заметить, что даже при небольшом числе воз­

можных значений случайных величин

«деревья» «бы­

49

Соседние файлы в папке книги из ГПНТБ