![](/user_photo/_userpic.png)
книги из ГПНТБ / Коваленко И.Н. Полумарковские модели в задачах проектирования систем управления летательными аппаратами
.pdfх(0)>0. Дополним график функции x = x(t) (рис. 1.2) в точках разрыва отрезками прямых, параллельных оси Ох так, чтобы в результате получилась непрерывная кри
вая на плоскости |
(t, х) . Проведем в этой плоскости пря |
|||||
|
|
мую |
x = tn• |
Наимень |
||
|
|
шее значение t, при ко |
||||
|
|
тором X (t) = tn, обозна |
||||
|
|
чим ы„. Множество мо |
||||
|
|
ментов времени |
{ип} |
|||
|
|
назовем процессом вос |
||||
|
|
становления с изменен |
||||
|
|
ным |
временем. |
Если, |
||
|
|
в |
частности, |
x ( t ) = t ь |
||
Рис. 1.2. График |
случайной функ |
тогда un= t „ , |
|
0. |
||
|
Вначале дадим фи |
|||||
ции x( t) |
зическую интерпрета |
|||||
|
|
цию |
замены |
времени. |
Представим себе, что имеется бесконечный запас элемен тов с ресурсами надежности £0, іь • • •. Èn,__ Когда ре сурс надежности п-го элемента исчерпывается, этот эле мент отказывает и немедленно заменяется (п+1)-м элементом. Обозначим через y(t) ресурс надежности эле мента, служащего в момент L Если ресурс надежности исчерпывается со скоростью, равной единице, то у (t) бу
дет функцией, которая в |
интервалах (tn, tn+\) |
убывает |
с единичной скоростью |
(рис. 1.3,а). В этом |
случае |
y{t )=yt (см. выше). Если же ресурс надежности исчер пывается со скоростью y{t), тогда у'(t) = —ij(t) в интер валах между скачками процесса y(t). Если процесс х(() имеет производную, то х'(і) =у(і).
Так, например, представим себе устройство периоди ческого действия, отказы которого возможны в интерва лах длины ті, сменяющихся интервалами длины to, в ко торых отказы невозможны. Поведение функции у (f) в этом случае будет таким, как показано на рис. 1.3,6. Описанная ситуация характерна для практики эксплуа тации сложных систем.
Предположим, что процесс восстановления является стационарным и É (+0) =0. Пусть, далее x(t) непрерывно дифференцируема с вероятностью, равной единице. Обоз начим через \(t)dt вероятность того, что в интервале (t, t+dt) произойдет восстановление для процесса {ип}. Тогда
Х (0=-^ -М [х, (<)]. |
(1.120) |
40
Фиксируем некоторые |
Т\ <Т2 и обозначим через |
|
Я {Tu Т2) вероятность того, что в интервале |
(Ти Т2) не |
|
произойдет ни одного восстановления процесса {ип}. |
||
Для соответствующей формулы понадобятся функции: |
||
оо |
|
|
~®(*) = -L ^ |
[ l - F ( x ) ] d x ; |
(1.121) |
Я |
|
|
G{z) = P { { x { T J - x { T $ < z ) . |
(1 .1 2 2 ) |
Рис. 1.3. Ресурс надежности элемента как функция времени
Формула для q{T\, Т2) имеет вид
Ч{Тг> Тъ) = ] |
®{z)dG{z). |
(1.123) |
|
о |
|
|
|
Рассмотрим произвольное число |
моментов |
времени |
|
Т\ <Т2< .. .<Тт и обозначим |
через |
Я(Гь..., Tm)dTi...dTm |
вероятность события, состоящего в том, что в каждом из
интервалов |
(Ть T\ + d T |
{ ) (Tm, Tm+dTm) |
происходит |
одно восстановление процесса {«в }. |
совместную |
||
Обозначим через р{аи...,ат-]\ &і,...,&,„) |
|||
плотность вероятности случайных величин |
|
||
•^(А) |
x{t^), x(ta) |
х((%), .. . , х(£т) |
|
|
х' (А) , . . . , x ’ (tm), |
|
предположив, что такая плотность существует. При этом предположении справедлива формула
ЦТѵ . . . , Т п)= |
|
— j" • • • J bx. . . bmH (ß-x).. .H (am—x) p (Ox,. . . , |
|
b , , . . . , bm)da i . . . d b m, |
(1.124) |
где H { t ) — функция восстановления процесса (АД.
41
Пусть при тех же условиях \.\,(Tu...,Tm)dT[...dTm— ве' роятность события, состоящего в том, что в каждом^ из интервалов (Ти T\ + d T \ ) (7\„, Tm+dTm) произойдет по одному восстановлению процесса {м,Д, а в промежу точных интервалах (T\ + dTu 7\);...; + d T m~i, Tm) не будет ни одного восстановления. Тогда справедлива
формула |
(в предположении, |
что |
обладают плот |
ностью) |
|
- |
1 |
|
|Х(7V . . . , |
7\J = |
|
= "т” ^ |
' \ Ь1ЬѴ - bmF' |
|
P (al’ ■■■’ ам-1; |
|
bv . . . , b„,)dav .. dbm. |
(1.125) |
|
Альтернирующие процессы восстановления |
|||
Пусть v(t) — определенный при |
0 случайный про |
цесс. траектории которого представляют собой ступенча тые функции со значениями «О» п «1». Допустим, что су ществует последовательность моментов t \ < t 2< . . . < t n<..~,
вкаждый из которых процесс изменяет свое состояние. Возможны два случая: 1) v ( t ) = 0, 0<^<^; 2) v(t) = 1,
0< /< г‘|. В первом случае ѵ (/)= 0 в интервалах (to, (з),
(U, |
v ( t ) = |
1 в интервалах (ti,to), {h, U),.... Во вто |
|
ром случае \ ( t ) |
=0 .в интервалах ( f,, t2), |
(із, /4 ),...; v(t) — |
|
= 1 |
в интервалах (t2, і з ) , (t^, / 5 ) , . . . . |
и і2—1\,—— не |
|
|
В обоих случаях предположим, что t\ |
зависимые случайные величины. Если в интервале (0,£і) v(t) = 1 с вероятностью р, то Р (Л < 0 = С?0(Л; если v(t) = = 0 с вероятностью q = 1—р, то Р (Л <t) —Fo{t).
Длина каждого интервала (tn, Л1+1 ) ( п ^ \ ) , если в
этом интервале ѵ(Т)=0 распределена по закону P{tn+X— —tn< t) =F(t); если же v(t) = 1, то закон распределения P(tn+\—tn< t ) = G(t). Определенный таким образом про цесс v(t) называется альтернирующим процессом восста новления.
Обозначим через p(t) вероятность того, что ѵ(£) = 1. Для того, чтобы вычислить эту вероятность, введем вспо могательный альтернирующий процесс восстановления, у которого F(t) и G(t) — те же, что и у процесса v(t), но в качестве р и G0(t) взяты соответственно «1» и G(t). Обозначим через po{t) .вероятность того, что вспомога тельный процесс принимает значение «1» в момент t.
42
Пусть Ho(l') — функция восстановления простого про
цесса восстановления с функцией распределения |
вида |
||||
|
|
і |
|
|
|
|
^ (S « < 0 = |
J F{ t ~x ) dQ { x ) . |
|
(1.126) |
|
|
|
U |
|
|
|
Тогда |
|
|
|
|
|
|
Po{t )=l —O(0 + |
j [l — Q{t —x)]d.H0{x). |
(1.127) |
||
|
|
и |
|
|
|
Функцию р(і) можно найти по формуле |
|
|
|||
|
|
t |
|
|
|
p(t) = p [ l —Оо(0] + 1 p 0{t — x)dR{x), |
(1.128) |
||||
|
|
О |
|
|
|
где |
|
|
|
|
|
|
Rif) = P j Qü{t — x)dF{x)-\-qF0 (é). |
|
|
||
|
о |
|
|
|
|
Если |
хотя бы одно из распределений F(t) |
или G(t) |
|||
является нерешетчатым, то при |
-о о |
|
|
||
|
Н т/7(0 = ----^— , |
(1.129) |
|||
|
|
То + Tj |
|
|
|
- где т0 = j |
tdF (t), тх = j' tdO (t) |
и хотя бы одна |
из |
вели |
|
U |
U |
|
|
|
|
чин т0 или тх конечна. |
|
|
|
|
|
1.5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ |
ПРОЦЕССОМ |
|
|
||
ВОССТАНОВЛЕНИЯ |
|
|
|
|
Пусть имеется некоторое множество S управлений s. Если мы выберем управление s £ S, то происходит неко торый процесс случайной длительности |(s) с ограничен ным по всему множеству 5 положительным математичес ким ожиданием x(s) и ,в течение этого времени выраба тываются случайные значения iii(s),...,rim(s) некоторых числовых характеристик.
Так, например, допустим, что поставлена в эксплуата цию новая система. Управление s определяется режимом ее эксплуатации, профилактическими работами, функци-
43
опальным контролем, ремонтом пли заменой элементов системы. Через случайное время |(s) система выйдет из строя и должна будет замениться новой. Тогда числовы ми характеристиками, выработанными за период £(s), будут следующие:
T|I (S) — объем работы, выполненной системой, .в опре деленных единицах;
il2 (s) — затраты на эксплуатацию системы.
По истечении времени £(s) процесс повторяется, т. е. мы снова выбираем управление (скажем, s'), в результа те чего происходит процесс случайной длительности |(s') и вырабатываются характеристики гр (s') ,...,r]m(s'). Пред положим, что этот процесс повторяется до бесконечности, так что имеем последовательность управлений s0= s', Si = =s',...sn... п соответствующую последовательность дли
тельностей процессов £(s0), !(si),.-.,£(s„),-.. и числовых характеристик г| (su) , т| (si) , . . . , 1 1 (s„),..., где
ri(s)= (ri1(s ),..., \,(s )).
Основным предположением будет следующее. Если sn
фиксировано, |
то случайный івектор |
{^(sn), |
r)(s71)} не за |
|
висит от совокупности случайных векторов |
{ (|(s t) , ті (si)); |
|||
— lj. |
Интервал (0, £(s0)) |
назовем нулевым; |
||
интервал |
(£(s„_i), £(sn) ) — п-м циклом (п ^ І). |
|||
Если |
рассмотреть моменты A, = i(si)+ ... + i(s n) ПРН |
n^. О, то эти моменты, вообще говоря, не будут образовы вать процесс восстановления. Однако, легко понять, ес ли si= s 2= ... = 5n=..., тогда это будет процесс восстанов ления.
В общем случае мы исключим из рассмотрения управ ления, при которых с положительной вероятностью
1іпП„<со. |
Таким образом, всегда 1іпН„= оо. |
П-*-оо |
ft-*-со |
Рассмотрим функционирование системы в течение времени Т. Пусть tnT ^ T<tjvr +i• Тогда можно опре делить суммарные значения характеристик:
'’li {Г)— |
(5о)+ • • ■+ 'Пі(5уѵг)-j- ѴФ (SNT+1 ); |
|
|
(1. |
130) |
(Г ) — 11m(S0)+ •■+ Лm(SArT) -f-б^ТЦ^Л^-І-і), |
|
|
где О ^Ѳ у^І; |
— величины, точное значение ко |
|
торых мы определять не будем. |
|
44
Записанные равенства можно интерпретировать сле дующим образом. Если па отрезке времени [О, Т] уложи лось некоторое число циклов, то суммарное значение ха рактеристики r|j за время Т есть сумма значений этой характеристики по данным циклам плюс некоторая часть значений Ртой характеристики по циклу, не уложившему ся полностью на отрезке {О, Г].
Теперь сформулируем следующую задачу. Обозначим
~ y r\i(T) = Zj {и, Т)\ |
(1.131) |
где и —(so, s 1 ,...,sn,...).
Обозначим через 50 множество стратегий и, для кото рых существуют такие постоянные Zj(u), что для любого
е > 0
Р (I г } (и, Т) - г, (и) |< е) —>1 (Г —>оо).
Требуется выбрать стратегию и £ S0 таким образом, чтобы вектор {z\ (и) ,...,2 т_і (и) } принадлежал некоторо
му выпуклому множеству Ф и при этом функция zm(u) была бы минимально возможной.
Типичным примером является требование минимиза ции z m(u) при условии, что
(и)1 < у < / п — 1.
Будем считать, что множество 5 замкнуто и допуска ет операцию смешивания. Последнее означает следую щее. Пусть S i , . .. ,s N — управления из множества 5. Тогда
существует рандомизированное управление, при котором Si применяется с вероятностью ри где PU--->PN — любое распределение вероятностей. Нам понадобится лишь од но следствие этого свойства, а именно такое: множество векторов {t(s), i()i(s),...,Tj}m(s) } является выпуклым, где
M[ily(s)] = ^y(s); |
l < y ' < m- |
(1.132) |
Будем считать, что эти величины конечны для любого s € S и пусть
*(S) = № L(S),-.->US))- |
(1-133) |
Далее можно определить
Ь * № = ^ Т Т ’ 1 < / < т - T(S)
Предположим, что выполнены следующие условия.
45.
1.Для любой последовательности управлений {sn}
последовательность |
случайных |
векторов |
{(E(s,:)> |
|
1]! (s;), • • ■, Tlm(Sj))} |
удовлетворяет |
закону больших чи |
||
сел в следующем виде. |
|
|
|
|
П |
|
|
|
|
Если 2 х isi) |
°°і то |
|
|
|
і~0 |
|
|
|
|
i«=0 |
f=0 |
i“0 |
0 |
(/z—» oo); |
J |
|
2 |
Vs/)-M |
2 |
^(Si) >sii * (5/) |
-> 0 |
при лю |
|
1=0 |
j=0 |
|
/=0 |
|
|
|
бом e)>0 (/z—<• oo). |
|
|
|
|
||
2. |
Ж [1 Лу (-s)H < |
c* (5); |
|
|
|
|
где c> 0 — константа. |
|
|
|
|
||
Предположим, что |
|
|
|
|
||
|
Ф* (sH:) = |
min |
= lim m |
. |
(1. 133) |
|
|
|
se// |
T ( S ) |
6-vo іб/-/Е T ( S ) |
|
|
где s* — некоторый элемент множества 5;
H — множество тех s, для которых^* (•s),...,<j'^_1(s))€ Ф; Н е — множество тех s, для которых (Ій* (s),..., (s))
принадлежит е-окрестности Ф£ множества Ф1.
Теорема 1. Стратегия «*=(s*, s *,.... s*,...) принад лежит So и является решением поставленной задачи.
Эта теорема носит экзистенциальный характер. Сле дующая же теорема указывает способ построения опти
мальной стратегии. |
|
|
|
такие |
Теорема 2. В условиях теоремы 1 существуют |
||||
вещественные числа Ло, Яі, Х г , Х т, что |
задача |
мини |
||
мизации ojim*(s) при условии |
(i[4 |
* (s), ... , |
і]эП_і* (s) ) б Ф |
|
эквивалентна задаче минимизации суммы |
|
|
||
|
т |
|
|
|
а 0s)= V (s)+ |
2 |
M V ) |
|
|
о |
І=1 |
|
|
|
по множеству 5. |
|
|
|
|
1 Совокупность векторов, каждый из которых либо входит в Ф, либо находится на расстоянии, меньшем е, от некоторого вектора из множества Ф, называется в-окрестностыо множества Ф.
46
Приведенная теорема позволяет во многих практи ческих случаях сводить задачу построения оптимальной решающей функции с неаддитивной функцией убытка
кзадаче с аддитивной функцией убытка.
Вкачестве примера рассмотрим задачу выбора опти мального плана профилактики, решенную в гл. IV иным методом.
Пусть время X жизни элемента распределено по за кону F ( t ) = P ( X < t ) . Если элемент отказал, то он заме няется новым, причем среднее время замены равно Ts. Если произведена профилактика ранее отказа элемента, то средняя длительность профилактики равна T,n< T s. Требуется оптимальным образом выбрать функцию рас пределения G(x) момента Y проведения профилактики с тем, чтобы максимизировать вероятность застать эле мент'в исправном состоянии.
Обозначим через т среднюю длительность цикла между возвращениями элемента в исходное состояние, а через ф — среднее время пребывания элемента в нера бочем состоянии (замены или профилактики) в течение одного цикла. Тогда готовность элемента
r _ P ( X < Y ) T s + P ( X > Y ) T m '
|
X |
|
|
По теореме 2 максимизация Р равнозначна максими |
|
зации функции |
|
|
|
л = х0т + X, [Р (V < г ) г , + я ( * > |
n V J = |
= |
X0jf \ \ - F m \ - G { t ) ] d t + P{X<Y) Ts+ P { X > Y ) T , ^ + |
|
+ |
Х1[Р(Ѵ<Е)ГІ+ P{X>Y) Tm] - Х0 f [1- Я (t)][\ -G(t)[dt + |
|
|
О |
|
+(Xo+Xx) JTs J [1-0(t)]dF{t)+Tm ( l - f [1-G{t)\dF(t) |
||
= |
X0 f [l-P W ][l-O (0 ]^ + (X 0+X1) ( r ,- 7 ’J Cf [1 - 0 ( t ) IX |
|
|
6 |
ö |
|
X d.F{t) + (X0+Xx)7V = ] (X0 [1- |
F(t)} X |
|
6 |
|
Tm)F' (/)) [1 ~ G 00] ^-KXu-h^i) 7'/n-
47
Если Ао и Ао + Аі одного знака, то решение будет вы
рожденным. Так, |
если А0> 0 и Ао + Аі>0, |
следует поло |
|
жить G ( t ) =0 |
для |
всех t, т. е. время |
профилактики |
равно оо. |
и А0 + Аі<0, нужно положить G(t) = 1 при |
||
Если А0< 0 |
всех t > 0. Очевидно, оба этих случая не реальны.
Если Ао< 0 и Ао + Аі>0, тогда решение будет одним из двух предыдущих.
Остается случай Ао>0, а Ло + Аі<0.
Р'(П |
монотонно возрастающая функция, то |
|
Если 1- F{t) |
||
уравнение |
|
|
*0П - |
F (0] + (Xo+XJ (Г, - |
T J F' (() |
имеет единственный корень у = Y (~^~j |
в некотором интер |
вале изменения Лі/А0.
Поскольку при t < y выражение в фигурных скобках положительно, а при t > у отрицательно, то оптимальным будет выбор
0 ( / ) = Г ° |
при 1< Т , |
\ 1 |
при f^>y. |
Остается рассмотреть |
первоначальное выражение |
для Р, в которое подставлено последнее выражение G(t), и найти его максимум по у.
1.6. ПРАВИЛА ОСТАНОВКИ
Предположим, что наблюдается некоторая последова
тельность случайных величин |
| 2, • • •, £п, • ■■■Правилом |
||||
остановки |
процесса |
наблюдения |
называется |
функция |
|
ѵ(!і, g2, •••, |
In,--.), |
принимающая |
значения 0, |
1, 2,... |
иимеющая следующий смысл. Пусть ѵ (хи х2, ... х„,...) =
=т. Тогда, если g, = JCI....... gm = xm, процесс наблюдения случайной последовательности заканчивается на пг-м
шаге, т. |
е. наблюдаются только случайные |
величины |
||
Ь, • • •, Im, |
а величины £т+ь lm+i, ■■■уже не наблюдаются. |
|||
Чтобы правило остановки имело реальный смысл, |
||||
нужно потребовать, чтобы v(xh ..., xm,...) |
не |
зависела |
||
ОТ Xm+1, |
Xm+2, ... при условии, |
что ѵ(Хі, .... xm, . . . ) = m . |
||
Другими словами, решение об |
остановке |
процесса на |
блюдений должно приниматься на основании уже имею щихся, а не будущих наблюдений,
48
\
Если v(gi, g2, ■■•, i«,...) =0, то это означает, что при нято решение вообще не производить наблюдений над случайIIыми величинами.
Рис. 1.4. «Дерево» процесса реализации случайных величин
Правила остановки хорошо представить в том слу чае, когда каждая из случайных величин может прини мать лишь конечное число значений. В этом случае, как
Фп
Рис. 1.5. К |
рассмотрению |
Рис. 1.6. Система барьеров для блуж- |
правнла |
остановки |
дающей частицы |
показано на рис. 1.4, процесс реализации случайных величин gi, g2, ■■• можно представить в виде «дерева». Каждой вершине 1-го ранга соответствует некоторое зна чение gi; каждой вершине 2-го ранга — некоторое значе ние пары (gi, g2) и т. д. Правило остановки в этом случае
можно |
интерпретировать как «обрубывание» веток «де |
|
рева» |
(рис. 1.5). |
|
Нужно заметить, что даже при небольшом числе воз |
||
можных значений случайных величин |
«деревья» «бы |
49