Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Башкирский Государственный Аграрный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги из ГПНТБ / Коваленко И.Н. Полумарковские модели в задачах проектирования систем управления летательными аппаратами

.pdf

Скачиваний:

Добавлен:

23.10.2023

Размер:

7.56 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 45 / 185 6 7 8 9 10 11 12 13 14 15 16 17 18 > Следующая >>>

х(0)>0. Дополним график функции x = x(t) (рис. 1.2) в точках разрыва отрезками прямых, параллельных оси Ох так, чтобы в результате получилась непрерывная кри


вая на плоскости	(t, х) . Проведем в этой плоскости пря
		мую		x = tn•	Наимень
		шее значение t, при ко
		тором X (t) = tn, обозна
		чим ы„. Множество мо
		ментов времени				{ип}
		назовем процессом вос
		становления с изменен
		ным		временем.		Если,
		в	частности,		x ( t ) = t ь
Рис. 1.2. График	случайной функ	тогда un= t „ ,				0.
			Вначале дадим фи
ции x( t)		зическую интерпрета
		цию		замены	времени.

Представим себе, что имеется бесконечный запас элемен тов с ресурсами надежности £0, іь • • •. Èn,__ Когда ре сурс надежности п-го элемента исчерпывается, этот эле мент отказывает и немедленно заменяется (п+1)-м элементом. Обозначим через y(t) ресурс надежности эле мента, служащего в момент L Если ресурс надежности исчерпывается со скоростью, равной единице, то у (t) бу

дет функцией, которая в	интервалах (tn, tn+\)	убывает
с единичной скоростью	(рис. 1.3,а). В этом	случае

y{t )=yt (см. выше). Если же ресурс надежности исчер пывается со скоростью y{t), тогда у'(t) = —ij(t) в интер валах между скачками процесса y(t). Если процесс х(() имеет производную, то х'(і) =у(і).

Так, например, представим себе устройство периоди ческого действия, отказы которого возможны в интерва лах длины ті, сменяющихся интервалами длины to, в ко торых отказы невозможны. Поведение функции у (f) в этом случае будет таким, как показано на рис. 1.3,6. Описанная ситуация характерна для практики эксплуа тации сложных систем.

Предположим, что процесс восстановления является стационарным и É (+0) =0. Пусть, далее x(t) непрерывно дифференцируема с вероятностью, равной единице. Обоз начим через \(t)dt вероятность того, что в интервале (t, t+dt) произойдет восстановление для процесса {ип}. Тогда

Х (0=-^ -М [х, (<)].

(1.120)

Фиксируем некоторые	Т\ <Т2 и обозначим через
Я {Tu Т2) вероятность того, что в интервале		(Ти Т2) не
произойдет ни одного восстановления процесса {ип}.
Для соответствующей формулы понадобятся функции:
оо
~®(*) = -L ^	[ l - F ( x ) ] d x ;	(1.121)
Я
G{z) = P { { x { T J - x { T $ < z ) .		(1 .1 2 2 )

Рис. 1.3. Ресурс надежности элемента как функция времени

Формула для q{T\, Т2) имеет вид

Ч{Тг> Тъ) = ]	®{z)dG{z).		(1.123)
о
Рассмотрим произвольное число		моментов	времени
Т\ <Т2< .. .<Тт и обозначим	через	Я(Гь..., Tm)dTi...dTm

вероятность события, состоящего в том, что в каждом из

интервалов	(Ть T\ + d T	{ ) (Tm, Tm+dTm)	происходит
одно восстановление процесса {«в }.			совместную
Обозначим через р{аи...,ат-]\ &і,...,&,„)
плотность вероятности случайных величин
•^(А)	x{t^), x(ta)	х((%), .. . , х(£т)
	х' (А) , . . . , x ’ (tm),

предположив, что такая плотность существует. При этом предположении справедлива формула

ЦТѵ . . . , Т п)=
— j" • • • J bx. . . bmH (ß-x).. .H (am—x) p (Ox,. . . ,
b , , . . . , bm)da i . . . d b m,	(1.124)

где H { t ) — функция восстановления процесса (АД.

Пусть при тех же условиях \.\,(Tu...,Tm)dT[...dTm— ве' роятность события, состоящего в том, что в каждом^ из интервалов (Ти T\ + d T \ ) (7\„, Tm+dTm) произойдет по одному восстановлению процесса {м,Д, а в промежу точных интервалах (T\ + dTu 7\);...; + d T m~i, Tm) не будет ни одного восстановления. Тогда справедлива

формула	(в предположении,	что	обладают плот
ностью)		-	1
	\|Х(7V . . . ,	7\J =
= "т” ^	' \ Ь1ЬѴ - bmF'		P (al’ ■■■’ ам-1;
	bv . . . , b„,)dav .. dbm.		(1.125)
Альтернирующие процессы восстановления
Пусть v(t) — определенный при			0 случайный про

цесс. траектории которого представляют собой ступенча тые функции со значениями «О» п «1». Допустим, что су ществует последовательность моментов t \ < t 2< . . . < t n<..~,

вкаждый из которых процесс изменяет свое состояние. Возможны два случая: 1) v ( t ) = 0, 0<^<^; 2) v(t) = 1,

0< /< г‘|. В первом случае ѵ (/)= 0 в интервалах (to, (з),

(U,	v ( t ) =	1 в интервалах (ti,to), {h, U),.... Во вто
ром случае \ ( t )		=0 .в интервалах ( f,, t2),	(із, /4 ),...; v(t) —
= 1	в интервалах (t2, і з ) , (t^, / 5 ) , . . . .		и і2—1\,—— не
	В обоих случаях предположим, что t\

зависимые случайные величины. Если в интервале (0,£і) v(t) = 1 с вероятностью р, то Р (Л < 0 = С?0(Л; если v(t) = = 0 с вероятностью q = 1—р, то Р (Л <t) —Fo{t).

Длина каждого интервала (tn, Л1+1 ) ( п ^ \ ) , если в

этом интервале ѵ(Т)=0 распределена по закону P{tn+X— —tn< t) =F(t); если же v(t) = 1, то закон распределения P(tn+\—tn< t ) = G(t). Определенный таким образом про цесс v(t) называется альтернирующим процессом восста новления.

Обозначим через p(t) вероятность того, что ѵ(£) = 1. Для того, чтобы вычислить эту вероятность, введем вспо могательный альтернирующий процесс восстановления, у которого F(t) и G(t) — те же, что и у процесса v(t), но в качестве р и G0(t) взяты соответственно «1» и G(t). Обозначим через po{t) .вероятность того, что вспомога тельный процесс принимает значение «1» в момент t.

Пусть Ho(l') — функция восстановления простого про

цесса восстановления с функцией распределения					вида
		і
	^ (S « < 0 =	J F{ t ~x ) dQ { x ) .			(1.126)
		U
Тогда
	Po{t )=l —O(0 +	j [l — Q{t —x)]d.H0{x).			(1.127)
		и
Функцию р(і) можно найти по формуле
		t
p(t) = p [ l —Оо(0] + 1 p 0{t — x)dR{x),				(1.128)
		О
где
	Rif) = P j Qü{t — x)dF{x)-\-qF0 (é).
	о
Если	хотя бы одно из распределений F(t)			или G(t)
является нерешетчатым, то при			-о о
	Н т/7(0 = ----^— ,			(1.129)
		То + Tj
- где т0 = j	tdF (t), тх = j' tdO (t)		и хотя бы одна	из	вели
U	U
чин т0 или тх конечна.
1.5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ			ПРОЦЕССОМ
ВОССТАНОВЛЕНИЯ

Пусть имеется некоторое множество S управлений s. Если мы выберем управление s £ S, то происходит неко торый процесс случайной длительности |(s) с ограничен ным по всему множеству 5 положительным математичес ким ожиданием x(s) и ,в течение этого времени выраба тываются случайные значения iii(s),...,rim(s) некоторых числовых характеристик.

Так, например, допустим, что поставлена в эксплуата цию новая система. Управление s определяется режимом ее эксплуатации, профилактическими работами, функци-

опальным контролем, ремонтом пли заменой элементов системы. Через случайное время |(s) система выйдет из строя и должна будет замениться новой. Тогда числовы ми характеристиками, выработанными за период £(s), будут следующие:

T|I (S) — объем работы, выполненной системой, .в опре деленных единицах;

il2 (s) — затраты на эксплуатацию системы.

По истечении времени £(s) процесс повторяется, т. е. мы снова выбираем управление (скажем, s'), в результа те чего происходит процесс случайной длительности |(s') и вырабатываются характеристики гр (s') ,...,r]m(s'). Пред положим, что этот процесс повторяется до бесконечности, так что имеем последовательность управлений s0= s', Si = =s',...sn... п соответствующую последовательность дли

тельностей процессов £(s0), !(si),.-.,£(s„),-.. и числовых характеристик г| (su) , т| (si) , . . . , 1 1 (s„),..., где

ri(s)= (ri1(s ),..., \,(s )).

Основным предположением будет следующее. Если sn


фиксировано,		то случайный івектор	{^(sn),	r)(s71)} не за
висит от совокупности случайных векторов				{ (\|(s t) , ті (si));
— lj.		Интервал (0, £(s0))	назовем нулевым;
интервал	(£(s„_i), £(sn) ) — п-м циклом (п ^ І).
Если	рассмотреть моменты A, = i(si)+ ... + i(s n) ПРН

n^. О, то эти моменты, вообще говоря, не будут образовы вать процесс восстановления. Однако, легко понять, ес ли si= s 2= ... = 5n=..., тогда это будет процесс восстанов ления.

В общем случае мы исключим из рассмотрения управ ления, при которых с положительной вероятностью

1іпП„<со.	Таким образом, всегда 1іпН„= оо.
П-*-оо	ft-*-со

Рассмотрим функционирование системы в течение времени Т. Пусть tnT ^ T<tjvr +i• Тогда можно опре делить суммарные значения характеристик:

'’li {Г)—	(5о)+ • • ■+ 'Пі(5уѵг)-j- ѴФ (SNT+1 );
	(1.	130)
(Г ) — 11m(S0)+ •■+ Лm(SArT) -f-б^ТЦ^Л^-І-і),
где О ^Ѳ у^І;	— величины, точное значение ко
торых мы определять не будем.

Записанные равенства можно интерпретировать сле дующим образом. Если па отрезке времени [О, Т] уложи лось некоторое число циклов, то суммарное значение ха рактеристики r|j за время Т есть сумма значений этой характеристики по данным циклам плюс некоторая часть значений Ртой характеристики по циклу, не уложившему ся полностью на отрезке {О, Г].

Теперь сформулируем следующую задачу. Обозначим

~ y r\i(T) = Zj {и, Т)\

(1.131)

где и —(so, s 1 ,...,sn,...).

Обозначим через 50 множество стратегий и, для кото рых существуют такие постоянные Zj(u), что для любого

е > 0

Р (I г } (и, Т) - г, (и) |< е) —>1 (Г —>оо).

Требуется выбрать стратегию и £ S0 таким образом, чтобы вектор {z\ (и) ,...,2 т_і (и) } принадлежал некоторо

му выпуклому множеству Ф и при этом функция zm(u) была бы минимально возможной.

Типичным примером является требование минимиза ции z m(u) при условии, что

(и)1 < у < / п — 1.

Будем считать, что множество 5 замкнуто и допуска ет операцию смешивания. Последнее означает следую щее. Пусть S i , . .. ,s N — управления из множества 5. Тогда

существует рандомизированное управление, при котором Si применяется с вероятностью ри где PU--->PN — любое распределение вероятностей. Нам понадобится лишь од но следствие этого свойства, а именно такое: множество векторов {t(s), i()i(s),...,Tj}m(s) } является выпуклым, где

M[ily(s)] = ^y(s);

l < y ' < m-

(1.132)

Будем считать, что эти величины конечны для любого s € S и пусть

*(S) = № L(S),-.->US))-

(1-133)

Далее можно определить

Ь * № = ^ Т Т ’ 1 < / < т - T(S)

Предположим, что выполнены следующие условия.

45.

1.Для любой последовательности управлений {sn}

последовательность		случайных	векторов	{(E(s,:)>
1]! (s;), • • ■, Tlm(Sj))}	удовлетворяет		закону больших чи
сел в следующем виде.
П
Если 2 х isi)	°°і то
і~0
i«=0	f=0	i“0	0	(/z—» oo);
i«=0	f=0	i“0	J

2	Vs/)-M	2	^(Si) >sii * (5/)		-> 0	при лю
1=0		j=0		/=0
бом e)>0 (/z—<• oo).
2.	Ж [1 Лу (-s)H <	c* (5);
где c> 0 — константа.
Предположим, что
	Ф* (sH:) =	min		= lim m	.	(1. 133)
		se//	T ( S )	6-vo іб/-/Е T ( S )

где s* — некоторый элемент множества 5;

H — множество тех s, для которых^* (•s),...,<j'^_1(s))€ Ф; Н е — множество тех s, для которых (Ій* (s),..., (s))

принадлежит е-окрестности Ф£ множества Ф1.

Теорема 1. Стратегия «*=(s*, s *,.... s*,...) принад лежит So и является решением поставленной задачи.

Эта теорема носит экзистенциальный характер. Сле дующая же теорема указывает способ построения опти

мальной стратегии.				такие
Теорема 2. В условиях теоремы 1 существуют				такие
вещественные числа Ло, Яі, Х г , Х т, что			задача	мини
мизации ojim*(s) при условии	(i[4	* (s), ... ,	і]эП_і* (s) ) б Ф
эквивалентна задаче минимизации суммы
	т
а 0s)= V (s)+	2	M V )
о	І=1
по множеству 5.

1 Совокупность векторов, каждый из которых либо входит в Ф, либо находится на расстоянии, меньшем е, от некоторого вектора из множества Ф, называется в-окрестностыо множества Ф.

Приведенная теорема позволяет во многих практи ческих случаях сводить задачу построения оптимальной решающей функции с неаддитивной функцией убытка

кзадаче с аддитивной функцией убытка.

Вкачестве примера рассмотрим задачу выбора опти мального плана профилактики, решенную в гл. IV иным методом.

Пусть время X жизни элемента распределено по за кону F ( t ) = P ( X < t ) . Если элемент отказал, то он заме няется новым, причем среднее время замены равно Ts. Если произведена профилактика ранее отказа элемента, то средняя длительность профилактики равна T,n< T s. Требуется оптимальным образом выбрать функцию рас пределения G(x) момента Y проведения профилактики с тем, чтобы максимизировать вероятность застать эле мент'в исправном состоянии.

Обозначим через т среднюю длительность цикла между возвращениями элемента в исходное состояние, а через ф — среднее время пребывания элемента в нера бочем состоянии (замены или профилактики) в течение одного цикла. Тогда готовность элемента

r _ P ( X < Y ) T s + P ( X > Y ) T m '

	X
	По теореме 2 максимизация Р равнозначна максими
зации функции
	л = х0т + X, [Р (V < г ) г , + я ( * >	n V J =
=	X0jf \ \ - F m \ - G { t ) ] d t + P{X<Y) Ts+ P { X > Y ) T , ^ +
+	Х1[Р(Ѵ<Е)ГІ+ P{X>Y) Tm] - Х0 f [1- Я (t)][\ -G(t)[dt +
	О
+(Xo+Xx) JTs J [1-0(t)]dF{t)+Tm ( l - f [1-G{t)\dF(t)
=	X0 f [l-P W ][l-O (0 ]^ + (X 0+X1) ( r ,- 7 ’J Cf [1 - 0 ( t ) IX
	6	ö
	X d.F{t) + (X0+Xx)7V = ] (X0 [1-	F(t)} X
	6

Tm)F' (/)) [1 ~ G 00] ^-KXu-h^i) 7'/n-

Если Ао и Ао + Аі одного знака, то решение будет вы

рожденным. Так,		если А0> 0 и Ао + Аі>0,	следует поло
жить G ( t ) =0	для	всех t, т. е. время	профилактики
равно оо.	и А0 + Аі<0, нужно положить G(t) = 1 при
Если А0< 0	и А0 + Аі<0, нужно положить G(t) = 1 при

всех t > 0. Очевидно, оба этих случая не реальны.

Если Ао< 0 и Ао + Аі>0, тогда решение будет одним из двух предыдущих.

Остается случай Ао>0, а Ло + Аі<0.

Р'(П	монотонно возрастающая функция, то
Если 1- F{t)	монотонно возрастающая функция, то
уравнение
*0П -	F (0] + (Xo+XJ (Г, -	T J F' (()
имеет единственный корень у = Y (~^~j		в некотором интер

вале изменения Лі/А0.

Поскольку при t < y выражение в фигурных скобках положительно, а при t > у отрицательно, то оптимальным будет выбор

0 ( / ) = Г °	при 1< Т ,
\ 1	при f^>y.
Остается рассмотреть	первоначальное выражение

для Р, в которое подставлено последнее выражение G(t), и найти его максимум по у.

1.6. ПРАВИЛА ОСТАНОВКИ

Предположим, что наблюдается некоторая последова


тельность случайных величин			\| 2, • • •, £п, • ■■■Правилом
остановки	процесса	наблюдения		называется	функция
ѵ(!і, g2, •••,	In,--.),	принимающая		значения 0,	1, 2,...

иимеющая следующий смысл. Пусть ѵ (хи х2, ... х„,...) =

=т. Тогда, если g, = JCI....... gm = xm, процесс наблюдения случайной последовательности заканчивается на пг-м

шаге, т.	е. наблюдаются только случайные			величины
Ь, • • •, Im,	а величины £т+ь lm+i, ■■■уже не наблюдаются.
Чтобы правило остановки имело реальный смысл,
нужно потребовать, чтобы v(xh ..., xm,...)			не	зависела
ОТ Xm+1,	Xm+2, ... при условии,	что ѵ(Хі, .... xm, . . . ) = m .
Другими словами, решение об		остановке	процесса на

блюдений должно приниматься на основании уже имею щихся, а не будущих наблюдений,

Если v(gi, g2, ■■•, i«,...) =0, то это означает, что при нято решение вообще не производить наблюдений над случайIIыми величинами.

Рис. 1.4. «Дерево» процесса реализации случайных величин

Правила остановки хорошо представить в том слу чае, когда каждая из случайных величин может прини мать лишь конечное число значений. В этом случае, как

Фп

Рис. 1.5. К	рассмотрению	Рис. 1.6. Система барьеров для блуж-
правнла	остановки	дающей частицы

показано на рис. 1.4, процесс реализации случайных величин gi, g2, ■■• можно представить в виде «дерева». Каждой вершине 1-го ранга соответствует некоторое зна чение gi; каждой вершине 2-го ранга — некоторое значе ние пары (gi, g2) и т. д. Правило остановки в этом случае

можно	интерпретировать как «обрубывание» веток «де
рева»	(рис. 1.5).
Нужно заметить, что даже при небольшом числе воз
можных значений случайных величин		«деревья» «бы

<<< < Предыдущая 1 2 3 45 / 185 6 7 8 9 10 11 12 13 14 15 16 17 18 > Следующая >>>

Соседние файлы в папке книги из ГПНТБ