Добавил:
sergeevpavel0406@mail.ru СОВА Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Информатика в техническом университете / Информатика в техническом университете. Архитектура вычислительных систем

.pdf
Скачиваний:
59
Добавлен:
06.03.2018
Размер:
13.27 Mб
Скачать

9.6. Расчет показателей надежности для стационарного режима

Формулы (933) и (9.34) позволяют анализировать готовность BC c массовым параллелизмом.

9.6. Расчет показателей надежности для стационарного режима

работы вычислительных систем

Вычислительные системы общего назначения, как правило, рассчитаны на длительную эксплуатацию. Целью настоящего параграфа является изучение c позиций надежности поведения ВС при t — 00.

9.6.1. Функции оперативной надежности и восстановимости вычислительных систем

Выведем расчетные формулы для функций R' (t) и U' (t), характери-

зующих работу BC в стационарном режиме, (9.13), (9.14). Пусть

Qi (t) = P{b'i E [0, 1) -+ (i) > пIi E Eo }

(9.35)

является условной вероятностью события (ti) п в предположении, что в

системе в момент времени t = 0 имеется i E E" исправных ЭМ; i любой момент времени, принадлежащий [0, t). Тогда, учитывая (9.13), по формуле

полных вероятностей имеем

N

(936)

R^(t)= Pi; (t),

i=n

где P определяется формулами (9.4) и (9.5).

Рассчитаем функцию (9.35). Для этого обозначим через л(t) и и1 (t)

соответственно вероятность того, что произойдет ровно г отказов, и вероятность того, что произойдет ровно 1 восстановлений за время t, если в систе-

ме имеется i Е ЕN исправных машин. Тогда

 

Q,(t)

 

 

'д.(«

(9.37)

 

 

1=0

 

r=о

 

Если учесть (2.15), (2.18), то можно показать, что

 

 

п(r

t) =

Cikty е-, ".

(9.38)

 

)

г.

,

 

r

 

 

 

 

 

 

 

 

ur(t) =

[0(N — i — m)m'в m"` + 0(m — N + i)(N — i)` e-c"-^^'^ ],

(9.39)

431

9. Надежность вычислительных систем

где r, 1

0(х) = 1, если x > 0; 0, если x < 0,

и считается, что 0° =1.

Таким образом, формулы (9.3%)—(9.39) позволяют рассчитать услов-

ную вероятность Qi (t), i E E, c заданной степенью точности.

B некоторых случаях достаточно найти оценку R"(t) снизу для фyнк-

ции R* (t):

N

 

i —n

 

*()р

 

(9.40)

 

' ^п,(t).

i=n

 

r=0

 

Начальное значение функции R'(t), как это следует из (9.36)—(9.39), равно коэффициенту готовности BC, т. e.

R*(0) = s.

Можно показать, что

 

 

 

N-1

 

п < N;

R

* (-юo) = 1im

R* (t)

Е Р

при

i =п

 

n=N.

 

 

 

0

при

B самом деле,

 

 

 

 

 

 

 

N-1

 

ао

i(t) = 0,

1im QN (t) =!imi(t) =1 - 1im

t-^оо

t^oo

r=0

 

t^oo r=N —n+1

(9.15),

(9.41)

(9.42)

так как при i = N из (9.39) следует, что и1 (t) = 0, 1 > 0, и0 (t) =1. Поскольку N — п = const, то при t —+ в системе наиболее вероятными становятся количества отказов г Е {N — п +1, N — п +2, ... } . Поэтому при t —k 00 c дос-

таточной для практики точностью можно считать, что

Е тяг (t) —> 1 и,

r=N—n+1

следовательно, QN (t) — 0.

 

далее из (9.з9) видно, что при i Е {п, n +1, ... , N —1 }

и при большом t

вероятности и1 (t) будут тем больше отличаться от нуля, чем больше будет 1. Иначе говоря, если i Е {п, п +1, ... , N —1 }, то при большом t число восста-

432

9. б. Расчет показателей надежности для стационарного режима

новлений 1 в системе будет также большим, т. e. если t - Со, то и 1 -4 о0.

Если это так, то при t

 

имеет место

i—n+1

 

 

и, следовательно (9.37),

с0

Е тяг (t) -+ 1

 

 

 

 

 

 

 

 

 

 

г=о

 

 

 

 

Q; (t) -> 1, i Е Е. Переходя к пределу при t -+ с0

в (9.36) и учитывая по-

ведение Qi (t) при t

00, получаем (9.41).

 

 

 

 

Действуя аналогично, находим, что функция (9.14)

 

 

 

n-1

ao

 

n—i—l+r

 

 

 

U*(t)=l_Iпг(t)

 

Иi(t).

(9.43)

 

 

i=O

r=O

 

1=0

 

 

Очевидно, что U(О) = S, U^(+oo) = urn U^(t) =1.

 

 

 

 

r

 

 

 

 

Оценкой сверху для U' (t) будет функция

 

 

 

 

 

Й*(t) =

n-1

n—i—i

 

 

 

 

 

 

и(t).

(9.44)

 

 

 

i=O

1=0

 

 

Выведенные в данном разделе формулы позволяют оценить функционирование BC в стационарном режиме.

9.6.2. Распределение вероятностей состояний вычислительных систем

Рассчитаем распределение вероятностей (9.5) состояний ВС для стационарного режима функционирования: {Р0, P, ..., Р; , ..., P } ; это позволит

вычислить функции (9.36) и (9.43) и коэффициент готовности (9.15) ВС. Для расчета P; , j Е Е, потребуется осуществить предельный пере-

ход при t - о0 в системе уравнений (9.29). Правые части всех ypавнений (9.29) при t -4 с0 имеют пределы. Следовательно, каждая из производных Pi, i Е Е'', при t -> 00 также имеет предел и такой предел может бьггь только нулем. Если бы какая-нибудь производная P; i Е Е, стремилась к числу, отличному от нуля, то соответствующее (t)l при t со неограниченно бы возрастало. Последнее противоречило бы физическому смыслу величин Р (t) (так как 0 < 1(t) < 1, i Е Ео) и формуле (9.5). Таким образом,

при t -> с0 имеет место 1'(t) -+ 0, i Е Е'. Следовательно, система диффе-

ренциальных уравнений (9.29) преобразуется в систему алгебраических

уравнений:

433

 

9. Надежность вычислительных систем

 

 

 

0= -rniaPo + ?,P1 ;

 

 

 

 

 

 

 

0 < j (N - rn);

 

0= тр'Р 1 - (]?. + rnt)Р + (j+

1)?J,

 

(9.45)

о = (N - j + 1)µР;-1 - [j + (N -

 

+ (]+ 1)?J,,

(N - т) < j < N;

 

 

0 = µPлs-1 - N&PN .

 

 

 

 

 

 

 

 

 

 

 

 

Если положить

 

 

 

 

 

 

 

 

 

 

 

 

тµР;-1 - AP./ = г;,

 

0<1 (N - т + 1);

 

 

(9.46)

[N - (j -1)]1 - j^Р; = г; , (N -rn+1)jNf'

 

 

 

то систему (9.45) можно записать в следующем виде:

 

 

 

 

 

г1

= 0;

 

 

 

 

 

 

 

 

 

 

 

 

— г;+1 = 0,

 

1 <j (N - т);

 

 

 

 

 

 

 

 

_ .

 

 

 

 

 

 

 

(9.47)

гN т+1

- гN-т+2 - 0,

 

 

 

 

 

 

 

 

- г^+1 = 0,

 

-rn+2) ]<(N

N;

 

 

 

гN = 0.

 

 

 

 

 

 

 

 

 

 

 

Из (9.47) следует, что

г = 0, 0 < j < (N - m + 1);

тогда, учитывая (9.46)

и принимая a = µ / ?,, получаем

 

 

 

 

 

 

 

 

 

тµ

 

ат

 

-

т'а'

1

j

-

 

+ 1).

(9.48)

Р=—Р

1 =---Р 1 ;

Р; -

. Р0,

(N m

 

 

j

 

 

 

J•

 

 

 

 

 

 

 

Кроме того, из (9.47) следует, что = 0,

(N - m +1) < j < N;

 

= [N -( j -1)]а

 

 

_ [N -( j -1)]. ..[N -(N-т)]а`-N+m D

 

Р; -

 

 

 

-

j(j -1)...(N -rn+1)

 

DN-т

 

]

 

 

 

 

 

 

 

a.j-N +тт(N -rn)! тN-maN-т

т !mN-ma.j

 

 

(9.49)

=

(N-])!]!

(N -rn)! Р0= (N-])!]! Р0 .

 

 

Используя условие нормировки и (9.48), (9.49), находим

 

 

 

Po =

1

а

1

 

N

а

1

 

-1

 

 

 

^

т

+ m! m N- т

^

 

 

 

 

 

(9.50)

 

1=0

1!

 

^

1=N-m+1 (N -1 )! 1 !]

 

 

 

 

Р; _

а'

 

 

 

 

 

 

т ! mN-т

Ро,

(9.51)

.^ 0(N - т-^)т + 0(j -

 

 

(N -j)! j

 

J

 

 

 

 

 

 

 

 

 

 

где j e {1, 2, ..., лт),

434

9.6. Расчет показателей надежности для стационарного режима

А(х)

если х 0;

= 0, если x < 0.

заметим, что в (9.48)—(9.51) принято 0 ° =1.

Рассмотрим два крайних случая: m =1, m = N. B первом случае, ко-

гда в ВС имеется одно восстанавливающее устройство, решение (9.51) принимает вид

1 1 -1 ,jЕЕоN

(9.52)

м l !

Если в (9.52) перейти к пределу при N --> щ получим вероятность то-

го, что при m =1 в стационарном режиме работы большемасштабной ВС

исправно j машин, равна:

Р. =

µ'

е , JЕо

(9.53)

]!

Распределение вероятностей (9.53) является распределением Пуассона. B случае, когда количество восстанавливающих устройств равно ко-

личеству машин в системе, решение (9.51) преобразуется к виду

N!

µ'Х,N '

>v

(9.54)

Р _ CN-J)!J!(?+oN , .1

Е Ео ,

 

a коэффициент готовности BC

 

 

 

S = 1- %1,N-п+1(^ +

 

(9.55)

9.6.3. Готовность масштабируемых вычислительных систем

Изучим влияние числа N при его неограниченном увеличен на потенциaльнyю готовность ВС к выполнению основных функций по переработке информации. B дальнейшем будем говорить, что ВС имеет высокую готов-

ность, если 1im S =1. Ранее было показано, что вероятность того, что матши-

ти-+

на в стационарном режиме исправна, равна ее коэффициенту s готовности

(2.26). Поскольку элементарные машины ВС независимо друг от друга могут

находиться в исправном состоянии или в состоя ии отказа, то, используя при условии v = (п —1)N-1 < s известные оценки биноминальньпх сумм [22],

можно показать, что коэффициент готовности ВС

435

9. Надежность вычислительных систем

 

S > 1 - e -NK , s = 1 _ е-Nк+о(1п N) ,

(9.56)

где к = v 1n(vs -1 ) + (1— v) ln[(1— v)(1 — s) 1 j. Из (9.56) следует, что ВС имеет

высокую готовность при выполнении условия v < s.

Наряду c монопрогpаммным режимом, когда на системе решается одна сложная задача, представленная в параллельной форме, в ВС широко использyются и мультипрогpаммные режимы (см. рaзд. 7.2.2). При организации мультипрограммной работы система программным способом разбивается на подсистемы. Количество подсистем соответствует количеству одновременно решаемых задач на ВС, a количество ЭМ в каждой из подсистем не менее ко-

личества ветвей в реализуемой параллельной программе. B связи c этим представляет интерес изучить, каким образом параметры подсистем влияют на

надежность (точнее, на коэффициент готовности) ВС в целом.

Пусть ВС состоит из h подсистем, причем подсистема c номером j Е Ег имеет следующие параметры: N; число ЭМ; п минимально

допустимое число исправных ЭМ, при котором подсистемой обеспечивается требуемый уровень производительности

 

^ N, =N;

v, = (п, —1)N^1 ;

v

1—v

 

s

' .

 

j=1

 

1- s

 

Рассмотрим случай, когда все подсистемы важны для существования

Тогда коэффициент готовности BC

BC.

 

 

h

h

 

 

 

S = ПS; > П(1— е-N'к' ),

(9.57)

 

 

j=1

1

 

где s,

коэффициент готовности подсистемы c номером j Е Е, a нера-

венство получено на основе (9.56).

 

 

 

Пусть числа

п; и N; (j Е Е;)

переменны, т. e. допускается их

варьирование и выполняются условия:

1)для каждой подсистемы c номером j параметр v; = const;

2)общее число машин постоянно: N = const.

Требуется найти такое распределение {лт; { , j Е Е1 , чисел ЭМ в под-

системах, при котором нижняя оценка (9.57) достигает максимума.

Точное решение сформулированной задачи методом множителей Ла гранжа при больших значениях NN , j Е Е, асимптотически совпадает c решением, получающимся при значениях N; , обеспечивающих постоянство сомножителей в оценке (9.57). Следовательно,

436

9. б. Расчет показателей надежности для стационарного режима

h

 

 

- 1

N = N к

к1

1

(9.58)

1=1

 

 

 

при этом

 

 

 

]Vк h _

1

 

h

S> 1 - e h к= —^ кd -1(9.59)

h 1=1

к средний гармонический коэффициент к; , j Е Е; [22, 23 ] .

Рассмотрим более общую ситуацию, при которой оснащение (моду-

..

лями памяти, внешними запоминающими устройствами, средствами вводавывода информации) ЭМ различно. Тогда каждая 1-я ЭМ будет иметь свой коэффициент готовности s1, 1 Е Е;' Можно показать, что в общем случае

сохраняются все вышеприведенные соотношения, если вместо s рассматри-

вать величину

N

s = N-1 ^ s1.

1=1

Исследуем теперь поведение BC в зависимости от степени дробления на подсистемы. Пусть количество N элементарных машин BC увеличивается

вместе c количеством h ее подсистем так, что

 

N_ 1+ E h 1n h— 1 h 1n d,

(9.60)

 

к

к

 

где d, &

произвольные действительные числа, d > 0.

Тогда из (9.59)

следует, что

е-dh1EI

 

 

 

при & < 0;

 

 

s е

(9.61)

 

 

 

>1—dh -E

при&>0.

 

Следовательно, ВС имеет высокую готовность, если c увеличением h

порядок роста N больше величины h 1n h / к Из (9.58)—(9.61) видно, что для достижения высокой готовности ВС необходимо выполнение условия

Ni >к^1 1nh, jЕЕ1.

9.6.4. Коэффициент готовности бQльшeмаcшта6ныx вычислительных систем

Выведем расчетные формулы для коэффициента готовности BC c боль-

количеством мauпш. для таких систем в cтoxacтичecких моделях счигает гuим cя, что N — oo, a фyFпщия готовности рассчитывается по формуле (9.30).

437

9. Надежность вычислительных систем

Полагая в (9.34) x = 0, находим

b0 (t) _

00

1im bo (t) =

00

 

P, (0)(1— e- ` )l ,

P (0) =1.

(9.62)

Если положить в (9.34) x =1, то

 

 

 

 

Ёьiсt) =

P(0) =1.

 

(9.63)

 

1=0

1=о

 

 

Из формул (9.62) и (9.63) при 1 > 1 следует, что 1im Ы (t) = 0. Учиты- t-+cO

вая (9.33) и последнюю формулу, получаем, что стационарными вероятностями состояний ВС будут

Р; = тµ 1 е-тµ

Е Е.

(9.64)

Заметим, что при m =1 формула (9.64) преобразуется в известный результат (9.5 3 ).

Предельный переход при t —> ао в (9.30) и результат (9.64) приводят к расчетной формуле для коэффициента готовности большемасштабной ВС:

S=1-1

е

(9.65)

J!

При анализе функционирования большемасштабных ВС (или ВС c массовым параллелизмом) можно использовать статистику не o потоке откaзов в одной ЭМ, a об отказах ВС в целом. Тогда стохастическую модель функционирования ВС можно изменить следующим образом. Пусть задана не интенсивность ? отказов одной ЭМ системы, a интенсивность л (простейшего) потока отказавших машин ВС. Тогда л представляет собой среднее количество отказавших ЭМ, поступающих на m восстанавливающих устройств за единицу времени. Пусть Р; вероятность того, что в стацио-

нарном режиме в ВС имеется j Е Е отказавших машин. Действуя традиционно, получаем:

-лРо + µР = 0;

 

 

АР;-1 -(л + ji)Р + (j + 1)µР;+1= 0,

1 ] < т;

(9.66)

AP;-1 - ( л + тµ)Р; + тµР;+1 =0,

m < ^..

 

438

9.6. Расчет показателей надежности для стационарного режима

Как было показано в (2.18), µ среднее число восстановлений ЭМ, которое может произвести одно восстанавливающее устройство в единицу времени. Тогда производительность восстанавливающей системы будет характеризоваться величиной mµ. Ясно, что очередь на восстановление отказавших ЭМ не будет расти безгранично и, следовательно, ресурсы ВС будут

эксплyатироваться c потенциально возможной эффективностью при условии

A<тµ.

Легко показать, что решениями системы уравнений (9.66) при выполнении условия нормировки и A < тµ будут:

 

 

(Ат1 1

(9.67)

^

‚0 1 кµJ (m-1)!(mµ—A)

µJ

 

J

Т J)1i+0(I — т)1

m]Po, j Е.

(9.68)

[

P^ —\µJ

m

 

 

Заметим, что по определению (9.2) п количество ЭМ основной под-

системы ВС со структурной избьггочностью, следовательно, n является пре-

дельно допустимым числом исправных машин, при котором производительность системы остается не ниже требуемого уровня. По аналогии c п в рамках данной стохастической модели целесообразно ввести п максимaльное количество отказавших ЭМ, при котором производительность ВС не ниже предельно допустимой. Следовательно, если ВС находится в со-

cтоянии j Е Е7, где Е = {О, 1, 2, ... , п }, Е c Е, то будем считать, что

она готова к выполнению основных ункцдчv по обработке информации. Тогда коэффициент готовности ВС рассчитывают по формуле

Л _

i =о

где величины P; определяются из (9.67) и (9.68).

Зная вероятности Р; , j Е Е, легко вычислить не только коэффици-

ент S готовности ВС, но и ряд других количественных характеристик надежности ВС для стационарного режима работы. Среднее количество отказавших машин ВС, ожидающих начала восстановления,

M=

A

P

1 mµ(1— А / тµ)2

 

при условии A < mµ. Математическое ожидание количества отказавших машин системы

439

п = N – п,

9. Надежность вычислительных систем

_ m-1

 

1

л

тРт

М2 = М1 + Ро ^ .

-1)!

t

+ 1– л / тµ

;=1

(j

Среднее число свободных восстанавливающих устройств

=ёо т -1 тз _j (J

^=о .1 ! µ

Вероятность того, что все восстанавливающие устройства заняты ре-

монтом отказавших машин ВС,

П = Pm (1

- !1 / 7Yi

1

 

Закон распределения времени 1 ожидания начала восстановления отказавшей ЭМ (в стационарном режиме) или вероятность того, что время пребывания отказавшей ЭМ в очереди на ремонт больше t,

P€i1 > t} = пе-(тµ-А)t

Математическое ожидание и дисперсия времени ожидания начала восстановления отказавшей ЭМ вычислительной системы соответственно равны

Mn = п/(тµ —л); Dri = Мi[г/(тµ —л)—Мт1].

B заключение следует подчеркнуть, что N –+ оо является парадигмой для построения стохастической модели функционирования большемас-

штабных ВС. B реальных системах N безусловно конечно, но при массовом параллелизме как N, так и n являются большими числами. Более того, производительность любой такой ВС оценивается (9.2) величиной по, которая близка к суммарной пиковой производительности Nго (см. рaзд. 3.3.3), с - производительность одной ЭМ (см. § 2.6). Основываясь на этом факте, при анализе готовности большемасштабных ВС можно считать, что

л= N.

9.7.Потенциальный контроль вычислительных систем

Работоспособные ресурсы в BC выявляются c помощью средств контроля и диагностики. При этом контроль системы (или ee части — пoдcиc-

темы) позволяет установить факт работоспособности или нepaбoтocпocoб-

нocти проверяемых ресурсов. Дuaгнocmuкa же (после установления нepaбo-

тocпocoбнocти BC или ee подсистемы) позволяет определить, какой из

440