Информатика в техническом университете / Информатика в техническом университете. Архитектура вычислительных систем
.pdf9.6. Расчет показателей надежности для стационарного режима
Формулы (933) и (9.34) позволяют анализировать готовность BC c массовым параллелизмом.
9.6. Расчет показателей надежности для стационарного режима
работы вычислительных систем
Вычислительные системы общего назначения, как правило, рассчитаны на длительную эксплуатацию. Целью настоящего параграфа является изучение c позиций надежности поведения ВС при t — 00.
9.6.1. Функции оперативной надежности и восстановимости вычислительных систем
Выведем расчетные формулы для функций R' (t) и U' (t), характери-
зующих работу BC в стационарном режиме, (9.13), (9.14). Пусть
Qi (t) = P{b'i E [0, 1) -+ (i) > пIi E Eo } |
(9.35) |
является условной вероятностью события (ti) п в предположении, что в
системе в момент времени t = 0 имеется i E E" исправных ЭМ; i — любой момент времени, принадлежащий [0, t). Тогда, учитывая (9.13), по формуле
полных вероятностей имеем
N |
(936) |
R^(t)= Pi; (t), |
i=n
где P определяется формулами (9.4) и (9.5).
Рассчитаем функцию (9.35). Для этого обозначим через л(t) и и1 (t)
соответственно вероятность того, что произойдет ровно г отказов, и вероятность того, что произойдет ровно 1 восстановлений за время t, если в систе-
ме имеется i Е ЕN исправных машин. Тогда
|
Q,(t) |
|
|
'д.(« |
(9.37) |
|
|
1=0 |
|
r=о |
|
Если учесть (2.15), (2.18), то можно показать, что |
|
||||
|
п(r |
t) = |
Cikty е-, ". |
(9.38) |
|
|
) |
г. |
, |
||
|
r |
|
|
|
|
|
|
|
|
|
|
ur(t) = |
[0(N — i — m)m'в m"` + 0(m — N + i)(N — i)` e-c"-^^'^ ], |
(9.39) |
|||
431
9. Надежность вычислительных систем
где r, 1
0(х) = 1, если x > 0; 0, если x < 0,
и считается, что 0° =1.
Таким образом, формулы (9.3%)—(9.39) позволяют рассчитать услов-
ную вероятность Qi (t), i E E, c заданной степенью точности.
B некоторых случаях достаточно найти оценку R"(t) снизу для фyнк-
ции R* (t):
N |
|
i —n |
|
*()р |
|
(9.40) |
|
|
' ^п,(t). |
||
i=n |
|
r=0 |
|
Начальное значение функции R'(t), как это следует из (9.36)—(9.39), равно коэффициенту готовности BC, т. e.
R*(0) = s.
Можно показать, что
|
|
|
N-1 |
|
п < N; |
R |
* (-юo) = 1im |
R* (t) |
Е Р |
при |
|
i =п |
|
n=N. |
|||
|
|
|
0 |
при |
|
B самом деле, |
|
|
|
|
|
|
|
N-1 |
|
ао |
i(t) = 0, |
1im QN (t) =!imi(t) =1 - 1im |
|||||
t-^оо |
t^oo |
r=0 |
|
t^oo r=N —n+1 |
|
(9.15),
(9.41)
(9.42)
так как при i = N из (9.39) следует, что и1 (t) = 0, 1 > 0, и0 (t) =1. Поскольку N — п = const, то при t —+ 0о в системе наиболее вероятными становятся количества отказов г Е {N — п +1, N — п +2, ... } . Поэтому при t —k 00 c дос-
таточной для практики точностью можно считать, что |
Е тяг (t) —> 1 и, |
r=N—n+1 |
|
следовательно, QN (t) — 0. |
|
далее из (9.з9) видно, что при i Е {п, n +1, ... , N —1 } |
и при большом t |
вероятности и1 (t) будут тем больше отличаться от нуля, чем больше будет 1. Иначе говоря, если i Е {п, п +1, ... , N —1 }, то при большом t число восста-
432
9. б. Расчет показателей надежности для стационарного режима
новлений 1 в системе будет также большим, т. e. если t - Со, то и 1 -4 о0.
Если это так, то при t |
|
имеет место |
i—n+1 |
|
|
и, следовательно (9.37), |
|
с0 |
Е тяг (t) -+ 1 |
||||||
|
|
|
|
|
|
|
|
|
|
|
г=о |
|
|
|
|
Q; (t) -> 1, i Е Е. Переходя к пределу при t -+ с0 |
в (9.36) и учитывая по- |
||||||
ведение Qi (t) при t |
00, получаем (9.41). |
|
|
|
|
||
Действуя аналогично, находим, что функция (9.14) |
|
||||||
|
|
n-1 |
ao |
|
n—i—l+r |
|
|
|
U*(t)=l_Iпг(t) |
|
Иi(t). |
(9.43) |
|||
|
|
i=O |
r=O |
|
1=0 |
|
|
Очевидно, что U(О) = S, U^(+oo) = urn U^(t) =1. |
|
||||||
|
|
|
r-ф |
|
|
|
|
Оценкой сверху для U' (t) будет функция |
|
|
|
||||
|
|
Й*(t) = |
n-1 |
n—i—i |
|
|
|
|
|
|
|
и(t). |
(9.44) |
||
|
|
|
i=O |
1=0 |
|
|
|
Выведенные в данном разделе формулы позволяют оценить функционирование BC в стационарном режиме.
9.6.2. Распределение вероятностей состояний вычислительных систем
Рассчитаем распределение вероятностей (9.5) состояний ВС для стационарного режима функционирования: {Р0, P, ..., Р; , ..., P } ; это позволит
вычислить функции (9.36) и (9.43) и коэффициент готовности (9.15) ВС. Для расчета P; , j Е Е, потребуется осуществить предельный пере-
ход при t - о0 в системе уравнений (9.29). Правые части всех ypавнений (9.29) при t -4 с0 имеют пределы. Следовательно, каждая из производных Pi, i Е Е'', при t -> 00 также имеет предел и такой предел может бьггь только нулем. Если бы какая-нибудь производная P; i Е Е, стремилась к числу, отличному от нуля, то соответствующее IР(t)l при t со неограниченно бы возрастало. Последнее противоречило бы физическому смыслу величин Р (t) (так как 0 < 1(t) < 1, i Е Ео) и формуле (9.5). Таким образом,
при t -> с0 имеет место 1'(t) -+ 0, i Е Е'. Следовательно, система диффе-
ренциальных уравнений (9.29) преобразуется в систему алгебраических
уравнений:
433
|
9. Надежность вычислительных систем |
|
|
|
|||||||||
0= -rniaPo + ?,P1 ; |
|
|
|
|
|
|
|
0 < j (N - rn); |
|
||||
0= тр'Р 1 - (]?. + rnt)Р + (j+ |
1)?J, |
|
(9.45) |
||||||||||
о = (N - j + 1)µР;-1 - [j + (N - |
|
+ (]+ 1)?J,, |
(N - т) < j < N; |
||||||||||
|
|
||||||||||||
0 = µPлs-1 - N&PN . |
|
|
|
|
|
|
|
|
|
|
|
|
|
Если положить |
|
|
|
|
|
|
|
|
|
|
|
|
|
тµР;-1 - AP./ = г;, |
|
0<1 (N - т + 1); |
|
|
(9.46) |
||||||||
[N - (j -1)]1 - j^Р; = г; , (N -rn+1)jNf' |
|
||||||||||||
|
|
||||||||||||
то систему (9.45) можно записать в следующем виде: |
|
|
|
|
|
||||||||
г1 |
= 0; |
|
|
|
|
|
|
|
|
|
|
|
|
|
— г;+1 = 0, |
|
1 <j (N - т); |
|
|
|
|
||||||
|
|
|
|
_ . |
|
|
|
|
|
|
|
(9.47) |
|
гN т+1 |
- гN-т+2 - 0, |
|
|
|
|
|
|
|
|||||
|
- г^+1 = 0, |
|
-rn+2) ]<(N |
N; |
|
|
|
||||||
гN = 0. |
|
|
|
|
|
|
|
|
|
|
|
||
Из (9.47) следует, что |
г = 0, 0 < j < (N - m + 1); |
тогда, учитывая (9.46) |
|||||||||||
и принимая a = µ / ?,, получаем |
|
|
|
|
|
|
|
|
|
||||
тµ |
|
ат |
|
- |
т'а' |
1 |
j |
- |
|
+ 1). |
(9.48) |
||
Р=—Р |
1 =---Р 1 ; |
Р; - |
. Р0, |
(N m |
|||||||||
|
|
j |
|
|
|
J• |
|
|
|
|
|
|
|
Кроме того, из (9.47) следует, что = 0, |
(N - m +1) < j < N; |
|
|||||||||||
= [N -( j -1)]а |
|
|
_ [N -( j -1)]. ..[N -(N-т)]а`-N+m D |
|
|||||||||
Р; - |
|
|
|
- |
j(j -1)...(N -rn+1) |
|
DN-т |
|
|||||
] |
|
|
|
|
|
|
|
||||||
a.j-N +тт(N -rn)! тN-maN-т |
т !mN-ma.j |
|
|
(9.49) |
|||||||||
= |
(N-])!]! |
(N -rn)! Р0= (N-])!]! Р0 . |
|
|
|||||||||
Используя условие нормировки и (9.48), (9.49), находим |
|
|
|
||||||||||
Po = |
Nт |
1 |
а |
1 |
|
N |
а |
1 |
|
-1 |
|
|
|
^ |
т |
+ m! m N- т |
^ |
|
|
|
|
|
(9.50) |
||||
|
1=0 |
1! |
|
^ |
1=N-m+1 (N -1 )! 1 !] |
|
|
|
|
||||
Р; _ |
а' |
|
|
|
|
|
|
т ! mN-т |
Ро, |
(9.51) |
|||
.^ 0(N - т-^)т + 0(j - |
|
|
(N -j)! j |
||||||||||
|
J • |
|
|
|
|
|
|
|
|
|
|
||
где j e {1, 2, ..., лт),
434
9.6. Расчет показателей надежности для стационарного режима
А(х) |
если х 0; |
= 0, если x < 0. |
заметим, что в (9.48)—(9.51) принято 0 ° =1.
Рассмотрим два крайних случая: m =1, m = N. B первом случае, ко-
гда в ВС имеется одно восстанавливающее устройство, решение (9.51) принимает вид
1 1 -1 ,jЕЕоN |
(9.52) |
м l !
Если в (9.52) перейти к пределу при N --> щ получим вероятность то-
го, что при m =1 в стационарном режиме работы большемасштабной ВС
исправно j машин, равна:
Р. = |
µ' |
е , J'Е Ео• |
(9.53) |
— |
]!
Распределение вероятностей (9.53) является распределением Пуассона. B случае, когда количество восстанавливающих устройств равно ко-
личеству машин в системе, решение (9.51) преобразуется к виду
N! |
µ'Х,N ' |
>v |
(9.54) |
|
Р _ CN-J)!J!(?+oN , .1 |
Е Ео , |
|||
|
||||
a коэффициент готовности BC |
|
|
|
|
S = 1- %1,N-п+1(^ + |
|
(9.55) |
||
9.6.3. Готовность масштабируемых вычислительных систем
Изучим влияние числа N при его неограниченном увеличен на потенциaльнyю готовность ВС к выполнению основных функций по переработке информации. B дальнейшем будем говорить, что ВС имеет высокую готов-
ность, если 1im S =1. Ранее было показано, что вероятность того, что матши-
ти-+
на в стационарном режиме исправна, равна ее коэффициенту s готовности
(2.26). Поскольку элементарные машины ВС независимо друг от друга могут
находиться в исправном состоянии или в состоя ии отказа, то, используя при условии v = (п —1)N-1 < s известные оценки биноминальньпх сумм [22],
можно показать, что коэффициент готовности ВС
435
9. Надежность вычислительных систем |
|
S > 1 - e -NK , s = 1 _ е-Nк+о(1п N) , |
(9.56) |
где к = v 1n(vs -1 ) + (1— v) ln[(1— v)(1 — s) 1 j. Из (9.56) следует, что ВС имеет
высокую готовность при выполнении условия v < s.
Наряду c монопрогpаммным режимом, когда на системе решается одна сложная задача, представленная в параллельной форме, в ВС широко использyются и мультипрогpаммные режимы (см. рaзд. 7.2.2). При организации мультипрограммной работы система программным способом разбивается на подсистемы. Количество подсистем соответствует количеству одновременно решаемых задач на ВС, a количество ЭМ в каждой из подсистем не менее ко-
личества ветвей в реализуемой параллельной программе. B связи c этим представляет интерес изучить, каким образом параметры подсистем влияют на
надежность (точнее, на коэффициент готовности) ВС в целом.
Пусть ВС состоит из h подсистем, причем подсистема c номером j Е Ег имеет следующие параметры: N; число ЭМ; п минимально
допустимое число исправных ЭМ, при котором подсистемой обеспечивается требуемый уровень производительности
|
^ N, =N; |
v, = (п, —1)N^1 ; |
v |
1—v |
|
s |
' . |
||
|
j=1 |
|
1- s |
|
|
Рассмотрим случай, когда все подсистемы важны для существования |
|||
Тогда коэффициент готовности BC |
BC. |
|||
|
|
h |
h |
|
|
|
S = ПS; > П(1— е-N'к' ), |
(9.57) |
|
|
|
j=1 |
1 |
|
где s, |
коэффициент готовности подсистемы c номером j Е Е, a нера- |
|||
венство получено на основе (9.56). |
|
|
||
|
Пусть числа |
п; и N; (j Е Е;) |
переменны, т. e. допускается их |
|
варьирование и выполняются условия:
1)для каждой подсистемы c номером j параметр v; = const;
2)общее число машин постоянно: N = const.
Требуется найти такое распределение {лт; { , j Е Е1 , чисел ЭМ в под-
системах, при котором нижняя оценка (9.57) достигает максимума.
Точное решение сформулированной задачи методом множителей Ла гранжа при больших значениях NN , j Е Е, асимптотически совпадает c решением, получающимся при значениях N; , обеспечивающих постоянство сомножителей в оценке (9.57). Следовательно,
436
9. б. Расчет показателей надежности для стационарного режима
h |
|
|
- 1 |
N = N к |
к1 |
1 |
(9.58) |
1=1 |
|
|
|
при этом |
|
|
|
]Vк h _ |
1 |
|
h |
S> 1 - e h к= —^ кd -1(9.59)
h 1=1
к средний гармонический коэффициент к; , j Е Е; [22, 23 ] .
Рассмотрим более общую ситуацию, при которой оснащение (моду-
..
лями памяти, внешними запоминающими устройствами, средствами вводавывода информации) ЭМ различно. Тогда каждая 1-я ЭМ будет иметь свой коэффициент готовности s1, 1 Е Е;' Можно показать, что в общем случае
сохраняются все вышеприведенные соотношения, если вместо s рассматри-
вать величину
N
s = N-1 ^ s1.
1=1
Исследуем теперь поведение BC в зависимости от степени дробления на подсистемы. Пусть количество N элементарных машин BC увеличивается
вместе c количеством h ее подсистем так, что
|
N_ 1+ E h 1n h— 1 h 1n d, |
(9.60) |
|
|
к |
к |
|
где d, & |
произвольные действительные числа, d > 0. |
Тогда из (9.59) |
|
следует, что |
е-dh1EI |
|
|
|
при & < 0; |
|
|
|
s е |
(9.61) |
|
|
|
||
|
>1—dh -E |
при&>0. |
|
Следовательно, ВС имеет высокую готовность, если c увеличением h
порядок роста N больше величины h 1n h / к Из (9.58)—(9.61) видно, что для достижения высокой готовности ВС необходимо выполнение условия
Ni >к^1 1nh, jЕЕ1.
9.6.4. Коэффициент готовности бQльшeмаcшта6ныx вычислительных систем
Выведем расчетные формулы для коэффициента готовности BC c боль-
количеством мauпш. для таких систем в cтoxacтичecких моделях счигает гuим cя, что N — oo, a фyFпщия готовности рассчитывается по формуле (9.30).
437
9. Надежность вычислительных систем
Полагая в (9.34) x = 0, находим
b0 (t) _ |
00 |
1im bo (t) = |
00 |
|
P, (0)(1— e- ` )l , |
P (0) =1. |
(9.62) |
||
Если положить в (9.34) x =1, то |
|
|
|
|
|
Ёьiсt) = |
P(0) =1. |
|
(9.63) |
|
1=0 |
1=о |
|
|
Из формул (9.62) и (9.63) при 1 > 1 следует, что 1im Ы (t) = 0. Учиты- t-+cO
вая (9.33) и последнюю формулу, получаем, что стационарными вероятностями состояний ВС будут
Р; = тµ 1 е-тµ |
Е Е. |
(9.64) |
Заметим, что при m =1 формула (9.64) преобразуется в известный результат (9.5 3 ).
Предельный переход при t —> ао в (9.30) и результат (9.64) приводят к расчетной формуле для коэффициента готовности большемасштабной ВС:
S=1-1 |
е |
(9.65) |
=о J!
При анализе функционирования большемасштабных ВС (или ВС c массовым параллелизмом) можно использовать статистику не o потоке откaзов в одной ЭМ, a об отказах ВС в целом. Тогда стохастическую модель функционирования ВС можно изменить следующим образом. Пусть задана не интенсивность ? отказов одной ЭМ системы, a интенсивность л (простейшего) потока отказавших машин ВС. Тогда л представляет собой среднее количество отказавших ЭМ, поступающих на m восстанавливающих устройств за единицу времени. Пусть Р; вероятность того, что в стацио-
нарном режиме в ВС имеется j Е Е отказавших машин. Действуя традиционно, получаем:
-лРо + µР = 0; |
|
|
АР;-1 -(л + ji)Р + (j + 1)µР;+1= 0, |
1 ] < т; |
(9.66) |
AP;-1 - ( л + тµ)Р; + тµР;+1 =0, |
m < ^.. |
|
438
9.6. Расчет показателей надежности для стационарного режима
Как было показано в (2.18), µ среднее число восстановлений ЭМ, которое может произвести одно восстанавливающее устройство в единицу времени. Тогда производительность восстанавливающей системы будет характеризоваться величиной mµ. Ясно, что очередь на восстановление отказавших ЭМ не будет расти безгранично и, следовательно, ресурсы ВС будут
эксплyатироваться c потенциально возможной эффективностью при условии
A<тµ.
Легко показать, что решениями системы уравнений (9.66) при выполнении условия нормировки и A < тµ будут:
|
|
(Ат1 1 |
(9.67) |
|
^ |
‚0 1 кµJ (m-1)!(mµ—A) |
µJ |
||
|
||||
J |
Т J)1i+0(I — т)1 |
m]Po, j Е. |
(9.68) |
|
[ |
||||
P^ —\µJ |
m |
|
|
Заметим, что по определению (9.2) п количество ЭМ основной под-
системы ВС со структурной избьггочностью, следовательно, n является пре-
дельно допустимым числом исправных машин, при котором производительность системы остается не ниже требуемого уровня. По аналогии c п в рамках данной стохастической модели целесообразно ввести п максимaльное количество отказавших ЭМ, при котором производительность ВС не ниже предельно допустимой. Следовательно, если ВС находится в со-
cтоянии j Е Е7, где Е = {О, 1, 2, ... , п }, Е c Е, то будем считать, что
она готова к выполнению основных ункцдчv по обработке информации. Тогда коэффициент готовности ВС рассчитывают по формуле
Л _
i =о
где величины P; определяются из (9.67) и (9.68).
Зная вероятности Р; , j Е Е, легко вычислить не только коэффици-
ент S готовности ВС, но и ряд других количественных характеристик надежности ВС для стационарного режима работы. Среднее количество отказавших машин ВС, ожидающих начала восстановления,
M= |
A |
P |
1 mµ(1— А / тµ)2 |
|
|
при условии A < mµ. Математическое ожидание количества отказавших машин системы
439
9. Надежность вычислительных систем
_ m-1 |
|
1 |
л |
тРт |
М2 = М1 + Ро ^ . |
-1)! |
t |
+ 1– л / тµ |
|
;=1 |
(j |
|||
Среднее число свободных восстанавливающих устройств
=ёо т -1 тз _j (J
^=о .1 ! µ
Вероятность того, что все восстанавливающие устройства заняты ре-
монтом отказавших машин ВС,
П = Pm (1 |
- !1 / 7Yi |
1 |
|
Закон распределения времени 1 ожидания начала восстановления отказавшей ЭМ (в стационарном режиме) или вероятность того, что время пребывания отказавшей ЭМ в очереди на ремонт больше t,
P€i1 > t} = пе-(тµ-А)t
Математическое ожидание и дисперсия времени ожидания начала восстановления отказавшей ЭМ вычислительной системы соответственно равны
Mn = п/(тµ —л); Dri = Мi[г/(тµ —л)—Мт1].
B заключение следует подчеркнуть, что N –+ оо является парадигмой для построения стохастической модели функционирования большемас-
штабных ВС. B реальных системах N безусловно конечно, но при массовом параллелизме как N, так и n являются большими числами. Более того, производительность любой такой ВС оценивается (9.2) величиной по, которая близка к суммарной пиковой производительности Nго (см. рaзд. 3.3.3), с - производительность одной ЭМ (см. § 2.6). Основываясь на этом факте, при анализе готовности большемасштабных ВС можно считать, что
л= N.
9.7.Потенциальный контроль вычислительных систем
Работоспособные ресурсы в BC выявляются c помощью средств контроля и диагностики. При этом контроль системы (или ee части — пoдcиc-
темы) позволяет установить факт работоспособности или нepaбoтocпocoб-
нocти проверяемых ресурсов. Дuaгнocmuкa же (после установления нepaбo-
тocпocoбнocти BC или ee подсистемы) позволяет определить, какой из
440
