Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

khor32

.pdf
Скачиваний:
26
Добавлен:
29.02.2016
Размер:
8.16 Mб
Скачать

2.8. Надежность ЭВМ

Различают полный и частичный отказы ЭВМ. Полный отказ приводит к абсолютному нарушению работоспособности ЭВМ, или, говоря иначе, к

потере ее способности выполнять любые из заданных функций по переработке информации, что может произойти, например, вследствиe аварийного

отключения электропитания ЭВМ. Частичный отказ ЭВМ вызывает ухуд-

шение качества ее функционирования или сокращение количества выполняемых функций. B данном параграфе полный и частичный отказы ЭВМ

различать не будем.

Отказы приводят к таким изменениям в функционировании ЭВМ, которые носят постоянный характер. Для подчеркивания этого постоянства часто вместо термина «отказ» используют термин «устойчивый отказ». Устойчивые отказы могут быть устранены только в результате ремонта (или восстановления) машины. Наряду c отказами, как показывает опыт, в ЭВМ происходят неожиданные изменения физических параметров, когда они выходят за допустимые пределы. Такие изменения носят временный характер,

самоустpаняются и называются перемежающимися (или неустойчивыми) отказами или сбоями. Ниже будем рассматривать только устойчивые отказы и для краткости использовать термин «отказ».

B случае, когда в машине произошел отказ, и он не устранен, то говорят, что ЭВМ находится в неработоспособном состоянии (в состоянии отказа) или отказавшая ЭВМ. При эволюционном развитии ЭВМ уменьшается вероятность состояния отказа, увеличивается период работоспособности

ЭВМ. Так, работоспособность машин первого поколения ограничивалась, как правило, десятками минут, a в ЭВМ третьего поколения она достигала тысячи и более часов, в современных мацпшах составляет годы и десятки лет.

Несмотря на достаточную редкость отказов современных ЭВМ, тре-

буются средства для поддержания работоспособности машины, т. e. средства

технического обслуживания, контроля, диагностики и устранения неисправностей (или самоконтроля, самодиагностики и самоустранения неисправностей). Среди этих средств имеются микpопрогpаммные, аппаратypные, ап- паратурно-прогpаммные и программные компоненты. Более того, в ЭВМ общего назначения контроль, диагностика и устранение неисправностей осуществляются бригадами технического обслуживания.

Восстановлением называется событие, заключающееся в том, что отказавшая ЭВМ полностью приобретает способность выполнять заданные функции по обработке информации. Восстановление отказавшей ЭВМ может быть осуществлено автоматически (в общем случае c помощью аппа- ратурно-прогpаммных средств) или полуавтоматически (c участием бригады технического обслуживания). Ниже способ восстановления отказавшей ма-

шины различать не будем, a будем считать, что оно производится некото-

рым восстанавливающим устройством (ВУ). Следовательно, переход отка-

83

2. Архитектура электронных вычислительных машин

завшей ЭВМ в работоспособное состояние может произойти лишь в результате работы ВУ или, говоря точнее, после ремонта машины восстанавливающим устройством.

Для характеристики качества работы ЭВМ используют систему пока-

.,

.,

зателеи надежности, каждый из которых определяется через понятия отказа

и (или) восстановления. Прежде чем дать опре деления показателей надежности ЭВМ, введем случайные функцию о(т) и величину 4. Пусть

 

1, если в момент времени i > 0

 

(0(т) =

ЭВМ находится в работоспособном состоянии;

(2.9)

0, если в момент времени i 0

ЭВМ находится в неработоспособном состоянии.

Назовем о(т) производительностью ЭВМ в момент времени T 0 и пусть

являетсямоментом,когдавозникаетпервыйотказприработеЭВМвза-

данных условиях эксплуатации.

2.8.2. Функция надежности ЭВМ

Функция надежности (или вероятность б езотказной работы) ЭВМ относится к основным показателям и характеризует производительность ЭВМ на заданном промежутке времени или, говоря иначе, характеризует способность ЭВМ обеспечить на промежутке времеЕ:и потенциально возможную производительность.

Функцией надежности ЭВМ называется функция

г(t)=Р{Vт[О,t) -+о)=1}.

Здесь P{b'T E [0, t) - w(T) = 1} — вероятность ого, что для всякого T, при надлежащего промежутку времени [0, t), npc изводительность ш(T) ЭВМ равна единице (2.9), т. e. равна потенциально возможной (см. § 2.6).

Для доказательства свойств функции r(t; i и определения показателей надежности, производных от r(t), удобнее дать следующее определение:

(2.10)

где P{^ > t} — вероятность события { > t}, состоящего в том, что момент

возникновенияпервогоотказаприработеЭВМвзаданныхусловияхэкс-

плуатации наступит после времени t > 0.

84

2.8. Надежность ЭВМ

Функция r(t) обладает следующими свойствами:

1) r(0) = 1; действительно, так как событие ё > 0 (т. e. coбьrrиe, заключающееся в том, что в момент начала функционирования ЭВМ работоспособна) считается достоверным, то P{Г > 0} = 1;

2) r(+oo) = 0; поскольку событие > (+oo) считается невозможным

(или, говоря другими словами, событие, зaкrпoчaющeecя в том, что ЭВМ работоспособна на конечном промежутке времени, является достоверным),

то, следовательно, P{^ > (+oo)} = 0;

3) r(t1 ) > r(t2 ) для t 12; в самом деле, события > 12 и 12 > t1

являются не совместными, поэтому по теореме сложения вероятностей имеем

r(ti ) = P{ё > ti } = P{( , > 12 ) v (t2 > ё, > ti )} =

= P{ё > t2 } + P{tг > t^ } > P{ё > t2 } = r(t2 ).

Функцией нeнaдeжнocmu (или вероятностью отказа) ЭВМ называется q(t) = 1 - г(t).

Функцию q(t) можно рассматривать как интегральную функцию распределения случайной величины . для оценки q(1) на практике пользуются формулой

ц(t) (t) = n(t)/N,

где N — число работоспособных ЭВМ в начале испытаний; п(t) — число отказавших машин в промежутке времени [0, 1).

Функция q(t) позволяет определить такие производные показатели

надежности ЭВМ, как среднее время безотказной работы (средняя нapaбoт- кa до отказа) и интенсивность отказов машины. По oпpeдeлeнFпo среднее

время 9 безотказной работы ЭВМ и оценка 8 соответственно равны:

J c^ — c^^ f

r(t)cit =

J c^

Э = 1

^

(2.1 1)

Э = Itc/q(t)= tdr t – – tr t +

r

dr;t

 

t„

где t1 время безотказной работы i-й машины,

i

e {l, 2, ..., N}.

 

 

Интенсивностью отказов (лямбда-характеристикой) ЭВМ называется функция

1 dq(t) _

1 dr(t)

(2.12)

^^t^ 1—q(t) dt

r(t) dt

 

85

2. Архитектура электронных вычислх.тельных машин

Ha практике для определения ?',(t) используют кycoчнo-линeйнyю aппpoкcимaцию

(t) = n(At)/[N(t)Atj.

(2.13)

Здесь п(At) — число отказавших ЭВМ в промежутке времени [t, t + At); N(t) — число безотказно работающих ЭВМ в момент t. B самом деле, пoд- cтaвив в (2.13) оценки

n(At) = n(t + At) - n(t) N[q(t - At) - q(t)]; N(t) = N - п(t) N[1- q(t)]

и осуществив соответствующий предельный переход при At -+ 0, получим

формулу (2.12).

Интегрируя от 0 до t выражение (2.12), получаем

t

t

= -1n r(t);

r(t) = exp - J(т)dт .

0

0

Практически установлено, что зависимость интенсивности отказов от

времени имеет место на периоде приработки Э] 3М. После приработки ЭВМ интенсивность отказов остается постоянной (, iо вхождения в предельное состояние или, по крайней мере, в течение промежутка времени, перекрывающего время морального старения). Следовательно, в нормальных условиях эксплуатации ЭВМ ? = const, a функция :адежности (2.10) и математическое ожидание времени безотказной работы (Z.11) соответственно равны :

 

 

00

1

(2.14)

r(t) = exp(-t);

9 = Je-^r dt --

о

 

 

0

 

 

Таким образом, время безотказной работ ы ЭВМ подчиняется экспо-

ненциальному закону. Следовательно, величина

среднее число отказов,

появляющихся в машине в единицу времени.

 

 

 

Функция r(t) есть вероятность того, что в ЭВМ произойдет ноль от-

казов за время t. Тогда вероятность появления в ЭВМ k отказов за время t будет равна

Гk(t) = k! е

(2.15)

где ro (t) = r(t). B самом деле, среднее число отказов, появляющихся на

промежутке времени [0, t), равно

86

2.8. Надежность ЭВМ

 

 

kr,'. (t) = e-r?»t^

= t,

(2.16)

так как последняя сумма в (2.16), очевидно, равна exp

t. Таким образом,

поток отказов в ЭBMявляemcя пyaccoнoвcкuм, или простейшим (2.15).

2.8.3. Функция восстановимости ЭВМ

Функция восстановимости (или вероятность восстановления paбoтo-

способного состояния) ЭВМ основной показатель, характеризующий на -

дeжнocтныe способности и ЭВМ, и восстанавливающего устройства oднoвpeмeннo. Или, говоря иначе, эта количественная характеристика дает инфopмaцшo o том, как приспособлена машина к восстановлению своей

производительности (после отказа) c помощью BY. Функцией восстановимости ЭВМ назовем функцию

u(t) =1 P{di E [0, t) > w(T) = 0},

(2.17)

где P{b'т E [0, t) –> w(T) = 0} — вероятность того, что (при выполнении вос-

становительных работ в машине) для всякого T, принадлежащего промежутку времени [0, t), производительность w(T) ЭВМ остается равной нулю (2.9)

(или есть вероятность того, что отказавшая ЭВМ при работе вoccтaнaвли-

вaющero устройства не будет восстановлена за время t).

Для функции u(t) справедливо: 1) u(U) = 0; 2) u(+oo) = 1; 3) u(ti) < и(12 ) для t 12 . Следовательно, u(t) является интегральной функцией pacпpeдe-

лeния времени восстановления отказавшей ЭВМ.

Для практической оценки вероятности восстановления ЭВМ на про-

межутке времени [0, t) используют формулу

u(t) ŭ(t) = т(t)/М.

Здесь M— число отказавших машин в начале восстановления; m(t) число восстановленных машин за время 1 при условии, что ремонт каждой ЭВМ

осуществляется своим ВУ.

Основываясь на практическом материале по эксплуатации ЭВМ и применяя статистические критерии o достоверности гипотез относительно

распределения случайных величин, можно доказать справедливость формул

^

 

u(t) = 1– exp(–µt); T = Jtdu(t) = 1/ µ,

(2.18)

0

 

87

2. Архитектура электронных вычислительных машин

где т среднее время восстановления работоспособного состояния ЭВМ; µ интенсивность восстановления ЭВМ, или среднее число восстановле-

ний ЭВМ, которое может произвести ВУ в единицу времени.

Примечания. 1. Проведение статистических ' экспериментов, которые бы позволили определить q(t), 9. и 5(t), для машин первого и второго поколений и для

мощных ЭВМ третьего поколения было невозможным (из-за их большой стоимости и мелкосерийности производства). Только после ос доения массового производства мини-ЭВМ и особенно микроЭВМ появилась принципиальная возможность проведения таких экспериментов (по крайней мере опытов на статистически

достаточном количестве ЭВМ простейших конфигураций, т. e. машин, каждая из которых состояла из микропроцессора и памяти).

2. При определении оценок 4(t) и 5 для функции ненадежности q(t) и

среднего времени а безотказной работы ЭВМ целесообразно применять эргодическую гипотезу. Эта гипотеза позволяет вместо стат истических результатов наблю-

дения за большим числом N машин воспользоваться результатами наблюдения за одной машинок в течение длительного времени.

3. Справедливость экспоненциaльного закон (2.14) распределения времени безотказной работы ЭВМ подтверждена обработкой статистических данных по эксплуатации ЭВМ первого-третьего поколений. Про проверке этой гипотезы был

применен критерий согласия х2 Пирсона.

4. Среднее время безотказной работы а (2. L 1) современных микропроцес-

сорных ЭВМ оценивается многими годами, напримeр, для электронной части ЭВМ оно составляет i05... 108 ч. Поэтому для определения оценок показателей надежно-

сти ЭВМ разработаны методики ускоренных эксл ериментов (например, использующие нагревание интегральных схем).

2.8.4. Функция готовности ЭВМ

Функции надежности (2.10) и восстановимости (2.17) характеризуют на промежутке времени [0, t) возможности ЭВМ соответственно по обеспе-

чению потенциальной производительности и п достижению этой производительности после отказа. Первый показатель связан c понятием отказа, a второй c понятием восстановления ЭВМ. Следовательно, функция надежности позволяет пользователю оценить во: зможность решения той или иной задачи на ЭВМ (оценить, c какой вероятн стью при наличии отлаженной программы и при известной оценке времени решения задача может быть пропущена через машину). Функция восстановимости информирует пользователя o том, c какой вероятностью отказавшая ЭВМ к заданному времени будет восстановлена (и, в частности, позволяет пользователю определить ожидаемое время простоя ЭВМ после отказа).

88

2.8. Надежность ЭВМ

Функции надежности и восстановимости ЭВМ характеризуют поведение машины только на начальном этапе ее работы (на конечном промежутке времени [0, t)) или, как говорят, в переходном режиме функциониро-

вания. Эти показатели не информативны при оценке работы ЭВМ в течение длительного времени или в стационарном режиме функционирования. Действительно, для стационарного режима, т. e. для режима, который устанавливается при t -+ оо, имеем

lmr(t)=0; 1гти(t)=1.

t-+со В-*(У)

Из сказанного следует, что требуется комплексный показатель надежности ЭВМ, который бы характеризовал производительность ЭВМ и в переходном, и в стационарном режимах и который был бы связан одновременно c понятиями отказа и восстановления. Прежде чем определить такой показа-

тель, введем обозначения: Ео = {0,1 }

множество состояний ЭВМ, при-

чем i = 0 соответствует состоянию отказа, a i =1

работоспособному со-

стоянию машины; Р^ (i, t) — вероятность нахождения ЭВМ в момент t > о в

состоянии j Е Е

при условии, что ее начальным было состояние

i Е Ео.

B качестве показателя, позволяющего достичь вьштепоставленной це-

ли, можно использовать функцию готовности ЭВМ

 

 

s(i,t)=Р(i,t)=Р{i;с,^(t)=1},

(2.19)

где P {i; со(t) =1 }

вероятность того, что (в условиям потока отказов и вос-

становлений) машина, начавшая функционировать в состоянии i Е Е, будет иметь в момент времени t > 0 производительность, равную единице (т. e. равную потенциально возможной, см. (2.9)).

Функция готовности ЭВМ обладает следующими свойствами:

1)s(0, 0) = 0, s(1, 0) = 1;

2)s(г, +оо)= s=const,0<s<1, iЕЕЕ;

з) s(0, н1) < в(0, t2 ), в(1, н1 ) > в(1, t2 ) для н1 < t2.

Смысл этих свойств интуитивно ясен. дадим физические пояснения к этим свойствам.

Функция готовности (2.19) одновременно учитывает и отказы, u восстановления и характеризует производительность ЭВМ не на промежyтке времени [0, t), a в момент t > 0, следовательно, в качестве ее на-

чaльного значения (начального состояния ЭВМ) может быть взято одно из

возможных значений О или 1 (одно из состояний ЭВМ : «ЭВМ отказала», i = 0, или «ЭВМ работоспособна», i = 1). Из сказанного и из определения

89

(t + At)

2. Архитектура электронных вычисл; стельных машин

(2.19) вытекает справедливость первого свойства функции готовности ЭВМ. Далее, относительно второго свойства функции готовности ЭВМ: s(i, t) ха-

рактеризует поведение ЭВМ в любой момент t > 0, т. e. не только в переходном, но и в стационарном режимах работы. Ясно, что в режиме длительной эксплуатации ЭВМ (t -+ оо) при наличии :3У (процедуры восстановления) вероятность отказа не равна единице, следовательно, можно записать

s(i, + оо) = 1 rn s(i, t) = s = const,

1-400

где s не зависит от начального состояния i Е ,Т4 машины, 0 < s < 1. Равенство s = const объясняется следующим: поскольку за время t = +оо происходят и отказы, и восстановления ЭВМ, то «забывается» предыстория, т. e.

«теряется» зависимость от i Е Е. Величина s называется коэффициентом

готовности ЭВМ. Наконец, справедливость трЕ-тьего свойства видна из первых двух свойств функции готовности ЭВМ.

Говоря иначе, функция готовности есть вероятность того, что ЭВМ в момент времени t > 0 работоспособна (т. e. :3ероятность того, что ЭВМ

способна выполнять возлагаемые на нее функц пи). Следовательно, функция

готовности несет информацию o том, может ли пользователь начать работу на ЭВМ в данный момент времени (и в переходном, и в стационарном режимах функционирования). Если же ЭВМ общего назначения и находится в постоянной эксплуатации, то пользователь мод сет оценить возможность ре-

шения задач на ней только по коэффициенту готовности.

Выведем дифференциальное уравнение д пя расчета функции готовности ЭВМ. Пусть At промежуток времени бесконечно малой длины. Оценим вероятность того, что ЭВМ в момент находится в работоспо-

собном состоянии. Последнее событие сложнее и может наступить, если произойдет, например, одно из несовместных событий:

1) ЭВМ при t > 0 неработоспособна, a на промежутке времени [t, t + At) она будет восстановлена;

2) ЭВМ при t > 0 работоспособна, v на промежутке времени [I, t + At) она не откажет.

Очевидно, что события, составляющие любое из этих несовместных событий, являются независимыми.

Оценим вероятности изучаемых событий Вероятности того, что ЭВМ при t > 0 неработоспособна или работоспособна, соответственно равны

Ро (i, t) =1- s(i, t) или P (i, I) = s(i, I), i Е Е (см. (2.19)). Вероятность того, что отказавшая ЭВМ за время At будет восстановлена (2.18), равна и(ot) или, применяя разложение функции восстановимости 3 ряд Маклорена, имеем

90

2.8. Надежность ЭВМ

u(At) = u(0) + uI(О)

At +

u"(О) (Аt)г + ... =1- e-µ°` _

 

1!

 

2!

 

=0+ —L& + о

= Ot + оo(OtAt),

(2.20)

1.

o(At) µ

 

 

 

где о(At) величина более высокого порядка малости, чем At. Аналогично действуя, находим вероятность того, что ЭВМ за время At не откажет:

r Ot = r 0

+

Ot + r М(0)

Ot 2 + ... = е

=1- kAt + о 0t

(2.21)

 

1.

2.

 

 

 

заметим, что ЭВМ может оказаться в момент t + At в работоспособном состоянии и не только в результате наступления описанных выше собы-

тий. Например, при условии, что ЭВМ при t > 0 работоспособна, наступление сложного события, заключающегося в том, что на промежутке времени [t, t + At) происходят отказ и восстановление ЭВМ, приводит к интересую-

щемy нас состоянию. Однако вероятность того, что данное сложное событие произойдет, равна

n (At)u(At) = ?',er[i - ?,er + o(er)] [µer + o(or)j = o(At),

что следует из (2.15), (2.20) и (2.21). Легко убедиться в том, что если ЭВМ в момент (t + At) оказывается в работоспособном состоянии в результате нa-

cтyплeния на промежутке времени [t, t + At) более одного из coбытий «отказ» и «восстановление», то изучаемые вероятности также имеют вид o(At).

Таким образом, вероятность нахождения ЭВМ в момент времени

(t + At) в работоспособном состоянии будет равна

s(i, t + At) = [1 - s(i, t)]u(Ot) + s(i, t)r(Ot) + o(At) =

 

= [1 - s(i, t)] µet + s(i, t)(1- ?'‚At) + о(et)

(2.22)

(в силу независимости и нecoвмecтнocти рассматриваемых coбытий). Перенеся s(i, t) в левую часть в (2.22), разделив на At и перейдя к пределу при

At -+0 в обеих частях рассматриваемого равенства, получим следующее

дифференциальное уравнение:

ds(i, t) _ µ _ Q + µ)s(i, t),

i E {0, 1} .

(2.23)

dt

 

 

Решениями уравнения (2.23), как легко убедиться пyтeм пoдcтaнoвoк, при начальных состояниях ЭВМ i = 0, i =1 соответственно будут функции:

91

2. Архитектура электронных вычислительных машин

 

S(O,t) _ ^+

µ

^+

µ e

;

(2.24)

S(1' t) __

µ

+ ^ +

µe--(x+µ)г

 

(2.25)

Полученные формулы (2.24), (2.25) позволяют оценить готовность

ЭВМ в переходном режиме функционирования. Если достаточно orpaничитьcя анализом стационарного режима работы ЭВМ, то вместо (2.24) и (2.25) можно использовать предельно пpocтyк формулу для коэффициента готовности ЭВМ:

s = urn s(i, t) = µ l(?, + µ),

(2.26)

в которой нет зависимости от начального состояния ЭВМ i Е Е. Уместно заметить, что ЭВМ «быстро» входят в стациов арный режим работы, поэтому на практике, как правило, следует использовать не функцию готовности, a коэффициент s (2 .26).

Замечание. На практике и в технической лип ературе довольно часто используется выражение типа «Hадежность ЭВМ равна 0, )99», однако это жаргонное вы-

рaжение, которое не имеет однозначного толкования. Под «надежностью» можно

понимать значения или функции надежности, или функции готовности ЭВМ для

некоторого времени, но чаще всего под «надежностью» понимают коэффициент

готовности машины.

2.8.5. Функция осуществимости решения задач на ЭВМ

Цель функционирования ЭВМ решение поступивших задач (выпoлнeниe программ решения задач). Однако в вeдeнныe показатели нaдeжнocти ЭВМ (2.10), (2.17), (2.19) устанавливают взаимосвязь лишь между пo-

тeнциaльнo возможной производительностью н надежностью машины (бeз-

oткaзнocтью, peмoнтoпpиroднocтью, готовностью), т. e. характеризуют качество функционирования ЭВМ безотносительно к процессу решения зa-

дaч. Этот пробел можно устранить, если иcпoпьзoвaть для характеристики

работы ЭВМ функцию ocyщecmвuмocmu peшeнs.iя задач f(t) = r(t)cp(t),

где r(t) вероятность безотказной работы ЭВМ (2.10); cp(t) = P{0 т

т. e. ф(t) — вероятность события {0 г < t}; r — случайная величина, яв-

ляющаяся моментом решения задачи на paбo rocпocoбнoй (абсолютно надежной) ЭВМ. B качестве закона распределения времени решения задач на

ЭВМ может быть взят экcпoнeнциaльный

92

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]