Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ZhIZNESTOJKOST_ATAKUEMYKh_RASPREDELENNYKh_SISTE...doc
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
27.24 Mб
Скачать

1.3 Обоснование закона распределения

При изучении процесса выживаемости применяются методы математической статистики. Случайная величина Т – генеральная совокупность.

Стандартный путь исследования генеральной совокупности – выборочный метод. Особенностью выборочного метода в анализе выживаемости является использование цензурированных данных.

Рассмотрим РАИС, которая состоит из 80 компонент, подробное описание которой представлено в Приложении 1. Отметим, что данная статистика была получена в результате имитационного моделирования РАИС с использованием специализированного программного продукта. Злоумышленник осуществляет атаку на них в случайном порядке. Наблюдение за тем или иным компонентом начинается с момента начала атаки и заканчивается в момент выхода из строя компонента либо по другим причинам (в частности атака на канал связи). Из 80 наблюдений 50 закончились выходом из строя компоненты системы (т.е. «смертью») по окончании срока, в 30 случаях атака не принесла ущерба компоненту, либо атака была проведена на канал связи и из-за этого информация о том, что стало с компонентом системы после этого отсутствует. Таким образом, всего из 80 наблюдений 50 являются полными и 30 – цензурированными. Соответствующие исходные данные занесем в таблицу 1.1.

В таблице 1.1 данные не упорядочены. В последнем столбце указан тип наблюдения: полное или цензурированное.Упорядочим данные наблюдения по продолжительности времени наблюдения и преобразованные данные занесем в таблицу 1.2.

Таблица 1.1. Исходные данные

Номер наблюдения

Время

Полные/Цензурир

Censored

Номер наблюдения

Время

Полные/Цензурир

Номер наблюдения

Время

Полные/Цензурир

Номер наблюдения

Время

Полные/Цензурир

1

41

П.

24

22

П.

47

14

Ц.

70

40

Ц.

2

32

П.

25

30

Ц.

48

6

П.

71

5

П.

3

26

П.

26

39

Ц.

49

3

П.

72

15

Ц.

4

15

П.

27

3

П.

50

39

П.

73

6

П.

5

6

П.

28

15

П.

51

32

П.

74

18

Ц.

6

1

П.

29

12

П.

52

8

Ц.

75

11

Ц.

7

32

П.

30

5

П.

53

10

П.

76

4

П.

8

10

П.

31

11

П.

54

5

П.

77

13

П.

9

22

П.

32

35

Ц.

55

9

П.

78

3

П.

10

41

П.

33

39

Ц.

56

2

П.

79

57

Ц.

11

23

П.

34

25

Ц.

57

24

П.

80

21

Ц.

12

19

Ц.

35

26

Ц.

58

32

Ц.

13

31

Ц.

36

16

П.

59

30

Ц.

14

20

П.

37

28

Ц.

60

28

Ц.

15

12

Ц.

38

6

П.

61

10

П.

16

3

П.

39

16

П.

62

16

П.

17

39

П.

40

10

П.

63

10

П.

18

45

П.

41

32

Ц.

64

5

П.

19

9

Ц.

42

22

Ц.

65

12

П.

20

12

Ц.

43

29

Ц.

66

9

П.

21

16

Ц.

44

35

П.

67

24

Ц.

22

22

Ц.

45

2

П.

68

13

Ц.

23

19

П.

46

17

П.

69

21

П.

Примечание:

П. – полные данные

Ц. – цензурированные данные

Таблица 1.2. Построение функции выживания

Номер наблюдения

Время наблюдения (день)

Количество наблюдаемых к моменту времени

Количество умерших в данный момент времени

Количество выбывших в данный момент времени

Доля умерших

Доля переживших момент

Функция выживания

ni

di

wi

di/ni

1- di/ni

6

1

80

1

-

0,0125

0,9875

0,9875

56, 45

2

79

2

-

0,0253

0,9747

0,9625

16, 27, 78

3

77

3

-

0,039

0,961

0,925

76

4

74

1

-

0,0135

0,9865

0,9125

30,54,64,71

5

73

4

-

0,0548

0,9452

0,8625

5,38,73

6

69

3

-

0,0435

0,9565

0,825

+52

8

-

-

1

-

-

-

55,66

9

65

2

-

0,031

0,969

0,799

+19

9

-

-

1

-

-

-

8,40,53,61,63

10

62

5

-

-

-

-

31

11

57

1

0,081

0,919

0,735

+75

11

-

-

1

-

-

-

65,29

12

55

2

-

0,036

0,964

0,708

+20,15

12

-

-

2

-

-

-

49,77

13

51

2

-

0,0392

0,9608

0,6805

+68

13

-

-

1

-

-

-

+47

14

-

-

1

-

-

-

4,28

15

47

2

-

0,043

0,957

0,651

+72

15

-

-

1

-

-

-

36,39,48,62

16

44

4

-

0,091

0,909

0,592

+21

16

-

-

1

-

-

-

46

17

39

1

-

0,026

0,974

0,577

+74

18

-

-

1

-

-

-

23

19

37

1

-

0,027

0,973

0,561

+12

19

-

-

1

-

-

-

14

20

35

1

-

0,0286

0,971

0,545

69

21

34

1

-

0,0294

0,97

0,494

+80

21

-

-

1

-

-

-

9,24,51

22

32

3

-

0,0938

0,906

0,447

+42,22

22

-

-

2

-

-

-

11

23

27

1

-

0,037

0,963

0,431

57

24

26

1

-

0,038

0,962

0,414

+67

24

-

-

1

-

-

-

+34

25

-

-

1

-

-

-

3

26

23

1

-

0,043

0,957

0,397

+35

26

-

-

1

-

-

-

+37,60

28

-

-

2

-

-

-

+43

29

-

-

1

-

-

-

+25,59

30

-

-

2

-

-

-

+13

31

-

-

1

-

-

-

2,7

32

15

2

-

0,133

0,867

0,344

+41,58

32

-

-

2

-

-

-

44

35

11

1

-

0,091

0,909

0,313

+32

35

-

-

1

-

-

-

17,50

39

9

2

-

0,222

0,778

0,243

+33,26

39

-

-

2

-

-

-

+70

40

-

-

1

-

-

-

1,10

41

4

2

-

0,5

0,5

0,122

18

45

2

1

-

0,5

0,5

0,0608

+79

57

-

-

1

-

-

-

Номера цензурированных наблюдений отмечены знаком «+». Остальные столбцы заполнены последовательно по продолжительности наблюдения, исходя из начальных данных в таблице 1.1.

Последний столбец, функция выживания , заполним в соответствии с формулой эмпирической функции выживания по методу Каплана-Майера

=0,9875

=

………………………………………

=0,0608

Все значения при постоянны на всем промежутке и равны .

Теперь построим кривую выживаемости. По оси абсцисс откладываем время наблюдения, а по оси ординат рассчитанные значения кумулятивной функции выживших. В результате получаем кривую выживаемости, которая представлена на рисунке 1.1.

0 5 10 15 20 25 30 35 40 45 50

Рисунок 1.1 - Кривая выживаемости

Как было сказано ранее, функция выживания связана с функцией распределения. Найдем функцию распределения, которой соответствует кривая (рис. 1.2).

0 5 10 15 20 25 30 35 40 45 50

Рисунок 1.2 – График функции распределения

Наиболее полная характеристика выживаемости - это кривая (рис. 1.2). Однако необходимо иметь и обобщенный показатель, характеризующий выживаемость в виде одного числа. Распределения по продолжительности жизни, как правило, асимметрично, поэтому лучше всего тут подходит медиана. Для выборки медиана выживаемости определяется как наименьшее время, для которого выживаемость меньше 0,5.

Чтобы определить медиану выживаемости, нужно построить кривую выживаемости и посмотреть, где она впервые опускается ниже 0,5. В графике (рис. 1.2) исследовании это произошло на 21 день.

Таким образом, по статистическим данным найдена эмпирическая функция выживания, т.е. оценка истинной (теоретической) функции выживания. Укажем точность этой оценки. По формуле Гринвуда [36] вычислим значения стандартной ошибки для каждого из значений :

и т.д.

Зная и соответствующие стандартные ошибки , находим [36] доверительные интервалы для В частности, при полагают , т.е. , в точке получаем

0,9875 – 1,96*0,0124<S( )< 0,9875 + 1,96*0,0124;

0,9632< S( )<1,0118.

Заметим, что правая доверительная граница 1,0118 вышло за предельно допустимое 1,00. Исходя из понятия вероятности (т.к. по определения функция S(t) – вероятность, следовательно, все ее возможные значения находятся в интервале [0;1]) подправим найденный доверительный интервал:

0,9632< S( )<1.

Причиной возникшего противоречия является распределение случайной величины Т, отличное от нормального распределения. При нормальном приближении, которое мы использовали, строя доверительный интервал, последний является симметричным, что не всегда оправдано в случае произвольного распределения. Указанный эффект может проявляться вблизи границ S(t), а также значений 0 и 1.

Значения стандартной ошибки с ростом времени возрастают, соответственно увеличивается и доверительный интервал. Данная тенденция вполне естественна, так как со временем уменьшается число наблюдений.

Принципиальное отличие методики для большого объёма данных – это разбиение всего временного промежутка наблюдений на равные интервалы. Каждый интервал содержит некоторое количество наблюдений, как полных, так и цензурированных, и весь процесс рассматривается не от одного события до другого (выхода из строя или выбывания), поинтервально. При этом число систем, изучаемых на данном интервале, считается равным разности , т.е. разности количества функционирующих систем к началу временного интервала ( ) и половины выбывших по внешним причинам на данном интервале ( - количество цензурированных наблюдений на i-м интервале).

Тогда относительные частоты , вычисленные как , при указанном подходе оказываются «подправленными» с явным учётом количества выбывших на рассматриваемом интервале:

В данном случае индекс i является номером интервала. Так как введённые интервалы не пересекаются и события, происходящие на них, можно считать независимыми, то функция работоспособности , как и ранее, на i-м интервале вычисляется следующим образом

Следовательно, эмпирическая функция работоспособности оказывается заданной в виде набора значений , где k – количество интервалов. Указанные значения неоднозначны, изменяются от опыта к опыту и являются выборочными значениями случайно величины. По этому набору значений можно подобрать подходящее вероятностное распределение.

Функция выживания

Оценка Каплана-Майера функции выживания, в источниках называемая также множительной оценкой, вычисляется по формуле [18]

где - количество наблюдений, моменты прекращения которых наблюдались с длительностью , i=1,2,…,K,

K – число моментов прекращения,

– количество наблюдений, незаконченных либо цензурированных к моменту , i=1,2,…,K, причем

где - количество наблюдений, цензурированных между моментами и .

Дисперсия оценки Каплана-Майера функции выживания вычисляется по формуле Гринвуда [36]

На хвосте распределения оценка по формуле Гринвуда может не существовать, поэтому в данном случае используется формула Пето [36]

Доверительные интервал оцениваемой функции выживания вычисляется по асимптотической формуле [36]

где (1+β) - обратная функция стандартного нормального распределения,

- доверительный уровень, выраженный в долях.

В случае малых выборок для вычисления доверительного интервала предлагается использовать уточненную формулу

Функция выживания изображается в виде ступенчатого графика.

Результаты вычислений (приложение 1) приведены в следующих таблицах, где:

Число наблюдений: 80;

Число цензурированных наблюдений: 30;

Число полных наблюдений: 50.

Таблица 1.3 – Функция выживания

Интервал

Вероятность

Стандарт

Нижний 95%

Верхний 95%

от 0 до 1

1

0

1

1

от 1 до 2

0,9875

0,012421629

0,963154058

1

от 2 до 3

0,9625

0,021240807

0,920868791

1

от 3 до 4

0,9125

0,03159188

0,850581065

0,974419

от 4 до 5

0,9

0,03354102

0,834260822

0,965739

от 5 до 6

0,85

0,039921799

0,771754727

0,928245

от 6 до 8

0,8

0,04472136

0,712347762

0,887652

от 8 до 9

0,8

0,04472136

0,712347762

0,887652

от 9 до 10

0,774603175

0,046768502

0,682938612

0,866268

от 10 до 11

0,71005291

0,051008188

0,610078717

0,810027

от 11 до 12

0,697142857

0,051688705

0,595834875

0,798451

от 12 до 13

0,67083558

0,052979862

0,566996977

0,774674

от 13 до 14

0,657145057

0,053638365

0,552015814

0,762274

от 14 до 15

0,657145057

0,053638365

0,552015814

0,762274

от 15 до 16

0,628573533

0,054979562

0,520815593

0,736331

от 16 до 17

0,584719566

0,056674668

0,473639279

0,6958

от 17 до 18

0,569726756

0,057170198

0,457675249

0,681778

от 18 до 19

0,569726756

0,057170198

0,457675249

0,681778

от 19 до 20

0,554328736

0,057661408

0,441314474

0,667343

от 20 до 21

0,538490772

0,058148393

0,424522038

0,65246

от 21 до 22

0,522652808

0,058555339

0,407886474

0,637419

от 22 до 23

0,489987008

0,059276572

0,373807082

0,606167

от 23 до 24

0,472487472

0,059686776

0,355503562

0,589471

от 24 до 25

0,454987936

0,059986666

0,337416252

0,57256

от 25 до 26

0,454987936

0,059986666

0,337416252

0,57256

от 26 до 28

0,436030105

0,06040865

0,317631348

0,554429

от 28 до 29

0,436030105

0,06040865

0,317631348

0,554429

от 29 до 30

0,436030105

0,06040865

0,317631348

0,554429

от 30 до 31

0,436030105

0,06040865

0,317631348

0,554429

от 31 до 32

0,436030105

0,06040865

0,317631348

0,554429

от 32 до 35

0,35427446

0,064956074

0,226962918

0,481586

от 35 до 39

0,322067691

0,066558215

0,191616011

0,452519

от 39 до 40

0,250497093

0,068351293

0,116531045

0,384463

от 40 до 41

0,250497093

0,068351293

0,116531045

0,384463

от 41 до 45

0,125248547

0,071342655

0

0,265078

от 45 до 57

0,062624273

0,056862496

0

0,174073

от 57 и выше

0,062624273

0,056862496

0

0,174073

Медиана

Нижний 95%

Верхний 95%

22

35

0

Функция выживания построена на рисунке 1.3.

Вероятность

1

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0

0 10 20 30 40 50

Срок

Рисунок 1.3 – Функция выживания

Функция риска

Оценка Каплана-Майера функции риска вычисляется по формуле [18]

где - количество наблюдений, моменты прекращения которых наблюдались с длительностью , i=1,2,…,K,

K – число моментов прекращения,

– количество наблюдений, незаконченных либо цензурированных к моменту , i=1,2,…,K, причем

где - количество наблюдений, цензурированных между моментами и .

Дисперсия оценки Каплана-Майера функции выживания вычисляется по формуле [36]

где - дисперсия функции выживания,

- оценка Каплана-Майера функции выживания.

Доверительный интервал оцениваемой функции риска вычисляется как [14]

где ((1+β)/2) - обратная функция стандартного нормального распределения,

- доверительный уровень, выраженный в долях.

Функция риска обычно изображается либо в виде ступенчатого графика либо в виде ломаной линии, соединяющей заданные точки, соответствующие моментам прекращения. В нашем случае был выбран второй из указанных типов.

Проведем вычисление функции риска по имеющейся статистике и построим ее график.

Таблица 1.4 – Фуёнкция риска

Срок

Риск

Стандарт

Нижний 95%

Верхний 95%

1

0,0125

0,012578865

0

0,037154118

2

0,037816456

0,022068371

0

0,081069659

3

0,089764508

0,034621238

0,02190814

0,157620875

4

0,103463138

0,0372678

0,030419606

0,176506669

5

0,159018693

0,046966822

0,066965431

0,251071955

6

0,217842223

0,055901699

0,108276926

0,32740752

8

0,217842223

0,055901699

0,108276926

0,32740752

9

0,249588254

0,06037737

0,131250807

0,367925702

10

0,332921588

0,071837165

0,192123358

0,473719818

11

0,351103406

0,074143635

0,205784579

0,496422233

12

0,388839255

0,078975928

0,234049309

0,543629201

13

0,409247418

0,081623326

0,24926867

0,569226167

14

0,409247418

0,081623326

0,24926867

0,569226167

15

0,452725679

0,087467191

0,281293166

0,624158192

16

0,522493121

0,096926238

0,332521221

0,712465021

17

0,548134147

0,100346696

0,351458273

0,744810021

18

0,548134147

0,100346696

0,351458273

0,744810021

19

0,575161174

0,104020239

0,371285289

0,779037059

20

0,603732602

0,10798401

0,392087872

0,815377333

21

0,633144367

0,112034869

0,413560099

0,852728635

22

0,695644367

0,120975804

0,458536191

0,932752543

23

0,731358653

0,126324568

0,483767094

0,978950211

24

0,76839569

0,131842323

0,509989534

1

25

0,76839569

0,131842323

0,509989534

1

26

0,810062356

0,138542384

0,538524324

1

28

0,810062356

0,138542384

0,538524324

1

29

0,810062356

0,138542384

0,538524324

1

30

0,810062356

0,138542384

0,538524324

1

31

0,810062356

0,138542384

0,538524324

1

32

0,997562356

0,183349582

0,638203846

1

35

1

0,206659087

0,594955708

1

39

1

0,272862621

0,46519919

1

40

1

0,272862621

0,46519919

1

41

1

0,569608646

0

1

45

1

0,907994499

0

1

57

1

0,907994499

0

1

По рассчитанным данным получаем график функции риска, изображенный на рисунке (1.3).

Риск

1

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0

1 11 21 31 41 51

Срок

Рисунок 1.3 – Функция риска

Получили ступенчатую кривую распределения, которая свидетельствует о случайном характере атаки на РАИС и о достаточно полной статистике, которая позволяет сделать вывод, что кривая соответствует логлогистическому закону распределения.

Осуществим выбор закона распределения между следующими типами подходящих по теоретически соображениям распределений, обычно[34] применяемыми для решения подобных задач:

  • логарифмическое,

  • логнормальное,

  • гамма-распределение,

  • распределение Вейбулла,

  • экспоненциальное распределение,

  • распределение Рэллея,

  • распределение Гомпертца,

  • логлогистическое.

Функция распределения (с точностью до параметров) может быть известна из теоретических соображений. В таком случае задача вычисления параметров распределений может трактоваться как идентификация математической модели. Параметрическая статистическая модель выживания описывается с помощью следующих функций [18]:

  • функция плотности вероятности распределения

  • кумулятивная или интегральная функция распределения – функция распределения длительностей до момента отказа t,

  • функция выживания – вероятность безотказной работы до момента t,

  • функция интенсивности отказов (функция риска) .

Под длительностью t может пониматься время работоспособности («жизни»), количество циклов до отказа и т.п., в зависимости от конкретной задачи.

Теоретические значения частот (непрерывных) распределений элементарно вычисляются как произведение плотности теоретического распределения на численность выборки и на длину соответствующего классового интервала.

Общая методика

Аппроксимация эмпирического распределения опытных данных любым теоретическим стандартным распределением сводится к вычислению одним из математических методов (метод максимального правдоподобия, метод моментов, реже – метод наименьших квадратов) параметров теоретического распределения, ответственных за форму, масштаб и положение кривой распределения. Метод максимального правдоподобия является наиболее популярным методом решения рассматриваемого типа задач благодаря хорошей вычислительной устойчивости.

Реализация метода начинается [18] с составления функции максимального правдоподобия (ФМП) в виде

где - вектор неизвестных параметров статистической модели,

- массив длительностей,

, - соответствующий массив индикаторов цензурирования (для конкретной длительности индикаторов равен 1, если выборка цензурирована),

n – численность массива длительностей.

Отметим, что в дальнейших выкладках число цензурированных длительностей стандартно обозначено как

Вектор искомых параметров находится из условия максимума ФМП:

Максимум ФМП находится из условия равенства нулю частных производных ФМП по искомым параметрам, т.е. искомые параметры удовлетворяют уравнениям

Для упрощения максимизируют не саму ФМП, а логарифм ФМП. Эта возможность основана на том факте, что ФМП и логарифм достигают максимума при одних и тех же значениях искомых параметров, однако работать с логарифмом ФМП значительно проще:

Задача сводится, таким образом, к аналитическому либо численному (одним из методов оптимизации) решению полученной линейной или нелинейной системы уравнений.

Логарифмические модели

Решение статистической модели может быть выполнено различными методами. Однако в любом случае стараются использовать наиболее эффективную модификацию общего метода, иногда позволяющую радикально упростить решение. Не конкретизируя тип модели, представим общий метод решения логарифмической двухпараметрической модели. ФМП логарифмической двухпараметрической модели общего вида имеет вид [48]

,

где массив логарифмов длительностей,

вектор параметров,

параметр положения,

параметр масштаба.

Логарифмическая ФМП может быть записана [48] как

где массив стандартизованных длительностей.

В дальнейших выкладках понадобятся следующие очевидные выражения для производных [36]

Тогда компоненты вектора градиента логарифмической ФМП параметрам [36]

Компоненты матрицы вторых производных логарифмической ФМП по параметрам (матрицы Гессе) вычисляются [36] как

С учетом введенных обозначений интерационная схема максимизации логарифмической ФМП алгоритма метода Ньютона-Рафсона может быть записана как

номер интерации.

При численной реализации метода Ньютона-Рафсона должна быть учтена особенность данного метода при решении рассматриваемой задачи, заключающаяся в весьма узкой области сходимости. Поэтому начальные приближения параметров должны быть заданы достаточно близкими к оптимальному решению. В этом случае метод сходится очень быстро. Для грубой же локализации начальных приближений может применяться один из глобальных методов. В простейшем случае можно применить метод перебора с небольшим шагом по разумной области определения параметров либо, для упрощения численной реализации, один из вариантов метода спуска. Низкое быстродействие данных примитивных, но надежных методов компенсируется высоким быстродействием современных компьютеров [45].

Логнормальное распределение

Плотность логнормального распределения (логарифмически нормального) распределения [13] с двумя параметрами имеет вид

Введем нормированную величину

Тогда можно записать

где φ(z) - функция плотности стандартного нормального распределения

Соответствующая функция выживания

где Ф(z) – функция стандартного нормального распределения.

С учетом нормировки функция максимального правдоподобия (ФМП) запишется как

Соответствующая логарифмическая ФМП имеет вид

Производные, необходимые для интерационной схемы метода Ньютона-Рафсона, запишутся как

Для моделирования обычно используется связь с нормальным распределением. Поэтому, достаточно сгенерировать нормально распределённую случайную величину, но в случае анализа выживаемости не всегда удается сгенерировать нормально распределённую случайную величину и вычислить ее экспоненту.

Гамма-распределение

Плотность гамма-распределение имеет вид [36]

Соответствующая функция выживания

где I(k,t/a) – неполная гамма-функция.

Поэтому функция максимального правдоподобия (ФМП) запишется как

Соответствующая логарифмичеcкая ФМП имеет вид

Неприменимость данного распределения для анализа выживаемости заключается в том, что аналитическое представление производных логарифмической ФМП выполнить сложно, поэтому задача решается численно одним из вариантов метода спуска, не использующим производных.

Распределение Вейбулла

Плотность распределение Вейбулла с двумя параметрами имеет вид [36]

Соответствующая функция выживания

Поэтому функция максимального правдоподобия (ФМП) запишется как

После преобразований окончательно получаем

Соответствующая логарифмическая ФМП имеет вид

Логарифмическая ФМП примет окончательный вид

Для вычисления значений искомых параметров найдем частные производные логарифмической ФМП по искомым параметрам и приравняем к нулю. Сначала найдем производную по :

Отсюда уравнение для вычисления параметра получается как

Вычислив производную по параметру ,

с учетом выражения для параметра , получаем нелинейное уравнение для поиска параметра методом деления отрезка пополам.

Логика параметрических моделей выживаемости заключается в том, что они принимают особую форму для распределения риска. В распределение Вейбулла функция риска монотонна, что может не соответствовать статистике и как следствие искажать рассматриваемую модель.

Экпоненциальное распределение

Плотность экспоненциального распределения имеет вид [36]

Поэтому функция максимального правдоподобия (ФМП) запишется как

После преобразований окончательно получаем

Соответствующая логарифмическая ФМП имеет вид

Для вычисления значения искомого параметра найдем производную логарифмической ФМП по данному параметру и приравняем ее к нулю. Производную по параметру имеет вид:

Отсюда уравнение для вычисления параметра получается как

Также как и распределения Вейбулла, экспоненциальное распределение определяет особую форму для риска, то есть зависимость от времени. В показательном распределении функция риска плоская, что также может противоречить статистике.

Распределение Рэллея

Плотность распределения Рэлея имеет вид [36]

Соответствующая функция выживания

Поэтому функция максимального правдоподобия запишется как

После преобразований окончательно получаем

Соответствующая логарифмическая ФМП имеет вид

Для вычисления значения искомого параметра найдем производную логарифмической ФМП по данному параметру и приравняем ее к нулю. Производная по параметру имеет вид:

Уравнение для вычисления параметра получается как

В основном используется для решения задач сложения гармонических колебаний со спиральными фазами.

Распределение Гомпертца

Плотность распределения Гомпертца имеет вид [36]

Соответствующая функция выживания

Поэтому максимальная функция правдоподобия запишется как

После преобразований получаем

Соответствующая логарифмическая ФМП имеет вид

lnL

Для вычислений значений искомых параметров найдем частные производные логарифмической ФМП по искомым параметрам и приравняем их нулю. Сначала найдем производную по :

Отсюда уравнение для вычисления параметра получается как

Вычислив производную по параметру , получаем

С учетом выражения для параметра , получаем нелинейное уравнение для поиска параметра в виде:

Решение уравнения может быть произведено одним из методов оптимизации – в простейшем случае методом деления отрезка пополам.

Логлогистическое распределение

Плотность логлогистического распределения (логарифмически логистического) распределения с двумя параметрами имеет вид [36]

Введем нормированную величину

Тогда можно записать

Соответствующая функция выживания

С учетом нормировки функция максимального правдоподобия (ФМП) запишется как

Соответствующая логарифмическая ФМП имеет вид

Производные, необходимые для итерационной метода Ньютона-Рафсона [13,14], запишутся как

Как было сказано ранее, значения частот (непрерывных) распределений элементарно вычисляются как произведение плотности теоретического распределения на численность выборки и на длину соответствующего классового интервала. Сделаем подбор распределения длительностей (рис 1.4).

Логнормальное распределение ( 3,007209, 1,152719);

Гамма-распределение ( , K=1,2401);

Распределение Вейбулла

0,0166,

1,213193);

Экспоненциальное распределение 0,032765;

Распределение Рэлея (бета) 20,35534

Распределение Гомпертца ( -0,10566, 0,0882);

Логлогистическое распределение

( 3,032074, 0,666967).

Таблица 1.5 – Выбор распределения

Класс

Опыт

Логнормаль-

ное

Гамма

Вейбулл

Экспоненц

Рэлей

Гомпертц

Логлогисти-

ческое

5

17

15,83

14,85

15,32

13,70

16,38

7,66

16,36

13

24

10,54

11,90

12,65

10,54

19,05

2,92

11,42

21

14

7,27

9,18

9,85

8,11

16,24

1,19

7,77

29

14

5,22

6,95

7,39

6,24

10,95

0,50

5,40

37

7

3,87

5,20

5,41

4,80

6,04

0,21

3,87

45

3

2,95

3,86

3,87

3,69

2,76

0,09

2,86

53

1

14,51

11,61

10,09

15,94

21,33

347,09

11,10

Хи-квт

0,01

0,02

0,04

0,01

0,00

0,00

0,06

P-знач

66,13

64,35

63,86

63,21

61,01

91,02

61,07

AIC

15,83

14,85

15,32

13,70

16,38

7,66

16,36

Частоты

30

25

20

15

10

5

0


0 10 20 30 40 50 60

Классы,*масштаб

Рисунок 1.4 - Подбор распределения

Достаточно важным вопросом является соответствие результатов расчета объективными критериями согласия для каждого распределения. Адекватной является модель с Р – значением, большим 0,05. В этом случае теоретическое и эмпирическое распределения значимо не различаются. Качество статистической модели можно оценить (также сравнить между собой различные модели), используя информационный критерий Акаике [36]

где - оценка логарифма функции максимального правдоподобия,

- вектор оценок параметров статистической модели,

K – число параметров модели.

Последний член в уравнении для AIC призван скорректировать значение статистики критерия для малых выборок и иногда не используется. Оценка логарифма функции максимального правдоподобия в рассматриваемом случае имеет теоретический вид [18]

где , - эмпирический массив длительности,

, – соответствующий массив индикаторов цензурирования,

n – численность массива длительностей,

f (ti, ) - оценка функции плотности вероятности распределения,

- оценка соответствующей функции выживания.

При расчете здесь нет необходимости в явном выписывании упомянутых функций, т.к. формулы для логарифмов функций максимального правдоподобия всех изучаемых теоретических распределений известны из ранее рассмотренного материала. При сравнении нескольких статистических моделей лучшей считается модель с наименьшим значением AIC [36].

Исходя из описаний всех видов распределений можно увидеть, что у каждого распределения есть недостатки, по причине которых их использование в риск-анализе будет не эффективно, либо не возможно (низкое быстродействие примитивных методов расчетов, сложность выполнения аналитического представления производных логарифмической ФМП). Адекватной является модель с Р – значением, большим 0,05. В этом случае теоретическое и эмпирическое распределения значимо не различаются. Качество статистической модели можно оценить (также сравнить между собой различные модели), используя информационный критерий Акаике. При сравнении нескольких статистических моделей лучшей считается модель с наименьшим значением AIC. Из рассчитанных параметров (таблица 1.6) видно, что самое подходящее распределение – логлогистическое, так как у него Р – значение = 0,055512, что больше 0,05 и AIC=61,07089, наименьший из представленных. В соответствие с построенным подбором распределений (рисунок 1.7), можно сделать предположение о том что, наиболее подходящим распределением является именно логлогистическое.

Для проверки соответствия эмпирического ряда распределения заданному теоретическому закону так же возможно использовать один из наиболее мощных и универсальных статистических критериев проверки вида распределения - критерий χ2, также получивший название критерия согласия Пирсона. Он основан на сравнении эмпирических частот интервалов группировки с теоретическими частотами, которые можно ожидать при принятии определенной нулевой гипотезы.

Порядок применения критерия χ 2 заключается в следующем:

  1. Формируется гипотеза Н0: (х) = теор(х) – плотность распределения (х) генеральной совокупности, из которой взята выборка, соответствует теоретической модели теор(х). Альтернативная гипотезы Н1: (х) теор(х). Выбирается уровень значимости .

  2. Получается выборка объема n 40 независимых наблюдений и представляется эмпирическое распределение в виде интервального вариационного ряда.

  3. Рассчитываются выборочные характеристики всех параметров, входящих в теоретическое распределение (если такие имеются). Их используют в качестве генеральных параметров этих характеристик, с которым предстоит сравнивать эмпирическое распределение.

  4. Вычисляются значения теоретических частот niT попадания в i-й интервал группировки (без округления).

Если окажется, что вычисленные теоретические частоты niT некоторых интервалов группировки меньше 3, то соседние интервалы объединяются так, чтобы сумма их теоретических частот была больше или равна 3. Соответственно складываются и эмпирические частоты объединяемых интервалов.

  1. Значения χ2–критерия рассчитываются по формуле [18]:

,

где ni –эмпирические частоты; niT= piTn– теоретические частоты,

piT=  – теоретические вероятности попадания в интервал группировки [a;b],

n – объем выборки;

k – число интервалов группировки после объединения.

  1. Определяем по таблице обратного распределения χ2 критическое значение χкр2(, ) для числа степеней свободы  = kр-1 и заданного уровня значимости ,

где р – число параметров теоретического распределения, оцениваемые по выборке.

  1. Если χнабл2χкр2, то выдвинутая гипотеза о соответствии эмпирического распределения теоретическому принимается, в противном случае - отвергается с вероятностью ошибки .

В качестве эмпирических данных возьмем данные из таблицы 1.6.

Построим группированный статистический ряд (таблица 1.6).

Сделаем разбиение данных на интервалы равной длины. Для этого воспользуемся следующей формулой:

где N – количество интервалов разбиения;

n – количество наблюдений.

Определим шаг разбиения ∆:

Таблица 1.6 - Группированный статистический ряд

Интервал

[0:0,13)

[0,13:0,26)

[0,26:0,39)

[0,39:0,52)

[0,52:0,65)

[0,65:0,78)

[0,78:0,91)

[0,91:1)

0,07

0,2

0,33

0,46

0,59

0,72

0,85

0,98

3

2

3

7

7

7

9

7

0,066

0,044

0,066

0,155

0,155

0,155

0,2

0,155

3

5

8

15

22

29

38

45

0,066

0,11

0,176

0,331

0,486

0,641

0,841

1

На основе полученного группированного статистического ряда построим гистограмму относительных частот (рисунок.1.5).

0,25

0,20

0,15

0,10

0,05

0

0,07 0,2 0,33 0,46 0,59 0,72 0,85 0,98

Рисунок 1.5 - Гистограмма относительных частот

На основе полученных значений вероятностей построим графики функций эмпирического распределения и плотностей вероятностей. Для его построения на оси ущерба для каждого интервала будем откладывать по одной точке, являющей средним его значением.

Гипотеза H0 – генеральная совокупность параметров выживаемости компонентов РАИС представляет собой логлогистическое распределение

,

где

и вероятностью ошибочного отклонения нулевой гипотезы (уровень значимости): α = 0,05.

Для имеющейся статистики построим группированный вариационный ряд (таблица 1.7).

Таблица 1.7. Группированный вариационный ряд

Интервал

Частота ni

Теоретическая вероятность

[0:0,13)

3

0,016

2,22

[0,13:0,26)

2

0,0467

0,005

[0,26:0,39)

3

0,0687

0,003

[0,39:0,52)

7

0,081

1,09

[0,52:0,65)

7

0,084

1,74

[0,65:0,78)

7

0,081

1,83

[0,78:0,91)

9

0,075

1,39

[0,91:1)

7

0,05

3,12

Видно, что расчетное значение χнабл2=11,40. По таблице обратного распределения (квантилей) Хи-квадрат на уровне значимости =0,05 и со степенями свободы =8-1-1=6, находим χкр2=12,591. Из неравенства χнабл2χкр2 выдвинутая гипотеза о соответствии эмпирического распределения логлогистическому на уровне значимости =0,05 принимается.

В результате рассмотрения основных законов распределения, используемых для модели анализа выживаемости, установлено, что логлогистическое распределение является наиболее подходящим распределением для описания плотности вероятности «гибели» систем и их компонентов.

В первой главе также были рассмотрены основные особенности модели анализа выживаемости, которая позволяет учитывать, как полные, так и цензурированные данные при исследовании и является одной из наиболее эффективных методов анализа работоспособности систем. На основе анализа данной модели и применения этой модели для РАИС можно сделать вывод, что существующие понятия риска «гибели» в этой теории надежности отражают лишь вероятностный характер наступления события и никоим образом не учитывают величину ущерба, что недопустимо при риск-анализе.