Скачиваний:
35
Добавлен:
23.04.2022
Размер:
4.96 Mб
Скачать

где F(x) – интегральная функция распределения (рис. 1.1), определяющая вероятность того, что случайная величина примет значения, не превосходящие хi.

Ее задание и определяет закон распределения случайной величины Х. В общем случае функция распределения F(x) может быть как разрывной, так и непрерывной. Конкретные виды функции распределения для некоторых важных распределений будут рассмотрены ниже.

В большинстве практически важных случаев распределение недискретных случайных величин может быть задано в другой форме с помощью введения функции плотности вероятностей f(x).

F(x)

1

F(x2)

F(x1)

0

x1

x2

x

Рис. 1.1.

Интегральная функция распределения

Характерной особенностью случайной величины является то, что заранее не известно, какое из значений она примет. Возможность принятия случайной величиной Х значения из элементарного интервала (х1, х2) количественно оценивается вероятностью

P(x1<X x2) =f(x)dx ,

(1.1)

где P(x1 < X x2) – вероятность указанного события

(x1 < X x2);

f (х) плотность распределения случайной величины; x2= x1+dх. Плотность f(х) является важнейшей характеристикой, задаю-

щей распределение случайной величины. Плотность удовлетворяет двум условиям: она неотрицательна и интеграл от нее в полных пределах изменения аргумента х равен единице:

21

 

f (x)0; f (x) dx =1.

(1.2)

−∞

Как видно из формулы (1.1), функция распределения F(х) выражается через плотность f(х):

x

 

F(x) = f (x)dx .

(1.3)

−∞

Сдругой стороны, если плотность f(х) непрерывна в точке х, то

еезначение в этой точке равно производной от функции F(х):

(1.4)

f (x)= F (x).

При этом предположении функция распределения F(x) будет являться первообразной для плотности f(x). Поэтому

x2

P(x1 < x < x2 )= f (x) dx = F(x)= F(x2 )F(x1 ).

x1

f(x) называют также дифференциальной функцией распределения.

Из свойств плотности f(x) и определения функции F(x) следует, что последняя – неотрицательна, не убывает и равна 0 и 1 при значении аргумента – и :

F(х)0; F(х1 ) F(х2) при x1 > х2; F(– )=0; F( )=1.

График плотности распределения f(x) называется кривой рас-

пределения случайной величины. Исходя из геометрической интер-

претации интеграла как площади соответствующей криволинейной трапеции, заключаем, что для произвольного – < х0 < число F(x0) равно площади под кривой распределения, лежащей левее прямой х0. АналогичноинтерпретируетсявероятностьP(x1<xx2) (рис. 1.2).

Случайная величина X, для которой существует плотность распределения f(x), называется непрерывной.

Если под случайной величиной X понимать продолжительность безотказной работы объекта, то произведение f(х)dх есть вероятность отказа объекта в интервале времени (х1, х2). Значение функции распределения F(х) равно вероятности отказа объекта до момента х. В теории надежности часто употребляют такое понятие, как вероятность безотказной работы Р(х), которое является дополнительным понятием к функции распределения F(x).

22

y

y=f(x)

F(x0)

P(x1<x<x2)

 

x0

0

x1

x2

x

 

Рис. 1.2. Плотность распределения случайной величины

Значение вероятности безотказной работы в точке х равно вероятности того, что случайная величина X превысит х, т. е. изделие будет работать безотказно в течение времени x:

Р(х) = 1– F(х) = P{X > х}.

Р(x), F(x)

1,0

0,5

 

 

F(x)

Р(x)

 

 

 

 

 

 

 

 

 

 

0

x

Рис. 1.3. Графики функции распределения F(x) и функции надежности P(x)

23

Функция Р(х) называется также функцией надежности. Примерные графики функции распределения F(х) и функции надежности Р(х) изображены на рис. 1.3.

На практике часто располагают дополнительной информацией о том, что случайная величина превысила некоторое значение х (в частности, это изделие проработало время x и не отказало).

Разумеется, эта информация изменяет возможность принятия случайной величиной тех или иных значений. В связи с этим вводят специальную функцию интенсивность отказов λ(x). Значение

интенсивности отказов в точке х, умноженное на dх, равно вероятности принятия случайной величиной значения из элементарного интервала (х1, х2) при условии, что эта случайная величина X больше х:

λ (х)dx = P{x < X x + dx|X > x},

где символ «|» означает «при условии, что…».

В нашем контексте λ(х)dх есть вероятность отказа изделия сразу после момента времени х, если оно до этого не отказало.

1.2. Меры положения и рассеяния кривой распределения

Кривая распределения плотностей вероятностей случайной величины характеризуется своим положением на оси абсцисс и рассеиванием случайной величины. Для оценки положения и рассеяния кривой распределения вводятся соответствующие критерии или

меры.

Кмерам положения относятся: мода, математическое ожида-

ние и медиана случайной величины.

Кмерам рассеяния относятся: стандартное отклонение, дисперсия и размах.

Функция распределения плотности вероятностей может иметь одно или несколько максимальных значений в разных местах области (рис. 1.4). Значение случайной величины X, при котором f(x) принимает максимальное (наиболее вероятное) значение в окрестности какого-либо значения случайной величины х, называется мо-

дой распределения (Mо).

24

Математическим ожиданием случайной величины называется сумма произведений всех возможных значений случайной величины на вероятности этих значений:

 

 

 

n

 

 

 

 

Mx = xi Pi.

 

(1.5)

 

 

 

i=1

 

 

f (x)

 

f (x)

 

 

f (x)

x

x

x

 

 

 

 

 

а

 

 

б

 

в

Рис. 1.4. Кривые распределения случайной величины X: а – одномодальная; б – двухмодальная; в – антимодальная

Это определение справедливо для дискретных случайных величин. Для непрерывных величин математическое ожидание случайной величины X, имеющей плотность распределения f(х), вычисляется по формуле

+∞

 

Mx = x f (x) dx.

(1.6)

−∞

Статистической оценкой математического ожидания является среднее арифметическое значение случайной величины

 

1

n

 

x =

xi mi .

(1.7)

 

 

N i=1

 

Математическое ожидание (среднее арифметическое значение) случайной величины называют часто центром рассеяния или центром группирования случайной величины. Математическое ожидание является оценкой истинного значения измеряемой величины.

25

Медианой случайной величины (Ме) называется значение, для которого

Р(х < Ме) = Р(х > Ме),

т. е. вероятность появления случайной величины, меньшей, чем медиана, или большей, чем медиана, одинакова (рис. 1.5).

Геометрическая медиана – это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам:

Ме

f (x)dx =

−∞

В случае симметричного одномодульного распределения медиана совпадает с математическим ожиданием и модой, т. е.

Ме = Мх = Мо.

f (x)dx.

Ме

f (x)

Ввиду того, что величина

 

 

 

Х является случайной, факти-

 

 

 

 

Ме

x

ческие значения ее будут ле-

 

 

 

 

 

 

жать как правее, так и левее

 

 

 

Рис. 1.5. Геометрическая медиана

среднего значения.

 

 

 

Мерой рассеяния случайной величины Х около ее среднего

значения x служит

стандартное

(или среднее

квадратическое)

отклонение σ:

 

 

 

 

 

 

 

 

 

 

 

1

n

2

 

 

 

 

σ =

 

(xi Mx ) .

(1.8)

 

 

 

 

 

 

 

N i=1

 

 

 

Для непрерывной случайной величины σ определяется по фор-

муле

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 n

 

2

+∞

 

σ =

 

(xi M x )

f (x)dx.

(1.9)

 

 

 

N i=1

 

 

−∞

 

26

Когда оценка стандартного отклонения осуществляется на основе статистических данных, ее называют выборочным средним квадратическим отклонением, обозначают буквой S и определяют по формуле

n (xi x )2

S = i=1

N 1

.

(1.10)

 

 

 

С целью экономии времени и уменьшения ошибок при подсчетах S, когда n велико, а хi – большие или нецелые числа, следует использовать тождество

n

2

n

2

 

1

n

2

 

(xi x)

= xi

 

xi .

(1.10')

 

i=1

 

i=1

 

 

N i=1

 

 

Другая мера рассеяния – дисперсия (дисперсия и означает рассеивание) характеризует разброс значений случайной величины относительно ее математического ожидания. Дисперсия увеличивается с увеличением рассеяния результатов наблюдения.

Дисперсия определяется по формуле

n

 

 

Дx = σ2 = (xi M x )2 Pi ,

 

(1.11)

i=1

 

 

где хi дискретная случайная величина, и по формуле

 

+∞

 

 

Дx = M (x M x )2 = (xi M x )2 f

(x)dx,

(1.11')

−∞

где хi – непрерывная случайная величина.

Дисперсия эмпирических данных вычисляется по формуле

n

(x

x)2

 

 

Дх =

i

 

.

(1.12)

N – 1

i=1

 

 

Дисперсия обладает следующими свойствами:

Дх 0;

Дх ·С = 0 для С = const (дисперсия неслучайной величины рав-

на нулю);

27

Д (СХ) = С2·Дх неслучайную величину можно выносить за знак дисперсии, возведя ее в квадрат;

Дх = Мx(X 2) – (Мх)2 – дисперсия равна математическому ожиданию квадрата случайной величины минус квадрат ее математического ожидания;

Д(Х+Y) = Дх + Дy, если Х и Y – независимые случайные вели-

чины.

Последнее свойство рассмотрим более подробно на примере двух случайных величин X и Y. По определению

Д(X +Y )= M [(X +Y )M (X +Y )]2 .

После раскрытия квадратных скобок и объединения каждой случайной величины со своим математическим ожиданием получим

Д( Х +Y ) = M (X M x )2 + M (Y M y )2 + 2M [(X M x )(Y M y )],

откуда

Д( Х +Y ) = Дх + Ду + 2cov(XY ),

где cov(XY) = M [(X – Mх)(Y – My)] = M (XY ) – МхМy.

Величину, определяемую формулой (1.13), называют ковариацией. Она характеризует связь между случайными величинами X и Y. Для независимых случайных величин ковариация равна нулю. Ковариация является неудобной характеристикой, т. к. по ее величине трудно судить о степени (тесноте) связи. Поэтому была введена другая величина – коэффициент корреляции, вычисляемый по формуле

ρ(XY )= cov(XY ) .

(1.13)

ДxДy

 

Коэффициент корреляции меняется в пределах от –1 до +1 и является характеристикой тесноты линейной связи между двумя случайными величинами. Если Y и Х независимы, то ρ(XY )= 0 . Ес-

ли абсолютное значение ρ(ХY) окажется больше 1, то совершенно ясно, что произошла ошибка и необходимо пересчитать результат. В случае сильной положительной корреляции достигается значение,

28

близкое к +1, а при сильной отрицательной корреляции достигается значение, близкое к –1. Таким образом, когда |ρ(ХY)| близок к 1, это указывает на сильную корреляцию между X и Y, а когда |ρ(ХY)| близок к 0 – на слабую корреляцию.

Переходя от случайных величин X и Y к их значениям x и y, коэффициент корреляции по результатам статистических испытаний можно вычислить по формуле

 

ρ(xy)=

 

cov(xy)

,

 

 

 

 

 

(1.13')

 

 

 

 

 

 

 

 

 

 

 

 

 

ДxxДyy

 

 

 

 

 

 

 

n

 

n

1

 

 

n

 

2

 

где

Дxx = (xi x)2 = xi2

 

 

xi2 ;

 

 

 

 

 

 

 

i=1

 

i=1

 

N i =1

 

 

 

 

n

 

n

1

 

n

2

 

 

Дyy = (yi y)2 = yi2

 

yi2 ;

 

 

 

N

 

 

i =1

 

i =1

i =1

 

 

 

 

 

 

 

 

 

 

 

 

n

 

n

 

 

n

 

n

 

 

 

xi

yi

 

ρ(xy)= (xi x)(yi y)

= xi yi

i=1

i=1

;

 

i=1

 

i=1

 

 

 

 

 

 

n

 

 

n – число пар данных.

Пример1.2. Найтикоэффициент корреляцииподанным табл. 1.1.

Решение. Используя данные, приведенные в табл. 1.1, определяем дисперсии и коэффициент корреляции:

Дхх = 2312,02 – 263,22/30 = 2,88; Дyy = 23,97833 – 26,8162/30 = =0,00840;

cov(xy) = 235,3570 – (263,2·26,816)/30 = 0,0913; ρ(xy) = = 0,0913/ 2,88 0,0084 = 0,59.

Значение ρ(xy) оказалось равным 0,59, следовательно, существует некоторая положительная корреляция между x и y.

29

 

 

 

 

 

 

 

 

 

Таблица 1.1

 

 

 

Экспериментальные данные

 

 

 

 

 

 

и результаты расчета случайных величин X и Y

 

x

 

y

 

x2

 

y2

 

xy

 

 

 

 

 

 

 

 

8,6

 

0,889

 

73,96

 

0,79032

 

7,6454

 

 

8,9

 

0,884

 

79,21

 

0,78146

 

7,8676

 

 

8,8

 

0,874

 

77,44

 

0,76388

 

7,6912

 

 

8,8

 

0,891

 

77,44

 

0,79388

 

7,8408

 

 

8,4

 

0,874

 

70,56

 

0,76388

 

7,3416

 

 

8,7

 

0,886

 

75,69

 

0,78500

 

7,7082

 

 

9,2

 

0,911

 

84,64

 

0,82992

 

8,3812

 

 

8,6

 

0,912

 

73,96

 

0,83174

 

7,8432

 

 

9,2

 

0,895

 

84,64

 

0,80102

 

8,2340

 

 

8,7

 

0,896

 

75,69

 

0,80282

 

7,7952

 

 

8,4

 

0,894

 

70,56

 

0,79924

 

7,5096

 

 

8,2

 

0,864

 

84,64

 

0,74650

 

7,0848

 

 

9,2

 

0,922

 

75,69

 

0,85008

 

8,4824

 

 

8,7

 

0,909

 

70,56

 

0,82628

 

7,9083

 

 

9,4

 

0,905

 

67,24

 

0,81902

 

8,5070

 

 

8,7

 

0,892

 

84,64

 

0,79566

 

7,7604

 

 

8,5

 

0,877

 

75,69

 

0,66913

 

7,4545

 

 

9,2

 

0,885

 

88,36

 

0,78322

 

8,1420

 

 

8,5

 

0,866

 

75,69

 

0,74996

 

7,3610

 

 

8,3

 

0,896

 

72,25

 

0,80282

 

7,4368

 

 

8,7

 

0,896

 

68,89

 

0,80282

 

7,7952

 

 

9,3

 

0,928

 

75,69

 

0,86118

 

8,6304

 

 

8,9

 

0,886

 

86,49

 

0,78500

 

7,8854

 

 

8,9

 

0,908

 

79,21

 

0,82446

 

8,0812

 

 

8,3

 

0,881

 

68,89

 

0,77616

 

7,3123

 

 

8,7

 

0,882

 

75,69

 

0,77792

 

7,6734

 

 

8,9

 

0,904

 

79,21

 

0,81722

 

8,0456

 

 

8,7

 

0,912

 

75,69

 

0,83174

 

7,9344

 

 

9,1

 

0,925

 

82,81

 

0,85562

 

8,4175

 

 

8,7

 

0,872

 

75,69

 

0,76038

 

7,5864

 

 

263,2

 

26,816

 

2312,02

 

23,97833

 

235,3570

 

Размах случайной величины R определяется как разность между наибольшим и наименьшим значениями случайной величины:

R = xmax xmin .

(1.14)

30