Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Математическая статистика в технологии машиностроения

..pdf
Скачиваний:
24
Добавлен:
15.11.2022
Размер:
8.19 Mб
Скачать
Рис. 1. График распределения дискрет­ ной случайной величины

вероятности можно определить ожидаемую частость этого события при N испытаниях, когда они еще не произведены. Закон боль­ ших чисел играет важную роль в статистических исследованиях и составляет принципиальную основу применения статистических методов к изучению закономерностей массовых явлений.

4. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ИХ РАСПРЕДЕЛЕНИЕ

Случайные величины подразделяются на дискретные и непре­ рывные.

Дискретными случайными величинами называются такие, которые в результате испытаний могут принимать лишь отдельные, изолированные, большей ча­ стью целочисленные значе­ ния, и не могут принимать значения, промежуточные ме­ жду ними. Например, коли­ чество негодных деталей в партии может быть только целым положительным чис­ лом 1,2, 3 и т. д., но не может быть 1,5; 1,7 и т. п.

Следовательно, количество негодных деталей есть слу­ чайная величина дискретного типа.

Непрерывной случайной величиной называется такая, которая в результате испытаний

может принимать любые численные значения из непрерывного ряда их возможных значений в границах определенного интер­ вала. Например, действительные размеры деталей, обработанных на станке, являются случайными величинами непрерывного типа, так как они могут принять любое численное значение в опреде­ ленных границах.

Возможности случайных величин принимать при испытаниях те или иные численные значения оцениваются при помощи вероят­ ностей. Совокупность значений случайных величин, расположен­ ных в возрастающем порядке с указанием их вероятностей, назы­ вается распределением случайных величин. Различают теоретические и эмпирические распределения случайных величин. В теоретиче­ ских распределениях оценка возможных значений случайной вели­ чины производится при помощи вероятностей, а в эмпирических — при помощи частот или частостей, полученных в результате опытов или испытаний. Следовательно, эмпирическим распределением случайной величины называется совокупность наблюденных зна­ чений ее, расположенных в возрастающем порядке, с указанием соответствующих частот или частотей.

= 1
Е&-
= 100
Е т*=
20—20,05
20,05—20,10
20,10—20,15
20,15—20,20
20,20—20,25
20,25—20,30
20,30—20,35
2
10
24
30
22
10
2
0,02
0,10
0,24
0,30
0,22
0,10
0,02

Распределения случайных величин дискретного типа можно представить в виде табл. 1 и 2 или графика (рис. 1), составленного на основании табл. 2. Если случайная величина является непре­ рывной, то возникает затруднение представить ее распределение

Таблица 1

Теоретическое распределение дискретной случайной величины

х :

*1

* 2

* 3

* 4

р(х)

Р(хl )

р ы

р(хз)

P W

Хп

 

Р (хп)

Е р (xi) = 1

 

1

 

 

 

 

 

 

 

 

Таблица 2

 

Эмпирическое распределение дискретной случайной величины

X

0

1

2

3

4

5

 

 

тх

1

5

10

10

5

1

5

 

2

1

32

32

32

32

32

32

 

i= 0

 

в видедаблицы или графика, даже если значения случайной вели­ чины лежат в весьма узком интервале. При практическом наблю­ дении за непрерывными случайными величинами мы сталкива­

емся с рядом затруднений вследствие

ограниченной

точности

измерительных

приборов. Поэтому

на

практике

при

изучении

 

 

 

 

случайных

величин

непрерыв­

 

 

 

Таблица 3

ного типа полученные значения

Эмпирическое

распределение

их

разбивают

на

интервалы

случайной величины непрерывного типа

или разряды с таким расчетом,

Интервалы

Частота fi

Частость

чтобы

величина

разряда

была

несколько

больше цены

деле­

значений х

т1

 

 

 

ния

шкалы

измерительного ин­

струмента и таким образом ком­ пенсировалась бы погрешность измерений. Затем подсчитывают частоты не по действительным значениям случайной величины, а по разрядам, т. е. имеют дело не с частотами наблюденных значений случайной величины непрерывного типа, а с часто­ тами значений их, лежащих в границах установленного раз-

ряда или интервала. Поэтому таблица эмпирического распре­ деления случайной величины непрерывного типа будет иметь следующий вид (табл. 3).

Эмпирическое распределение случайной величины непрерыв­ ного типа (см. табл. 3) может быть представлено в виде ступенча­ того графика или в виде ломаной кривой (рис. 2). Ступенчатый график называется гистограммой распределения, а ломаная кри­ вая — полигоном распределения или эмпирической кривой распре­ деления.

При теоретических описаниях и изучениях случайных величин непрерывного типа затруднительно производить разбивку их на

разряды. Поэтому во избежание

 

этих затруднений вводится по­

 

нятие функции

распределения.

 

Пусть X — случайная вели­

 

чина,

а

х — какое-либо

дей­

 

ствительное число:

при

этом

 

X <С х

и

этому событию отве­

 

чает

вероятность

Р (X < х),

 

которая,

очевидно,

является

 

функцией

х, т. е.

 

 

 

P ( X < x )

= F (х);

 

 

F (х) называется функцией

 

распределения

вероятностей

Рис. 2. График распределения непре­

случайной величины

или инте­

рывной случайной величины

гральной

функцией

распреде­

 

ления.

Таким

образом,

интегральная функция распределения

определяет вероятность того, что случайная величина X при испытаниях примет значение меньше произвольно изменяемого действительного числа х (—оо < х < + о о ). Случайная величина считается заданной, если известна ее функция распределения.

Для дискретной случайной величины интегральная функция распределения F (х) легко определяется по таблице или графику распределения. Например, по графику (см. рис. I) F (х) для любого значения х равна сумме вероятностей тех значений X, которые лежат влево от точки х. В частности для X <С 3:

Р (X < 3) = Р {х= 0) + Р (х = \) + Р (х= 2) =

 

_ _ 1 _ . _ 5 . J 0 __

 

 

 

— 32

32 " г 32

32 '

 

 

Интегральную

функцию

распределения

можно

представить

в виде графика,

если по оси абсцисс откладывать

значения х,

а по оси ординат — значения F (х) =

Р (X <

х). Для дискретной

случайной величины график интегральной функции распределе­ ния будет иметь вид ступенчатой кривой. Для распределения со­ гласно табл. 2 этот график будет иметь вид, изображенный на

рис. 3. Ординаты кривой для любого значения х будут представ­ лять сумму вероятностей предшествующих значений, т. е.

F(x) = P ( X < х).

Если известны F (хх) и F (х2), т. е. ординаты интегральной кри­ вой для двух произвольных точек, взятых на оси абсцисс, то изве­ стны и вероятности событий, заключающихся в том, что значения случайной величины X при испытаниях окажутся меньше, чем

хх или х2, так как

F(x)

F (хх) = Р ( Х < х,)-,

V/32

 

26/32

24/32

18/зг

16/32

8/32 8/32

Узг

0

1

2

3

4

5

Рис. 3. График интегральной функ­ ции распределения дискретной слу­ чайной величины

F (х2) = Р ( Х < х2).

Зная эти вероятности, можно вычислить и вероятность того, что при испытаниях случайная вели­ чина окажется в границах от хх до х2 (включая хх и исключая х2), т. е.

Р (хх < X < х2).

Очевидно, что событие Х < х 2 распадается на два частных события:

X < Хх И Хх < X < х2.

На основании правила сложения вероятностей

Р (X < х2) = Р (X < хх) + Р (хх ^ X < х2).

Откуда

 

 

Р (хх ^

X < х2) = Р (X < х 2) -

Р (X <

хх) = F (х2) - Р(хх).

Таким

образом, вероятность

того, что

случайная величина

при испытаниях окажется в границах от хх до х 2, равна прираще­ нию интегральной функции распределения на этом участке.

Для непрерывной случайной величины график интегральной функции распределения будет иметь вид не ступенчатой, а моно­ тонно возрастающей кривой, имеющей касательную к каждой

точке (рис. 4).

 

Ах.

Возьмем на оси абсцисс две произвольные точки х 0 и х 0 +

Ординаты функции в этих точках будут

F (х0) и F (х0 +

Ах).

По аналогии с предыдущим

 

 

р (Х 0 < х < х0 + Ах) = F (х0 +

Ах) — F (х0).

(1)

Интегральная функция распределения непрерывной случай­ ной величины является дифференцируемой функцией. Первая производная от интегральной функции называется дифференциаль­ ной функцией распределения, или плотностью вероятности.

14

Будем обозначать ее через ср (х). Исходя из определения производ­ ной, можно, написать

Ф(х) = F' (х) = lim F(xo±JW ~ F(*o)

или, учитывая равенство (1),

Ах—>О

 

Ф(х) = lim Р(*о^Х<*о + &*)

(2)

 

 

Ал:—>0.

Таким образом, плотность вероятности ср (х) есть предел отно­ шения вероятности того, что случайная величина X при испы-

Рис. 4.

График интегральной

Рис.

5. Кривая дифференциальной функ­

функции

распределения непре­

ции

распределения непрерывной случай­

рывной случайной величины

 

ной величины

таниях

примет значение, лежащее в границах от х 0 до х 0 + Ах

к величине интервала Ах, когда величина Ах стремится к нулю.

F (х) является первообразной функцией по отношению к ср (х), поэтому вероятность того, что случайная величина X при испыта­ ниях примет значение, лежащее в границах от а до 6, равна опре­ деленному интегралу в пределах от а до Ь от плотности вероят­

ности:

ъ

ъ

Р (а ^ Х < 6) = F (Ь) F (а) = J Fr(х) dx =

J ср (х) dx.

а

а

Дифференциальную функцию распределения непрерывной слу­ чайной величины, можно выразить в виде кривой, имеющей ту или иную форму. Например, при выполнении определенных усло­ вий дифференциальная функция распределения ф (х) непрерывной случайной величины может иметь вид холмообразной кривой (рис. 5). В данном случае вероятность

Р (a «s; X < b) = Jьф(х) dx

а

будет представлять площадь криволинейной трапеции с основанием ab, ограниченной сверху дифференциальной кривой распределе­

ния. Это следует из геометрической интерпретации определенного интеграла. Очевидно, что если случайная величина ^изменяется в пределах ±оо, то вероятность того, что она при испытании при­ мет любое значение в интервале ±сю, равна 1, т. е.

 

+00

Р (— оо < X < + оо) = F (оо) — F (— оо)

Ф (х) dx = 1.

5. ХАРАКТЕРИСТИКИ РАСПРЕДЕЛЕНИЙ СЛУЧАЙНЫХ ВЕЛИЧИН

Для изучения распределений случайных величин в математи­ ческой статистике пользуются рядом числовых характеристик, определяющих положение центра группирования случайной вели­ чины и ее рассеивание около этого центра. Числовые характерис­ тики положения центра группирования носят общее название мер положения, а числовые характеристики рассеивания — мер рассеивания.

В качестве мер положения используются математическое ожи­ дание, среднее арифметическое значение, медиана и мода, в каче­ стве мер рассеивания— дисперсия, среднее квадратическое откло­ нение и размах.

Математическим ожиданием дискретной случайной величины х называется сумма произведений возможных значений ее на соот­ ветствующие вероятности. Математическое ожидание обозначается символом Мх:

M x— YiXiP{Xi),

(3)

i=i

 

где п — число возможных значений случайной величины х. Например, случайная величина имеет следующее распределе­

ние:

xi

0

1

2

3

з

р(хд

 

 

 

 

0,2

0,3

0,4

0,1 £ p ( x f) = l .

 

 

 

 

 

о

Математическое ожидание Мх равно М х= 0-0,2+ 1 -0,3 + 2-0,4 + 3-0,1 = 1,4.

Математическим ожиданием непрерывной случайной величины называется определенный интеграл от произведения плотности

вероятности ф (х) на действительное переменное х, взятый в пре­ делах от —оо до +оо:

+ СО

 

М х= J хф (x)dx.

(4)

Средним арифметическим значением случайной величины назы­ вается сумма произведений наблюденных значений случайной

величины иа их частости. Среднее арифметическое значение слу­ чайной величины х обозначается символом X:

_

,

 

х

= - ~ Ъ х ,и ,

(5)

 

п

1=1

 

где ft — частота значений лу

 

 

п — общее число наблюденных значений х( I я =

2

 

 

 

/=1

т — число отдельных значений xt.

Для непрерывных случайных величин в качестве xt принимают середину интервалов, на которые разбивается наблюденный ряд значений х.

Пример 3. Дано следующее распределение дискретной случайной величины:

xi Л

2 3

4 5

 

 

fi : 2 4 2 1 1 2 ^ = 1 0 .

 

Определить X :

 

 

 

 

 

X = -2 . ( 1.2 +

2-4 +

3-2 + 4-1 +

5- 1) = 2,5.

 

Пример 4. Непрерывная случайная величина имеет следующее распределение:

Определить X:

 

 

Интервалы

Середина

Частота

Х = -2-(4-1 + 8 - 4 +

12-4 +

значений х

интервала х^

 

+ 16-1)= 10.

 

 

2—6

4

1

Математическое ожидание

6—10

8

4

10—14

12

4

обычно используется в каче­

14—18

16

1

стве меры положения для тео­

 

 

 

ретических распределений, в

 

 

2 и = 10

которых возможные

значе­

 

 

 

 

 

ния х оцениваются при помощи вероятностей. В эмпирических рас­ пределениях, где наблюденные значения х оцениваются при помощи частот или частостей, в качестве меры положения исполь­

зуется среднее арифметическое X .

Основные свойства математических ожиданий. Математиче­ ские ожидания, а также и средние арифметические значения обла­ дают рядом свойств, которые выражены в теоремах о математиче­ ском ожидании. Приведем эти теоремы без доказательств.

1.Математическое ожидание постоянной С есть сама эта по­

стоянная:

Мс = с.

2. Математическое ожидание произведения постоянной вели­ чины С на случайную величину х равно произведению постоянной на математическое ожидание случайной величины

Мех =: СМх.

3. Математическое ожидание суммы нескольких случайных величин равно сумме математических ожиданий этих величин

M'EiXt = TiMxi.

4. Математическое ожидание суммы постоянной и случайной величин равно сумме постоянной величины и математического ожи­ дания случайной величины

М(с + х) = С + Мх.

5.Математическое ожидание произведения независимых слу­ чайных величин равно произведению их математических ожида­

 

 

 

ний:

 

 

 

 

 

 

 

 

 

Мху = Мх-Му.

 

 

 

 

Медианой непрерывной случай­

 

 

 

ной

величины

 

называется такое

 

 

 

ее значение, для которой функция

 

 

 

распределения

равна

Это озна­

 

 

 

чает, что

вероятность

случайной

Рис. 6.

Геометрическая интерпре­

величины

х

принять

значение,

меньшее медианы, в точности рав­

тация

медианы

непрерывной слу­

 

чайной

величины

на

вероятности

этой

величины

ны. Медиана

 

принять значение, большее медиа­

обозначается символом Me и для

непрерывной слу­

чайной величины определяется из соотношения

 

 

 

Ме

со

 

 

 

 

 

 

 

J Ф (л;)dx = J ф(х) dx.

 

 

(6)

 

 

—оо

Ме

 

 

 

 

 

Геометрически медиана является абсциссой такой точки кри­ вой плотности вероятности ф (*), ордината которой делит площадь под кривой на две равновеликие части (рис. 6).

Если случайная величина х дискретного типа, то для определе­ ния медианы значения х располагают в порядке возрастания их величин (х1Ух 2, х3у. ., хту. ., хп) и в качестве медианы прини­ мают такое срединное значение х между xm_i и хт , чтобы удовлет­ ворялось условие

т—1

п

s р(хд=

mp(xt).

i=l

i=m

Аналогичным образом определяется и эмпирическое значение медианы. Например, со станка взято 5 деталей с размерами: 20, 10; 20,05; 19,98; 20,08; 20,03. Расположим полученные размеры в по­ рядке возрастания: 19,98; 20,03; 20,05; 20,08; 20,10. При нечет­ ном числе данных берут в качестве медианы число, занимающее

п + 1

срединное положение, т. е. —^— по порядку, в данном примере

18

при п — 5 третье: Me = 20,05. Если число данных п четное, то в качестве медианы берут среднее арифметическое из двух членов, занимающих срединное положение. Например, при п = 4

Me = *г+ - 3- = ?0'Q3-t- 20'05 = 20,04.

Модой Мо называется такое значение случайной величины х, которое имеет наибольшую вероятность р (х) для распределения дискретной случайной вели­ чины или наибольшую плот­ ность вероятности ср (х) для распределения непрерывной случайной величины. Если кривая распределения имеет два или несколько одинако­ вых максимумов, то она на­ зывается соответственно двух-

модальной или многомодаль­ ной (рис. 7). Если максимумы резко выражены, но различны по величине, то кривая на­ зывается многовершинной

(рис. 8). Если в центральной части кривой распределения имеется минимум, по обе стороны от которого происходит непрерывное возрастание кривой до границ области значений случайной вели­ чины, то такая кривая называется антимодальной (рис. 9).

Рис. 8. Двухвершинная кривая распреде­

Рис. 9. Антимодальная кривая

ления

распределения

Все перечисленные характеристики (Мх, X, Me, Мо) опреде­ ляют положение центра группирования случайных величин в дан­ ном распределении. Около этого центра сосредоточивается наи­ большее количество значений изучаемой величины. По мере уда­ ления от центра группирования (влево и вправо) число значений случайной величины убывает. Между перечисленными характе­ ристиками положения центра группирования нет определенных соотношений. Это ясно без всяких пояснений в отношении Мх,

Me и Mo. Что касается Мх и X , то по своему существу они равно­ ценны и область применения их была указана выше.

При симметричных одномодальных распределениях значения всех характеристик положения центра группирования (М х, Me, Мо\ равны между собой (рис. 10). Размерности всех перечисленных характеристик совпадают с размерностью случайной величины.

Меры рассеивания. Для характеристики распределения слу­ чайной величины недостаточно знать только положение центра группирования, так как оно не характеризует разброса или рас­ сеивания различных значений случайной величины около центра.

 

Необходима числовая характе­

 

ристика,

показывающая,

на­

 

сколько

тесно

сгруппированы

 

возможные значения случайной

 

величины

около центра

груп­

 

пирования.

Такая

характери­

 

стика называется мерой рассей-

 

вания.

В

технике

наиболее

 

употребительными

мерами рас­

 

сеивания

являются: дисперсия,

 

обозначаемая

символами

D x,

 

а2 или s2, среднее

квадратичес­

 

кое отклонение,

обозначаемое

Рис. 10. Симметричное одномодальное

через символы а или 5, и раз­

мах, обозначаемой символом R.

распределение непрерывной случайной

величины

Дисперсией

дискретной слу­

 

чайной

величины

 

называется

сумма произведений квадратов отклонений случайной величины х от ее математического ожидания на соответствующие вероятности:

DX = Y I (*i Р (*/)•

(7)

i=1

 

Для непрерывной случайной величины дисперсия определяется

по формуле

 

Dx = J ср (ж) Мх)2 dx.

(8)

—се

 

Для эмпирического распределения дисперсию обозначают через о2 или s2 и определяют ее как сумму произведений квадратов от­ клонений наблюденных значений случайной величины от ее средне­

арифметического значения X на соответствующие частости (-^-): при п > 30

°2 = -1г?> (х1-Х)2П\ П 1=1

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]