Математическая статистика в технологии машиностроения
..pdfвероятности можно определить ожидаемую частость этого события при N испытаниях, когда они еще не произведены. Закон боль ших чисел играет важную роль в статистических исследованиях и составляет принципиальную основу применения статистических методов к изучению закономерностей массовых явлений.
4. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ИХ РАСПРЕДЕЛЕНИЕ
Случайные величины подразделяются на дискретные и непре рывные.
Дискретными случайными величинами называются такие, которые в результате испытаний могут принимать лишь отдельные, изолированные, большей ча стью целочисленные значе ния, и не могут принимать значения, промежуточные ме жду ними. Например, коли чество негодных деталей в партии может быть только целым положительным чис лом 1,2, 3 и т. д., но не может быть 1,5; 1,7 и т. п.
Следовательно, количество негодных деталей есть слу чайная величина дискретного типа.
Непрерывной случайной величиной называется такая, которая в результате испытаний
может принимать любые численные значения из непрерывного ряда их возможных значений в границах определенного интер вала. Например, действительные размеры деталей, обработанных на станке, являются случайными величинами непрерывного типа, так как они могут принять любое численное значение в опреде ленных границах.
Возможности случайных величин принимать при испытаниях те или иные численные значения оцениваются при помощи вероят ностей. Совокупность значений случайных величин, расположен ных в возрастающем порядке с указанием их вероятностей, назы вается распределением случайных величин. Различают теоретические и эмпирические распределения случайных величин. В теоретиче ских распределениях оценка возможных значений случайной вели чины производится при помощи вероятностей, а в эмпирических — при помощи частот или частостей, полученных в результате опытов или испытаний. Следовательно, эмпирическим распределением случайной величины называется совокупность наблюденных зна чений ее, расположенных в возрастающем порядке, с указанием соответствующих частот или частотей.
Распределения случайных величин дискретного типа можно представить в виде табл. 1 и 2 или графика (рис. 1), составленного на основании табл. 2. Если случайная величина является непре рывной, то возникает затруднение представить ее распределение
Таблица 1
Теоретическое распределение дискретной случайной величины
х : |
*1 |
* 2 |
* 3 |
* 4 |
р(х) |
Р(хl ) |
р ы |
р(хз) |
P W |
Хп |
|
Р (хп) |
Е р (xi) = 1 |
|
1 |
|
|
|
|
|
|
|
|
Таблица 2 |
|
|
Эмпирическое распределение дискретной случайной величины |
||||||||
X |
0 |
1 |
2 |
3 |
4 |
5 |
|
|
|
тх |
1 |
5 |
10 |
10 |
5 |
1 |
5 |
|
|
2 |
— 1 |
||||||||
32 |
32 |
32 |
32 |
32 |
32 |
||||
|
i= 0 |
|
в видедаблицы или графика, даже если значения случайной вели чины лежат в весьма узком интервале. При практическом наблю дении за непрерывными случайными величинами мы сталкива
емся с рядом затруднений вследствие |
ограниченной |
точности |
|||||||||
измерительных |
приборов. Поэтому |
на |
практике |
при |
изучении |
||||||
|
|
|
|
случайных |
величин |
непрерыв |
|||||
|
|
|
Таблица 3 |
ного типа полученные значения |
|||||||
Эмпирическое |
распределение |
их |
разбивают |
на |
интервалы |
||||||
случайной величины непрерывного типа |
или разряды с таким расчетом, |
||||||||||
Интервалы |
Частота fi |
Частость |
чтобы |
величина |
разряда |
была |
|||||
несколько |
больше цены |
деле |
|||||||||
значений х |
т1 |
||||||||||
|
|
|
ния |
шкалы |
измерительного ин |
струмента и таким образом ком пенсировалась бы погрешность измерений. Затем подсчитывают частоты не по действительным значениям случайной величины, а по разрядам, т. е. имеют дело не с частотами наблюденных значений случайной величины непрерывного типа, а с часто тами значений их, лежащих в границах установленного раз-
ряда или интервала. Поэтому таблица эмпирического распре деления случайной величины непрерывного типа будет иметь следующий вид (табл. 3).
Эмпирическое распределение случайной величины непрерыв ного типа (см. табл. 3) может быть представлено в виде ступенча того графика или в виде ломаной кривой (рис. 2). Ступенчатый график называется гистограммой распределения, а ломаная кри вая — полигоном распределения или эмпирической кривой распре деления.
При теоретических описаниях и изучениях случайных величин непрерывного типа затруднительно производить разбивку их на
разряды. Поэтому во избежание |
|
|||||
этих затруднений вводится по |
|
|||||
нятие функции |
распределения. |
|
||||
Пусть X — случайная вели |
|
|||||
чина, |
а |
х — какое-либо |
дей |
|
||
ствительное число: |
при |
этом |
|
|||
X <С х |
и |
этому событию отве |
|
|||
чает |
вероятность |
Р (X < х), |
|
|||
которая, |
очевидно, |
является |
|
|||
функцией |
х, т. е. |
|
|
|
||
P ( X < x ) |
= F (х); |
|
|
|||
F (х) называется функцией |
|
|||||
распределения |
вероятностей |
Рис. 2. График распределения непре |
||||
случайной величины |
или инте |
рывной случайной величины |
||||
гральной |
функцией |
распреде |
|
|||
ления. |
Таким |
образом, |
интегральная функция распределения |
определяет вероятность того, что случайная величина X при испытаниях примет значение меньше произвольно изменяемого действительного числа х (—оо < х < + о о ). Случайная величина считается заданной, если известна ее функция распределения.
Для дискретной случайной величины интегральная функция распределения F (х) легко определяется по таблице или графику распределения. Например, по графику (см. рис. I) F (х) для любого значения х равна сумме вероятностей тех значений X, которые лежат влево от точки х. В частности для X <С 3:
Р (X < 3) = Р {х= 0) + Р (х = \) + Р (х= 2) =
|
_ _ 1 _ . _ 5 . J 0 __ |
|
|
||
|
— 32 |
32 " г 32 |
32 ' |
|
|
Интегральную |
функцию |
распределения |
можно |
представить |
|
в виде графика, |
если по оси абсцисс откладывать |
значения х, |
|||
а по оси ординат — значения F (х) = |
Р (X < |
х). Для дискретной |
случайной величины график интегральной функции распределе ния будет иметь вид ступенчатой кривой. Для распределения со гласно табл. 2 этот график будет иметь вид, изображенный на
рис. 3. Ординаты кривой для любого значения х будут представ лять сумму вероятностей предшествующих значений, т. е.
F(x) = P ( X < х).
Если известны F (хх) и F (х2), т. е. ординаты интегральной кри вой для двух произвольных точек, взятых на оси абсцисс, то изве стны и вероятности событий, заключающихся в том, что значения случайной величины X при испытаниях окажутся меньше, чем
хх или х2, так как
F(x) |
F (хх) = Р ( Х < х,)-, |
V/32 |
|
|
26/32 |
24/32
18/зг
16/32
8/32 8/32
Узг
0 |
1 |
2 |
3 |
4 |
5 |
6х |
Рис. 3. График интегральной функ ции распределения дискретной слу чайной величины
F (х2) = Р ( Х < х2).
Зная эти вероятности, можно вычислить и вероятность того, что при испытаниях случайная вели чина окажется в границах от хх до х2 (включая хх и исключая х2), т. е.
Р (хх < X < х2).
Очевидно, что событие Х < х 2 распадается на два частных события:
X < Хх И Хх < X < х2.
На основании правила сложения вероятностей
Р (X < х2) = Р (X < хх) + Р (хх ^ X < х2).
Откуда |
|
|
|
Р (хх ^ |
X < х2) = Р (X < х 2) - |
Р (X < |
хх) = F (х2) - Р(хх). |
Таким |
образом, вероятность |
того, что |
случайная величина |
при испытаниях окажется в границах от хх до х 2, равна прираще нию интегральной функции распределения на этом участке.
Для непрерывной случайной величины график интегральной функции распределения будет иметь вид не ступенчатой, а моно тонно возрастающей кривой, имеющей касательную к каждой
точке (рис. 4). |
|
Ах. |
Возьмем на оси абсцисс две произвольные точки х 0 и х 0 + |
||
Ординаты функции в этих точках будут |
F (х0) и F (х0 + |
Ах). |
По аналогии с предыдущим |
|
|
р (Х 0 < х < х0 + Ах) = F (х0 + |
Ах) — F (х0). |
(1) |
Интегральная функция распределения непрерывной случай ной величины является дифференцируемой функцией. Первая производная от интегральной функции называется дифференциаль ной функцией распределения, или плотностью вероятности.
14
Будем обозначать ее через ср (х). Исходя из определения производ ной, можно, написать
Ф(х) = F' (х) = lim F(xo±JW ~ F(*o)
или, учитывая равенство (1), |
Ах—>О |
|
|
Ф(х) = lim Р(*о^Х<*о + &*) |
(2) |
|
|
|
Ал:—>0. |
Таким образом, плотность вероятности ср (х) есть предел отно шения вероятности того, что случайная величина X при испы-
Рис. 4. |
График интегральной |
Рис. |
5. Кривая дифференциальной функ |
функции |
распределения непре |
ции |
распределения непрерывной случай |
рывной случайной величины |
|
ной величины |
|
таниях |
примет значение, лежащее в границах от х 0 до х 0 + Ах |
||
к величине интервала Ах, когда величина Ах стремится к нулю. |
F (х) является первообразной функцией по отношению к ср (х), поэтому вероятность того, что случайная величина X при испыта ниях примет значение, лежащее в границах от а до 6, равна опре деленному интегралу в пределах от а до Ь от плотности вероят
ности: |
ъ |
ъ |
|
Р (а ^ Х < 6) = F (Ь) — F (а) = J Fr(х) dx = |
J ср (х) dx. |
а |
а |
Дифференциальную функцию распределения непрерывной слу чайной величины, можно выразить в виде кривой, имеющей ту или иную форму. Например, при выполнении определенных усло вий дифференциальная функция распределения ф (х) непрерывной случайной величины может иметь вид холмообразной кривой (рис. 5). В данном случае вероятность
Р (a «s; X < b) = Jьф(х) dx
а
будет представлять площадь криволинейной трапеции с основанием ab, ограниченной сверху дифференциальной кривой распределе
ния. Это следует из геометрической интерпретации определенного интеграла. Очевидно, что если случайная величина ^изменяется в пределах ±оо, то вероятность того, что она при испытании при мет любое значение в интервале ±сю, равна 1, т. е.
|
+00 |
Р (— оо < X < + оо) = F (оо) — F (— оо) |
Ф (х) dx = 1. |
5. ХАРАКТЕРИСТИКИ РАСПРЕДЕЛЕНИЙ СЛУЧАЙНЫХ ВЕЛИЧИН
Для изучения распределений случайных величин в математи ческой статистике пользуются рядом числовых характеристик, определяющих положение центра группирования случайной вели чины и ее рассеивание около этого центра. Числовые характерис тики положения центра группирования носят общее название мер положения, а числовые характеристики рассеивания — мер рассеивания.
В качестве мер положения используются математическое ожи дание, среднее арифметическое значение, медиана и мода, в каче стве мер рассеивания— дисперсия, среднее квадратическое откло нение и размах.
Математическим ожиданием дискретной случайной величины х называется сумма произведений возможных значений ее на соот ветствующие вероятности. Математическое ожидание обозначается символом Мх:
M x— YiXiP{Xi), |
(3) |
i=i |
|
где п — число возможных значений случайной величины х. Например, случайная величина имеет следующее распределе
ние:
xi |
0 |
1 |
2 |
3 |
з |
р(хд |
|
|
|
|
|
0,2 |
0,3 |
0,4 |
0,1 £ p ( x f) = l . |
||
|
|
|
|
|
о |
Математическое ожидание Мх равно М х= 0-0,2+ 1 -0,3 + 2-0,4 + 3-0,1 = 1,4.
Математическим ожиданием непрерывной случайной величины называется определенный интеграл от произведения плотности
вероятности ф (х) на действительное переменное х, взятый в пре делах от —оо до +оо:
+ СО |
|
М х= J хф (x)dx. |
(4) |
Средним арифметическим значением случайной величины назы вается сумма произведений наблюденных значений случайной
величины иа их частости. Среднее арифметическое значение слу чайной величины х обозначается символом X:
_ |
, |
'« |
|
х |
= - ~ Ъ х ,и , |
(5) |
|
|
п |
1=1 |
|
где ft — частота значений лу |
|
|
|
п — общее число наблюденных значений х( I я = |
2 |
||
|
|
|
/=1 |
т — число отдельных значений xt.
Для непрерывных случайных величин в качестве xt принимают середину интервалов, на которые разбивается наблюденный ряд значений х.
Пример 3. Дано следующее распределение дискретной случайной величины:
xi Л |
2 3 |
4 5 |
|
|
||
fi : 2 4 2 1 1 2 ^ = 1 0 . |
|
|||||
Определить X : |
|
|
|
|
|
|
X = -2 . ( 1.2 + |
2-4 + |
3-2 + 4-1 + |
5- 1) = 2,5. |
|
||
Пример 4. Непрерывная случайная величина имеет следующее распределение: |
||||||
Определить X: |
|
|
Интервалы |
Середина |
Частота |
|
Х = -2-(4-1 + 8 - 4 + |
12-4 + |
|||||
значений х |
интервала х^ |
|
||||
+ 16-1)= 10. |
|
|
2—6 |
4 |
1 |
|
Математическое ожидание |
6—10 |
8 |
4 |
|||
10—14 |
12 |
4 |
||||
обычно используется в каче |
14—18 |
16 |
1 |
|||
стве меры положения для тео |
|
|
|
|||
ретических распределений, в |
|
|
2 и = 10 |
|||
которых возможные |
значе |
|
|
|||
|
|
|
ния х оцениваются при помощи вероятностей. В эмпирических рас пределениях, где наблюденные значения х оцениваются при помощи частот или частостей, в качестве меры положения исполь
зуется среднее арифметическое X .
Основные свойства математических ожиданий. Математиче ские ожидания, а также и средние арифметические значения обла дают рядом свойств, которые выражены в теоремах о математиче ском ожидании. Приведем эти теоремы без доказательств.
1.Математическое ожидание постоянной С есть сама эта по
стоянная:
Мс = с.
2. Математическое ожидание произведения постоянной вели чины С на случайную величину х равно произведению постоянной на математическое ожидание случайной величины
Мех =: СМх.
3. Математическое ожидание суммы нескольких случайных величин равно сумме математических ожиданий этих величин
M'EiXt = TiMxi.
4. Математическое ожидание суммы постоянной и случайной величин равно сумме постоянной величины и математического ожи дания случайной величины
М(с + х) = С + Мх.
5.Математическое ожидание произведения независимых слу чайных величин равно произведению их математических ожида
|
|
|
ний: |
|
|
|
|
|
|
|
|
|
|
Мху = Мх-Му. |
|
||||
|
|
|
Медианой непрерывной случай |
||||||
|
|
|
ной |
величины |
|
называется такое |
|||
|
|
|
ее значение, для которой функция |
||||||
|
|
|
распределения |
равна |
Это озна |
||||
|
|
|
чает, что |
вероятность |
случайной |
||||
Рис. 6. |
Геометрическая интерпре |
величины |
х |
принять |
значение, |
||||
меньшее медианы, в точности рав |
|||||||||
тация |
медианы |
непрерывной слу |
|||||||
|
чайной |
величины |
на |
вероятности |
этой |
величины |
|||
ны. Медиана |
|
принять значение, большее медиа |
|||||||
обозначается символом Me и для |
непрерывной слу |
||||||||
чайной величины определяется из соотношения |
|
||||||||
|
|
Ме |
со |
|
|
|
|
|
|
|
|
J Ф (л;)dx = J ф(х) dx. |
|
|
(6) |
||||
|
|
—оо |
Ме |
|
|
|
|
|
Геометрически медиана является абсциссой такой точки кри вой плотности вероятности ф (*), ордината которой делит площадь под кривой на две равновеликие части (рис. 6).
Если случайная величина х дискретного типа, то для определе ния медианы значения х располагают в порядке возрастания их величин (х1Ух 2, х3у. ., хту. ., хп) и в качестве медианы прини мают такое срединное значение х между xm_i и хт , чтобы удовлет ворялось условие
т—1 |
п |
s р(хд= |
mp(xt). |
i=l |
i=m |
Аналогичным образом определяется и эмпирическое значение медианы. Например, со станка взято 5 деталей с размерами: 20, 10; 20,05; 19,98; 20,08; 20,03. Расположим полученные размеры в по рядке возрастания: 19,98; 20,03; 20,05; 20,08; 20,10. При нечет ном числе данных берут в качестве медианы число, занимающее
п + 1
срединное положение, т. е. —^— по порядку, в данном примере
18
при п — 5 третье: Me = 20,05. Если число данных п четное, то в качестве медианы берут среднее арифметическое из двух членов, занимающих срединное положение. Например, при п = 4
Me = *г+ - 3- = ?0'Q3-t- 20'05 = 20,04.
Модой Мо называется такое значение случайной величины х, которое имеет наибольшую вероятность р (х) для распределения дискретной случайной вели чины или наибольшую плот ность вероятности ср (х) для распределения непрерывной случайной величины. Если кривая распределения имеет два или несколько одинако вых максимумов, то она на зывается соответственно двух-
модальной или многомодаль ной (рис. 7). Если максимумы резко выражены, но различны по величине, то кривая на зывается многовершинной
(рис. 8). Если в центральной части кривой распределения имеется минимум, по обе стороны от которого происходит непрерывное возрастание кривой до границ области значений случайной вели чины, то такая кривая называется антимодальной (рис. 9).
Рис. 8. Двухвершинная кривая распреде |
Рис. 9. Антимодальная кривая |
ления |
распределения |
Все перечисленные характеристики (Мх, X, Me, Мо) опреде ляют положение центра группирования случайных величин в дан ном распределении. Около этого центра сосредоточивается наи большее количество значений изучаемой величины. По мере уда ления от центра группирования (влево и вправо) число значений случайной величины убывает. Между перечисленными характе ристиками положения центра группирования нет определенных соотношений. Это ясно без всяких пояснений в отношении Мх,
Me и Mo. Что касается Мх и X , то по своему существу они равно ценны и область применения их была указана выше.
При симметричных одномодальных распределениях значения всех характеристик положения центра группирования (М х, Me, Мо\ равны между собой (рис. 10). Размерности всех перечисленных характеристик совпадают с размерностью случайной величины.
Меры рассеивания. Для характеристики распределения слу чайной величины недостаточно знать только положение центра группирования, так как оно не характеризует разброса или рас сеивания различных значений случайной величины около центра.
|
Необходима числовая характе |
|||||||
|
ристика, |
показывающая, |
на |
|||||
|
сколько |
тесно |
сгруппированы |
|||||
|
возможные значения случайной |
|||||||
|
величины |
около центра |
груп |
|||||
|
пирования. |
Такая |
характери |
|||||
|
стика называется мерой рассей- |
|||||||
|
вания. |
В |
технике |
наиболее |
||||
|
употребительными |
мерами рас |
||||||
|
сеивания |
являются: дисперсия, |
||||||
|
обозначаемая |
символами |
D x, |
|||||
|
а2 или s2, среднее |
квадратичес |
||||||
|
кое отклонение, |
обозначаемое |
||||||
Рис. 10. Симметричное одномодальное |
через символы а или 5, и раз |
|||||||
мах, обозначаемой символом R. |
||||||||
распределение непрерывной случайной |
||||||||
величины |
Дисперсией |
дискретной слу |
||||||
|
чайной |
величины |
|
называется |
сумма произведений квадратов отклонений случайной величины х от ее математического ожидания на соответствующие вероятности:
DX = Y I (*i — Р (*/)• |
(7) |
i=1 |
|
Для непрерывной случайной величины дисперсия определяется
по формуле |
|
Dx = J ср (ж) (х — Мх)2 dx. |
(8) |
—се |
|
Для эмпирического распределения дисперсию обозначают через о2 или s2 и определяют ее как сумму произведений квадратов от клонений наблюденных значений случайной величины от ее средне
арифметического значения X на соответствующие частости (-^-): при п > 30
°2 = -1г?> (х1-Х)2П\ П 1=1