книги из ГПНТБ / Железнов, Ю. Д. Статистические исследования точности тонколистовой прокатки
.pdfРис. 3. Определение вероят ности попадания случайной величины на участок ( —со < < X < х)
Что же касается размерности, то функция распределения F (х) характеризует вероятность случайной величины, поэтому она безразмерна. Плотность же распределения w (х), как видно из формулы (7), имеет размерность, обратную размерности случай ной величины.
Пример
Функция распределения непрерывной случайной величины определена формулой
О в интервале — оо < х < О
F(x) = sin л: в интервале |
0 ^ < |
я |
~2 |
||
в интервале |
< х < оо . |
|
I |
|
|
Определить: а) плотность распределения w (х) и б) вероятность
попадания случайной величины в интервал от —g- до
Р е ш е н и е . На основании формулы (7) находим плотность распределения
0, —оо^ х < о
w (х) =
dF(x) dx
. я
COS х, 0 ^ X < —
я
0, — ^ х < о о .
На рис. 4 приведены графики функции распределения и плот ности распределения.
Рис. 4. Функция распреде
ления F (*) = sin х (о <
л \ < х < —) и плотность рас
пределения W (*) = COS X
10
Вероятность вычисляем по формуле (9):
пя
Ут
w (х) dx = \ cos х dx =
яя
ТТ
б. Характеристики случайных величин
На практике иногда достаточно знать числовые характери стики случайных величин, которые дают представление об их рас пределении. Эти параметры должны каким-то образом дать ин формацию о среднем, около которого сгруппированы случайные величины, и о том, как они разбросаны с удалением от среднего.
Как показывает опыт, наиболее часто применяются такие чис ловые характеристики, как математическое ожидание (среднее значение), дисперсия, моменты различных порядков.
Особенно информативной из характеристик случайной вели
чины является ее математическое ожидание (среднее значение): СО
(Ю)
—00
Информацию о законе распределения случайной величины получают чаще всего из опытов. Правила обработки опытных дан ных и получения вероятностных характеристик случайных вели чин из опытов дает математическая статистика.
Статистическая теория во многом основана на теории вероят ностей, хотя здесь есть и обратная связь [2].
Рассмотрим такой пример. Нас интересует качество холодно катаных листов. Для анализа из всей продукции полученных в од них и тех же технологических условиях мы выбираем какое-то количество листов. Мы должны учитывать, что вывод и оценки, основанные на ограниченном материале наблюдений, отражают случайный состав нашей пробной группы и потому должны счи таться приближенными оценками вероятностного характера [3].
Пробная группа, взятая из всей массы продукции, назы вается выборкой, а вся продукция в этом случае является гене ральной совокупностью.
Необходимо подчеркнуть, что статистические характеристики самих выборок являются случайными величинами, так как взятие пробной группы (выборки) из генеральной совокупности носит элемент случайности. В отличие от статистических характеристик выборок закон распределения, характеризующий генеральную совокупность, является детерминированной функцией.
Между средней генеральной совокупностью и выборочными средними всегда существует некоторая разность.
Статистическая теория во многих случаях дает рекомендации, как наилучшим образом обработать имеющуюся у нас выборочную
11
информацию для получения по бозмоЖносДи более ДоЧнЫх И на дежных вероятностных характеристик.
Пусть в результате п измерений случайной величины х полу чили результаты x lt х 2, ■ ■ хп. Выборочное среднее
П
- _ |
*1 4~ *2 4~ •••+ |
П |
( 11) |
|
~ |
п |
|||
|
является оценкой средней генеральной совокупности (математи ческого ожидания). С увеличением числа опытов п выборочное среднее приближается к математическому ожиданию. При п = оо эти величины совпадают:
Пт х = М (х). |
(12) |
Л-> ОО
Момент 6-того порядка для непрерывной случайной величины относительно начала координат называется начальным моментом и вычисляется по формуле
со
а* = |
xkw(x)dx. |
(13) |
—СО
Выборочный момент 6-того порядка определяется по формуле
П
хк = —---- . |
(14) |
п |
' |
Математическое ожидание и выборочное среднее представляют собой моменты первого порядка.
Моменты относительного среднего значения называются цен тральными моментами и вычисляются по формуле:
|х* = Л4 (х — x)k — +J» (х — x)kw(x)dx, (15)
где х — х = х — центрированная случайная величина;
х — среднее значение.
Выборочный центральный момент 6-того порядка равен мо менту того же порядка соответствующей центрированной случай
ной величины: |
|
|
v |
/ V |
|
2j (*/) |
|
|
w = |
— • |
(16) |
Между начальными и центральными моментами с помощью би нома Ньютона можно определить следующие зависимости:
12
jx2 = М (*,. — ~xf = M (x?) — [M (X,.)]2 = a2 — (X)2 = a, - af, (17)
Цз = “ з + 2ai — 3ala2, |
(18) |
ц4 = a4 — 4a1<*3+ 6a2ai — 3aJ. |
(19) |
Рассеивание случайной величины X от среднего значения х характеризует центральный момент второго порядка р 2. Соответ ствующая выборочная характеристика вычисляется по формуле
| (XI- i f
ц2 = - Ы _ _ ---------= D ( x ) . |
(20) |
Центральный момент второго порядка называется дисперсией случайной величины х.
Квадратный корень из дисперсии называется среднеквадратич ным отклонением случайной величины
о(х) = ^ ц 2. |
(21) |
Зная центральные моменты второго, третьего и четвертого порядка, можно определить асимметрию и эксцесс эмпирического распределения. Асимметрия вычисляется по формуле
Она показывает, насколько эмпирическое распределение ско шено влево и вправо. Если А = 0, то эмпирическое распределение симметрично'относительно среднего значения. Если A =f= 0, то может быть или А < 0, или А > 0. Первое неравенство показы вает, что кривая распределения имеет правостороннюю, а второе указывает на левостороннюю асимметрию.
Эксцесс случайной величины определяется формулой
е = Ь - - 3 . |
(23) |
Здесь так же, как и в случае с асимметрией, |
если е ф 0, то |
е < 0 или е > 0. В первом случае распределение является плоско вершинным, во втором — островершинным по отношению к нор мальному закону распределения.
На рис. 5 приведены плотности распределения с положитель ной и отрицательной асимметрией и эксцессом.
Кривая нормального закона распределения описывается вы ражением
|
(х-х)* |
|
w ( x ) = — — e |
2а‘ , |
(24) |
а у 2л |
|
|
где х — среднее значение случайной |
величины; |
|
о — среднеквадратичное отклонение.
13
Рис. 5. Графики плотности распределения:
а — с положительной и отрицательной асимметрией; б — с положительным и отрицательным эксцессом
Соответствующая кривая распределения плотности вероятно стей приведена на рис. 6.
Величины х и а называются параметрами распределения. Сле довательно, нормальный закон является двупараметрическим распределением.
Интегральная функция нормального распределения на основа нии формулы (7) определяется так:
л: |
(*-*>* |
|
Г |
(25) |
|
F ( x ) = — —Х |
е 2°г dx. |
Для удобства вычисления вероятности случайные величины нормируют по формуле
у = |
X— X |
(26) |
|
а |
|
Нормальное распределение с параметрами х = 0 и а = 1 на зывается нормальным нормированным распределением вероят ностей (рис. 7). Дифференциальная функция нормального нор-
w(xj
Рис. 6. |
Кривая нормального распре- |
Рис. 7. Кривая нормированного |
деления |
плотности вероятностей |
нормального распределения веро |
|
|
ятностей |
14
мированного распределения вероятностей с учетом (26) выра зится так:
£_
w(y) = |
2 |
|
Тогда интегральная функция распределения определится по формуле
|
1 |
(27) |
|
F(y) = |
^2я ь - |
||
|
Вероятность попадания нормированной случайной величины Y с нормальным законом распределения в интервал (0, у) можно найти с помощью функции Лапласа:
у |
о |
у |
Р (0 < Y < у) = | w (у) d y = J w (у) dy + J w {у) dy = |
||
— оо |
— оо |
О |
|
У |
|
= ~2 |
+ } |
w(y)dy- |
Тогда |
о |
|
|
У |
|
|
|
|
Р (0<К < У ) = 0,5 + |
1 Г |
|
у = |
j е 2 dy = 0,5 + F(y), |
|
о
где F (у) — функция Лапласа.
Вероятность попадания в заданный интервал нормальной слу чайной величины определится интегралом
Р ( а < х < Ь ) = — i = ( e ~ L^ rL dx.
оК 2я-
Нормируя случайную величину, получим
Ь—х
Р< У <
а—х
о
Ъ—х
О
15
|
У 1 |
|
Уг |
|
V2я |
г |
2 dy + T ^ |
dy = F (у2) — F (i/i), (27а) |
|
|
||||
|
О |
|
О |
|
где F (у 2) и F |
(г/j) |
— значения функции Лапласа при |
||
|
|
Ь— х |
И У1: |
а — л: |
|
|
У2: |
|
|
При расчетах вероятности необходимо учитывать нечетность функции Лапласа F (у), т. е. F (— у) = — F {у).
Пример
Случайная величина с математическим ожиданием, равным 24, распределена нормально, а ее среднеквадратичное отклонение
а = 5 .
Вычислить вероятность того, что случайная величина попадает
винтервал (12,32).
Ре ш е н и е. х — 24, а = 5, а — 12, b = 32. Сначала норми руем х :
|
а — х |
12 — 24 |
2,4, |
|||
|
Уг = — |
а |
= |
----£— = - |
||
|
|
|
5 |
|
|
|
|
У2 = 'Ь — х |
32 — 24 = 1,6 . |
||||
Используя формулу (27а), имеем |
|
|
||||
Р (12 < х < |
32) = |
Р (-2,4 < у < |
1,6) = |
|||
= |
^ (1,6) — F (—2,4) — F (1,6) + |
F (2,4). |
||||
Далее находим |
[1 ]: F (1,6) |
= 0,4452; |
F (2,4) = 0,4918. Тогда |
|||
Р (12 < х < 32) = |
0,937. |
|
|
|
|
|
Необходимо отметить, что, кроме нормального распределения непрерывной случайной величины, приходится иметь дело и с дру гими распределениями, такими как распределение %2, распреде ление Стьюдента, распределения F Фишера, показательные рас пределения и т. д.
Таблицы функций этих распределений приводятся в учебни ках и справочниках по математической статистике.
2. Эмпирическая плотность распределения
иее характеристики
Впроцессе измерения продольной и поперечной разнотолщинности и формы листов и полос мы получаем эмпирические распре деления, этих параметров, которые изменяются от полосы к полосе,
i"
т. е. являются варьирующим признаком. Разность между наиболь шими и наименьшими значениями разнотолщинности называется широтой (размахом) распределения и выражается следующим образом:
При анализе непрерывных случайных величин, которыми являются разнотолщинность полос, рассматривают не отдель ные величины, а их совокупность, входящую в некоторый ин тервал.
Число таких интервалов достаточно брать от восьми до двад цати. При небольшом отклонении от нормального закона рас пределения количество интервалов можно брать от восьми до двенадцати.
Ширина каждого интервала определяется по следующей фор муле:
где R — размах распределения; k — количество интервалов.
Эмпирическое распределение можно представить в виде поли гона, гистограммы и ступенчатой кривой.
ч Для построения полигона на оси абсцисс необходимо отклады вать интервалы значений случайной величины, а в серединах ин тервалов брать ординаты, пропорциональные частостям, после чего соединять концы ординат.
Частость — это отношение числа опытов, попавших в задан ный интервал случайной величины, к общему числу проведенных опытов.
Гистограмма же получается путем построения над каждым интервалом прямоугольника, площадь которого пропорциональна частости в этом интервале. Если учесть, что ширина интервалов одинакова, то высота прямоугольников также пропорциональна частостям.
Ступенчатая кривая строится аналогично гистограмме, только высота прямоугольников пропорциональна накопительной (ин тегральной) частости.
При большом числе измерений для расчета вероятностных ха рактеристик удобно выражать значения всех интервалов в долях ширины интервала. Для этого за начало отсчета, так называемый «ложный нуль», принимается значение, отвечающее середине наиболее многочисленного интервала.
В таком случае середине каждого интервала будет отвечать простое целое положительное или отрицательное число. Для ил люстрации вышесказанных положений приведем пример рас чета вероятностных характеристик 100 измерений разнотолщин
ности. |
Г о ^ |
П б |
и ч ц * Я |
||
2 Ю, Д. Железнов |
Ч |
- |
:иI |
' |
. ; J 7 |
|
|
к а |
. |
с Р |
|
с ,:з е ?.-пг.яр
•’ АЛЬНОГО ЗАЛА
Пример
Результаты измерения разнотолщинности 100 горячекатаных полос сортамента 3,0x1020 мм приведены ниже:
0,25 |
0,15 |
0,20 |
0,20 |
0,24 |
0,17 |
0,13 |
0,27 |
0,22 |
0,19 |
0,13 |
0,17 |
0,18 |
0,21 |
0,16 |
0,19 |
0,16 |
0,25 |
0,14 |
0,19 |
0,23 |
0,22 |
0,16 |
0,20 |
0,19 |
0,23 |
0,19 |
0,14 |
0,09 |
0,19 |
0,21 |
0,27 |
0,17 |
0,18 |
0,25 |
0,20 |
0,24 |
0,12 |
0,18 |
0,22 |
0,17 |
0,18 |
0,10 |
0,23 |
0,20 |
0,26 |
0,26 |
0,25 |
0,08 |
0,15 |
0,24 |
0,18 |
0,24 |
0,29 |
0,20 |
0,29 |
0,21 |
0,18 |
0,17 |
0,22 |
0,24 |
0,22 |
0,15 |
0,21 |
0,20 |
0,21 |
0,27 |
0,21 |
0,12 |
0,20 |
0,16 |
0,20 |
0,19 |
0,20 |
0,37 |
0,24 |
0,30 |
0,28 |
0,18 |
0,23 |
0,15 |
0,14 |
0,19 |
0,22 |
0,21 |
0,15 |
0,20 |
0,13 |
0,21 |
0,19 |
0,21 |
0,11 |
0,23 |
0,23 |
0,18 |
0,22 |
0,36 |
0,23 |
0,18 |
0,17 |
|
|
|
|
|
Вычислить математическое ожидание, среднеквадратичное от клонение и дисперсию разнотолщинности.
Построить гистограмму, определить эмпирическую и теорети ческую плотность распределения, асимметрию и эксцесс.
Р е ш е н и е . Сначала |
находим |
xmln |
= |
0,08; |
xmax = 0,37. |
|||
Размах Я = хтах — хтШ= |
0,37 |
— |
0,08 = |
0,29. |
ширина ин |
|||
Принимаем количество интервалов |
k = |
8. |
Тогда |
|||||
тервала Д = R/k = |
0,29/8 |
= 0,03625. |
|
в |
табл. |
1. |
||
Результаты подсчета частостей |
сведены |
|||||||
Т а б л и ц а 1. Результаты подсчета частостей |
|
|
|
|||||
|
Средне |
Абсолютные |
|
Относи |
Накопи |
|||
Интервалы |
|
тельные |
тельные |
|||||
интервальные |
частости |
|
частости |
частости |
||||
|
значения |
|
пL |
|
* |
|
||
|
и |
|
|
|
p i |
|
||
|
|
|
|
|
|
|
||
0,08—0,11625 |
0,98125 |
|
4 |
|
|
0,04 |
0,04 |
|
0,11625—0,1525 |
0,134375 |
|
13 |
|
|
0,13 |
0,17 |
|
0,1525—0,18875 |
0,170625 |
|
20 |
|
|
0,20 |
0,37 |
|
0,18875—0,2250 |
0,206875 |
|
35 |
|
|
0,35 |
0,72 |
|
0,2250—0,26125 |
0,243125 |
|
19 |
|
|
0,19 |
0,91 |
|
0,26125—0,2975 |
0,279375 |
|
6 |
|
|
0,06 |
0,97 |
|
0,2975—0,33375 |
0,315625 |
|
1 |
|
|
0,01 |
0,98 |
|
0,33375—0,3700 |
0,351875 |
|
2 |
|
|
0,02 |
1,00 |
|
|
— |
|
|
100 |
|
|
1,00 |
— |
18
Т а б л и ц а 2. К расчету характеристик эмпирического распределения
Среднеинтерваль ные значения |
Отклонение относи тельно середины |
|
j |
~ c |
< |
|
x i |
|
|
|
|
|
_ |
<N co•«* |
|
„ |
а» |
|
|
|
часто |
|
Абсолютные |
сти n. |
аГ
0 ni^i i
co•-»
a> a^ e* c"*
0,098125 |
— 3 |
9 |
—27 |
81 |
4 |
— 12 |
36 |
— 108 |
324 |
0,134375 |
—2 |
4 |
—8 |
16 |
13 |
—26 |
52 |
— 104 |
208 |
0,170625 |
— 1 |
1 — 1 |
1 |
20 |
—20 |
20 |
—20 |
20 |
|
0,206875 |
0 |
0 |
0 |
0 |
35 |
0 |
0 |
0 |
0 |
0,243125 |
1 |
1 |
1 |
1 |
19 |
19 |
19 |
19 |
19 |
0,279375 |
2 |
4 |
8 |
16 |
6 |
12,0 |
24,0 |
48 |
96 |
0,315625 |
3 |
9 |
27 |
81 |
1 |
3 |
9,0 |
27 |
81 |
0,351875 |
4 |
16 |
64 |
256 |
2 |
8 |
32,0 |
128 |
512 |
|
— |
— |
— |
— |
n = 100 |
2 i = - i 6 |
£ 2=192 |
£ з = ~ 5 |
2 4 = 1260 |
По данным табл. 1 построена гистограмма распределения и кривая накопительной частости. Как видно из рис. 8, это распре деление близко к нормальному.
Теперь вычислим асимметрию и эксцесс эмпирического рас пределения, которые характеризуют отклонение последнего от
нормального |
распределения. |
Для удобства |
все расчеты сведем |
в табл. 2. |
«ложный нуль» |
с — 0,206875. |
Из табл. 2 следует: |
Выберем |
|
|
у |
|
|
у |
|
|
|
СЦ= |
п |
= |
—0,16; |
а2 = |
п |
= 1,92, |
||
|
|
|
|
|
|
|||
а3 = |
|
- S i |
= |
-0,05, |
= - S i = |
12,60, |
||
|
|
n |
|
|
n |
|
|
|
ц2 = |
|
D (x) = |
Д2 (а2 — а^2 = |
|
24,96-10'4, |
|||
ц3= |
Д3(а 3 —■Зауя, + |
2a8) = |
|
41,75-10 6, |
||||
щ = Д4 ( « 4 — 4a3a! + 6a2a^ — 3a|) = |
2213,64 •10“ 8, |
|||||||
x = а 1 = а1Д + с = |
-0,16 0,03625 + |
|
0,206875 = 0,201075, |
|||||
D (x) = |
24,96-10-4, |
a (x) = |
5 -10~2. |
|||||
Асимметрия |
A = -Jf- |
= |
= |
|
°'334- |
|||
2 |
19 |
