
Нормальное распределение (или закон Гаусса-Лапласа)
Де-Муавр вывел нормальный закон распределения вероятностей. В разработку этого закона внесли существенный вклад К.Гаусс и А.Лаплас. Гаусс исходил из признания наиболее значимым вероятным значением случайной величины–средней арифметической. Общее условие возникновения нормального закона распределения установил А.М.Ляпунов.
Нормальная кривая описывается следующей формулой:
У= 1 / σ√ 2π * е-(х-хср)2 /2 σ2
где –х- случайная величина; хср- средняя арифметическая или математическое ожидание; σ- среднее квадратическое отклонение
Существенными факторами, определяющими центр группировки и форму нормальной кривой, являются параметры хср и σ. Графически изображение нормальной кривой напоминает колокол.
При хср =0 и σ=1 нормальную кривую называют нормированной кривой или распределением нормальным в каноническом виде. Описывается она следующей формулой:
У =1/√ 2π * е-х2 /2
Нормальное распределение признака наблюдается в тех случаях, когда на величину признака явления действует множество случайных независимых или слабо зависимых факторов, каждый из которых играет в общем итоге относительно незначительную роль (отсутствуют доминирующие факторы).
Ляпунов доказал, что если изучаемый признак представляет собой результат суммарного действия многих факторов, каждый из которых мало связан с большинством остальных, и влияние каждого фактора на конечный результат намного перекрывается суммарным влиянием всех остальных факторов, то распределение становится близким к нормальному. В математической статистике нормальное распределение играет роль некоторого стандарта, с которым сравнивают другие распределения.
При построении нормальной кривой по эмпирическим данным, используют следующую формулу:
У = h*∑ni/n/ σ *1/√ 2π * е-t2 /2
где h –величина интервала
∑ni –сумма всех частот, равная объему совокупности
σ – среднее квадратическое отклонение
t – центрированное и нормировано отклонение, равное (х-хср) / σ
величина 1/√ 2π * е-t2 /2 –табулирована и может быть определена из соответствующих математико-статистических таблиц.(прилож.2)
табулирование –нахождение значений функции и построение таблиц по аналитическому выражению, связывающему переменные х и у.
Если у = f (х), то уо = f (хо), у1= f (х1), … у i= f (хi). Обычно значения аргумента (х) следуют друг за другом через одно и то же число h -называемое шагом таблицы. Тогда х i +1=х i +h ( i = 0,1,…) Для табулирования функций заданных аналитически, часто применяют разложение в ряды.
Пример:
Построим нормальную кривую по данным о распределении 200 деталей по весу
Вес детали,h (интервал) |
Число деталей - n |
Середина интервала.х |
(х-х0)/к =х1 |
х1*n |
(х1)2 |
(х1)2* n |
(х-хср) |
t= (х-хср)/σ
Гр.8 |
f (t)
Гр.9 |
Теоретическая счастота h∑ n / f(t) Гр.10 |
Уточнтеоретчастота-n1 |
|
||||||
306-311 |
19 |
308,5 |
-4 |
-76 |
16 |
304 |
-14,7 |
-1,5 |
0,1295 |
13 |
13 |
|||||||
311-316 |
34 |
313,5 |
-3 |
-102 |
9 |
306 |
-9,7 |
-0,99 |
0,2444 |
25 |
25 |
|||||||
316-321 |
38 |
318,5 |
-2 |
-76 |
4 |
152 |
-4,7 |
-0,48 |
0,3555 |
36 |
36 |
|||||||
321-326 |
33 |
323,5 |
-1 |
-33 |
1 |
33 |
0,3 |
0,03 |
0,3988 |
41 |
41 |
|||||||
326-331 |
38 |
328,5 |
0 |
0 |
0 |
0 |
5,3 |
0,54 |
0,3448 |
35 |
35 |
|||||||
331-336 |
17 |
333,5 |
1 |
17 |
1 |
17 |
10,3 |
1,05 |
0,2299 |
24 |
24 |
|||||||
336-341 |
11 |
338,5 |
2 |
22 |
4 |
44 |
15,3 |
1,56 |
0,1182 |
12 |
12 |
|||||||
341-346 |
6 |
343,5 |
3 |
18 |
9 |
54 |
20,3 |
2,07 |
0,0468 |
5 |
5 |
|||||||
346-351 |
2 |
348,5 |
4 |
8 |
16 |
32 |
25,3 |
2,58 |
0,0143 |
1 |
1 |
|||||||
351-356 |
2 |
353,5 |
5 |
10 |
25 |
50 |
30,3 |
3,10 |
0,0034 |
- |
- |
|||||||
итого |
200 |
- |
- |
-212 |
- |
992 |
- |
- |
- |
192 |
192 |
Находим среднюю по формуле :хср.= х1ср.*h +х0. За х0 принимаем центр интервала, равный 328,5 и h= 5
В графах 3,4 проводим подготовительные расчеты и получаем:
Х ср. = -212/2500*5+328,5=323,2
Находим среднеквадратическое отклонение:
σ = √(х1)2* n/ Σ n*h2 – ( хср-х0)2 =√992/200*25 – 5,32=√95,91~9,79
Находим t в каждой строке по формуле t=(х-хср)/σ (графа 9)и затем по приложению 2 (таблица значений функции f (t)=1/√ 2π * е-х2 /2 (плотность нормального распределения)
находим f(t). Для вычисления теоретических частот (т.е. ординат нормальной кривой, гр.10) находим множитель h∑ n / * σ =5*200/9,79~102,14 и все найденные в графе 9 величины f (t) умножаем на 102,14
Так для первого интервала получим 102,14*0,1295=13 и т.д.
Учитывая, что полученные теоретические частоты могут быть только целыми числами, округляем их и находим сумму, она равна 192. Т.о. видим несовпадение суммы теоретических частот (192) с суммой фактических частот (200). Такие расхождение бывает в тех случаях, когда крайние теоретические частоты значительно отличаются от нуля. В этих случаях теоретическую кривую надо продлевать. В нашем примере нормальная кривая должна быть продолжена в сторону отрицательных отклонений от средней, т.к. первая не уточненная частота равна 13.
Производим такой расчет теоретических частот для двух предшествующих интервалов, в которых фактические частоты равны нулю и получаем для интервалов 296-301 и 301-306 теоретические частоты, равные 2 и 6.Для наглядности строим график, на который наносим фактическое распределение в виде гистограммы и нормальную кривую.