
Статистика _Овсянникова (исправленный)
.pdf
Проверка гипотезы о показательном распределении генеральной совокупности
Задано эмпирическое распределение непрерывной случайной величины X в виде последовательности интервалов xi ; xi+1 и соот-
k
ветствующих им частот ni , причем ∑ni = n (объем выборки). Тре-
i=1
буется, используя критерии Пирсона, проверить гипотезу о том, что случайная величина X имеет показательное распределение.
Для того чтобы при уровне значимости α проверить гипотезу о том, что непрерывная случайная величина распределена по показательному закону, надо:
1. Найти пo заданному эмпирическому распределению выборочную среднюю xB . Для этого, приняв в качестве «представителя» i-го интервала его середину x i = (xi + xi+1 )/ 2 , составляют последовательность равноотстоящих вариант и соответствующих им частот.
2.Принять в качестве оценки параметра λ показательного распределения величину, обратную выборочной средней:
λ= x1B .
3.Найти вероятности попадания X в частичные интервалы
xi ;xi+1 по формуле
pi = P(xi < x < xi+1 )= e−λxi −e−λxi+1 .
4.Вычислить теоретические частоты:
ni′ = ni pi ,
k
где n = ∑ni – объем выборки.
i=1
70

5. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы , где k – число первоначальных интервалов выборки; если же было произведено объединение малочисленных частот, следовательно, и самих интервалов, то k – число интервалов, оставшихся после объединения.
Пример.
В итоге испытания 450 ламп было получено эмпирическое распределение длительности их горения, приведенное в следующей таблице
xi ;xi+1 |
0-400 |
400- |
800- |
1200- |
1600- |
2000- |
2400- |
|
|
|
800 |
1200 |
1600 |
2000 |
2400 |
2800 |
|
ni |
121 |
95 |
76 |
55 |
45 |
36 |
21 |
n = 450 |
Требуется по виду гистограммы выдвинуть гипотезу о виде распределения случайной величины X – времени горения ламп и проверить ее, пользуясь критерием Пирсона при уровне значимо-
сти α = 0,01.
Строим гистограмму (рисунок 4.5).
0,3 |
0,25 |
0,2 |
0,15 |
0,1 |
0,05 |
0 |
Рисунок 4.5 |
По виду гистограммы выдвигаем гипотезу о показательном распределении случайной величины X.
71

Для того, чтобы, при уровне значимости α , проверить гипотезу о том, что непрерывная случайная величина распределена по показательному закону:
1) Найдем среднее время работы всех ламп (выборочную среднюю xB ) (в качестве среднего времени работы одной лампы принимаем середину интервала к которому принадлежит лампа)
xB = |
121 200 +95 600 +76 1000 +56 1400 + 45 1800 +36 2200 + 21 2600 |
=1000 ; |
|
450 |
|||
|
|
2)Найдем оценку параметра λ
λ= 1 = 0,001.
xB
Таким образом, дифференциальная функция предполагаемого показательного распределения имеет вид
|
f (x)= 0,001e-0,001x , при x > 0, |
|
|
||
|
0, |
при x < 0. |
|
|
|
3) |
Найдем вероятности попадания X в частичные интервалы |
||||
по формуле pi = P(xi < x < xi+1 )= e−λxi −e−λxi +1 . |
|
|
|
||
p1 = P(0 < x < 400)= e−0,001 0 −e−0,001 400 = 0,33 ; |
p2 |
= 0,22 ; |
p3 = 0,14 ; |
||
|
p4 = 0,1; p5 = 0,066 ; |
p6 = 0,049 ; |
p7 |
= 0,029 . |
|
4) |
Найдем теоретические частоты |
|
|
|
|
n1′ =148,36 ; n2′ =99,45; n3′ = 66,64 |
; n4′ = 44,68 ; |
n5′ |
= 29,97 ; |
n6′ = 20,07 ; |
|
|
n7′ =13,46 |
|
|
|
5)Сравним эмпирические и теоретические частоты с помощью критерия Пирсена. Для этого составим расчетную таблицу. Число степеней свободы r = 7-2 = 5 .
72
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
(ni - ni′)2 |
|
i |
ni |
ni′ |
ni - ni′ |
(ni - ni′) |
|
|
|
|
|
ni′ |
|||||||
|
|
|
|
|
|
|
||
1 |
121 |
148.36 |
-27,36 |
748,57 |
|
5,04 |
|
|
2 |
95 |
99,45 |
-4,45 |
19,80 |
|
0,2 |
|
|
3 |
76 |
66,64 |
9,36 |
87,61 |
|
1,31 |
|
|
4 |
56 |
44,68 |
11,32 |
128,14 |
|
2,86 |
|
|
5 |
45 |
29,97 |
15,03 |
225,90 |
|
7,56 |
|
|
6 |
36 |
20,07 |
15,93 |
253,76 |
|
12,64 |
|
|
7 |
21 |
13,46 |
7,54 |
56,85 |
|
4,42 |
|
|
|
450 |
|
|
|
χ2 набл = 33,81 |
|||
|
По таблице критических точек распределения χ2 кр |
по уровню |
значимости α = 0,01 и числу степеней свободы r = 5 находим χ2 кр .
χ2 кр (0,01; 5)=15,1 .
Так как χ2 набл > χкр2 , гипотеза о показательном распределении отвергается.
Замечание. В случае, когда выдвинутая гипотеза не подтверждается, возможны следующие варианты:
1. Изменить гипотезу о виде распределения. Например, для рассмотренной задачи можно взять закон распределения вида
f (x)= ax +b ,
где параметры a и b определить из эмпирического распределения по способу наименьших квадратов.
2.Увеличить объем выборки.
3.Изменить уровень значимости (для выборки рассмотренной задачи этот путь нецелесообразен, что следует из сравнения значе-
нийχ2 набл табличными значениями χ2 кр ).
4. Откорректировать значения выборки, дающие резкие единичные отклонения эмпирических частот от теоретических.
73

Проверка гипотезы о равномерном распределении генеральной совокупности
Задано эмпирическое распределение непрерывной случайной величины X в виде последовательности интервалов и соот-
k
ветствующих им частот ni , причем n = ∑ni (объем выборки). Тре-
i=1
буется, используя критерий Пирсона, проверить гипотезу о том, что случайная величина X распределена равномерно.
Для того чтобы проверить гипотезу о равномерной распределении X, т.е. по закону
|
1 |
, приα < x < β, |
f (x)= |
|
|
β −α |
||
0, при |
α > x или β < x, |
|
|
|
|
надо:
1.Оценить параметры a и b – концы интервала, в котором наблюдались возможные значения X, по формулам (через a и b обозначены оценки параметров):
a = xB − 3σB ; b = xB +
3σB
2.Найти плотность вероятности предполагаемого распределения:
f (x)=1/ (b -a ).
3.Найти теоретические частоты:
n1′ = np1 = n(f (x)(x1 −a ))= n b −1 a (x1 −a );
n′2 = n3′ =K= nk′−1 = n b −1 a (xi − xi−1 ); (i = 2,3,K, k −1) n′k = n b −1 a (b − xk−1 ).
74

4.Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы r = k-3, где k – число интервалов, на которые разбита выборка.
Пример. В результате взвешивания 800 стальных шаров получено эмпирическое распределение, приведённое в таблице
xi ; xi+1 |
20- |
20,5- |
21- |
21,5- |
22- |
22,5- |
23- |
23,5- |
24- |
24,5- |
20,5 |
21 |
21,5 |
22 |
22,5 |
23 |
23,5 |
24 |
24,5 |
25 |
|
ni |
91 |
76 |
75 |
74 |
92 |
83 |
79 |
73 |
80 |
77 |
Требуется по виду гистограммы выдвинуть гипотезу о распределении случайной величины X – веса стального шарика и проверить при помощи критерия Пирсона при уровне значимости α = 0,01 эту гипотезу.
Строим гистограмму (рисунок 4.6)
0,12 |
0,1 |
0,08 |
0,06 |
0,04 |
0,02 |
0 |
Рисунок 4.6 |
По виду гистограммы выдвигаем гипотезу о равномерном распределении случайной величины X .
1. Найдем оценки параметров a и b .
= 20,25 91+20,75 76 +21,25 75 +K+24,75 77 =
xB 22,47 800
75

σB = |
(20,25 −22,47)2 91+(20,75 −22,47)2 76 +K+(24,75 −22,47)2 77 |
=1,44 |
|||||||||||
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
800 |
|
|
|
|
|
|
|
a = xB − 3σB =22,47− |
3 1,44 =19,98; |
|||||||||||
Откуда b = xB + |
3σB =22,47+ 3 1,44 =24,96 |
|
|
||||||||||
Найдем дифференциальную функцию предполагаемого рав- |
|||||||||||||
номерного распределения f (x)= |
|
1 |
|
= |
1 |
= 0,2 . |
|
||||||
|
|
24,96-19,98 |
|
||||||||||
|
|
|
|
|
|
|
|
b -a |
|
|
|
||
Найдем теоретические частоты |
|
|
|
|
|||||||||
|
n1′ = np1 = n |
|
|
1 |
|
(x1 −a )=800 0,2 (20,5 −19,98)=83,5 ; |
|||||||
|
b |
|
−a |
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
n2′ = n3′ =K= n9′ =800 0,2 0,5 =80;
n10′ = n b −1 a (b − xk−1 )=800 0,2 (24,96 −24,5)= 73,6.
Сравним эмпирические и теоретические частоты, используя критерий Пирсона, приняв число степеней свободы r = 7 .
Составим расчетную таблицу
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
(ni - ni′)2 |
|
i |
ni |
ni′ |
ni - ni′ |
(ni - ni′) |
|
|
|
|
ni′ |
||||||
|
|
|
|
|
|
||
1 |
91 |
83.2 |
7,8 |
60,64 |
0,73 |
|
|
2 |
76 |
80 |
-4 |
16 |
0,2 |
|
|
3 |
75 |
80 |
-5 |
25 |
0,31 |
|
|
4 |
74 |
80 |
-6 |
36 |
0,45 |
|
|
5 |
92 |
80 |
12 |
144 |
1,2 |
|
|
6 |
83 |
80 |
3 |
9 |
0,112 |
|
|
7 |
79 |
80 |
-1 |
1 |
0,0125 |
|
|
8 |
73 |
80 |
-7 |
49 |
0,61 |
|
|
9 |
80 |
80 |
0 |
0 |
0 |
|
|
10 |
77 |
73,6 |
3,4 |
11,56 |
0,57 |
|
|
|
800 |
|
|
|
χ2 набл = 4,79 |
76
По таблице критических точек распределения χ2 кр по уровню значимости α = 0,01 и числу степеней свободы r = 7 находим χ2 кр .
χ2 кр (0,01; 7)=18,5 .
Так как χ2 набл < χкр2 , то нет оснований отвергнуть гипотезу о равномерном распределении.
77

Тема 5. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
Корреляционный анализ наряду с выборочным методом представляет собой важнейшее прикладное направление математической статистики. Предметом его исследования является связь (зависимость) между различными варьирующими признаками (переменными величинами), при которой каждому значению одной переменной соответствует не определенное значение другой (как это имеет место при функциональной зависимости), а ряд распределения с определенной групповой средней. При изучении этой важной темы следует уяснить сущность статистической и (ее частного случая – корреляционной) зависимости.
Конечная цель корреляционного анализа – получение уравнений прямых регрессии, характеризующих форму зависимости и вычисление коэффициента корреляции, определяющего тесноту (силу) связи, если она линейная.
Пусть изучается система количественных признаков (X,Y). В результате n независимых опытов получены n пар чисел (x1,y1 ),
(x2 ,y2 ), …, (xn ,yn ).
Найдем по данным наблюдений выборочное уравнение прямой линии регрессии. Для определенности будем искать уравнение
yx = kx +b
регрессии Y на X.
Поскольку различные значения х признака X и соответствующие им значения у признака У наблюдались по одному разу, то
78
группировать данные нет необходимости. Поэтому искомое уравнение можно записать так:
yx = kx +b
Угловой коэффициент прямой линии регрессии У на X называют выборочным коэффициентом регрессии У на X и обозначают через ρxy ; он является оценкой коэффициента регрессии rxy .
Итак, будем искать выборочное уравнение прямой линии регрессий У на X вида
yx = ρxy x +b . |
(5.1) |
Подберем параметры ρxy и b так, чтобы точки (x1,y1 ), (x2 ,y2 ), …, (xn ,yn ) построенные по данным наблюдений, на плоскости хОу лежали как можно ближе к прямой (5.1). Уточним смысл этого требования. Назовем отклонением разность
Yi -yi (i =1,2,K,n),
где Yi – вычисленная по уравнению (5.1) ордината, соответствующая наблюдаемому значению xi ; yi – наблюдаемое значение соответствующая xi из опыта.
Подберем параметры ρxy и b так, чтобы сумма квадратов отклонений была минимальной (в этом состоит сущность метода наименьших квадратов). Так как каждое отклонение зависит от отыскиваемых параметров, то и сумма квадратов отклонений есть функция F этих параметров.
F (ρxy ,b)= ∑n (Yi − yi )2 ,
i=1
или
F (ρxy ,b)= ∑n (ρxy xi + b − yi )2
i=1
79