ЛЕК __Проверка статистических гипотез__
.pdf5.3. Проверка статистических гипотез
Определение 77. Статистической называют гипотезу о виде неизвестного распределения, или о параметрах известного распределения.
Определение 78. Нулевой (основной) гипотезой называют выдвинутую гипотезу H 0 .
Определение 79. Конкурирующей (альтернативной) гипотезой называют гипотезу H1 , которая
противоречит нулевой.
Определение 80. Простой называют гипотезу, содержащую только одно предположение.
Определение 81. Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.
При статистической проверке гипотезы можно допустить следующие ошибки:
1.Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.
2.Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.
Замечание: Вероятность совершить ошибку первого рода называют уровнем значимости и обозначают. Обычно его принимают равным 0,05 или 0,01. Если принят уровень значимости = 0, 01 , то это значит,
что примерно в одном случае из ста можно допустить ошибку первого рода. Для уменьшения возможности допустить ошибку первого рода эксперимент проводят повторно с большей выборкой.
Определение 82. Статистическим критерием называют случайную величину R , по значениям которой судят о справедливости нулевой гипотезы.
Определение 83. Наблюдаемым значением Rнабл называют значение статистического критерия,
вычисленное по выборочным данным.
После выбора некоторого критерия проверки статистической гипотезы множество всех его возможных значений разбивают на два непересекающихся подмножества. Если наблюдаемое значение критерия попадает в первое подмножество (область принятия гипотезы), то основная гипотеза принимается. Если – во второе подмножество (критическая область), то основная отвергается и принимается альтернативная гипотеза. Точки разделяющие эти подмножества называют критическими.
Для проверки статистической гипотезы поступают следующим образом:
1.Ранжируют данные.
2.Строят статистический ряд.
3. Вычисляют теоретические вероятности попадания в каждый интервал группирования по формуле: pi* = h f (xi0 ) .
4.Вычисляют теоретические частоты по формуле: ni* = npi* .
5.Задают уровень значимости .
6. Определяют |
критическую |
точку |
(правосторонняя |
критическая |
область) |
исходя из условия |
|
P(R Rкрит ) = и количества |
степеней свободы |
( s = k −m −1, |
где k - |
количество интервалов |
|||
группирования признака, m - |
количество параметров рассматриваемого распределения. |
Например, для |
|||||
нормального |
распределения |
m = 2 , т.к. оно определяется двумя |
параметрами – |
математическим |
ожиданием и средним квадратическим отклонением).
7.Вычисляют по выборке наблюдаемое значение критерия.
8.Если наблюдаемое значение больше критического, то гипотезу H 0 отвергают; в противном случае нет оснований отвергнуть гипотезу (отвергают гипотезу более категорично, чем принимают).
Вкачестве критерия проверки статистических гипотез будем рассматривать критерий Пирсона 2 (хи квадрат).
Для определения критических точек распределения 2 при различных уровнях значимости составлены
специальные таблицы.
Определение 84. Наблюдаемым значением критерия Пирсона называется величина
набл2 |
k |
(n − np* )2 |
||
= |
i |
i |
. |
|
|
* |
|||
|
i=1 |
npi |
||
|
Пример |
48. Дана выборка, проверить гипотезу при уровне значимости = 0, 05 , если |
H0 ={Количественный признак генеральной совокупности распределен нормально}.
- 1 -
27,28 |
20,99 |
74,98 |
22,79 |
61,89 |
45,78 |
64,79 |
15,62 |
47,55 |
26,91 |
32,1 |
70,86 |
43,48 |
18,08 |
40,66 |
48,36 |
65,75 |
49,2 |
51,87 |
40,48 |
53,72 |
44,39 |
62,73 |
28,9 |
62,39 |
32,5 |
18,97 |
33,71 |
56,1 |
53,52 |
53,93 |
27 |
75,87 |
41,25 |
2,47 |
62,85 |
51,89 |
65,75 |
37,26 |
65,83 |
51,18 |
27,27 |
44,35 |
55,27 |
38,47 |
57,83 |
43,36 |
56,5 |
46,63 |
33,79 |
24,12 |
62,08 |
36,08 |
48,71 |
32,07 |
58,05 |
26,06 |
58,22 |
37,52 |
58,5 |
59,74 |
55,72 |
44,78 |
41,01 |
40,72 |
57,38 |
72,08 |
51,55 |
45,2 |
45,33 |
31,24 |
28,29 |
58,41 |
51,96 |
27,03 |
42,95 |
19,27 |
52,46 |
70,1 |
55,2 |
27,12 |
70,7 |
54 |
57,93 |
41,13 |
27,93 |
61,36 |
74,78 |
50,77 |
74,08 |
59,17 |
82,62 |
80,84 |
52,3 |
53,05 |
16,97 |
61,73 |
45,75 |
27,46 |
47,38 |
Решение: Объем выборки равен 100, следовательно количество интервалов группирования равно:
k =1+ log2 100 = 7, 6439 8. Длина интервала группирования равна отношению размаха |
и количества |
|||||||
интервалов группирования: |
h = |
xmax − xmin |
= |
82, 62 − 2, 47 |
=10, 01875 10,1. |
Заметим, |
что значение |
|
k |
8 |
|||||||
|
|
|
|
|
|
длины интервала всегда следует округлять с избытком. В противном случае наибольшие варианты могут не включиться в последний интервал. Если же округлять с избытком на значительную долю, то последний интервал может оказаться пустым. Занесем все данные в следующую таблицу:
Наблюдаемое значение критерия равно: |
2 |
= 9,7985. |
Число степеней свободы равно: |
|
набл |
|
|
s = 8 −2 −1 = 5. По таблице, расположенной ниже, |
находим: крит2 |
(0, 05;5) =11,1 . Так как наблюдаемое |
значение критерия меньше, чем критическое (теоретическое значение), то нет оснований отвергнуть основную (нулевую) гипотезу.
Номер |
Интервал |
Середина |
Частота |
Частость |
Компоненты |
Отклонения |
Компоненты |
|
Теоретич. |
Теоретич. |
Компоненты |
||||||||||||||||||||
интер |
[xi −1; xi ) |
интервала |
ni |
|
n |
среднего |
от среднего |
дисперсии |
|
|
|
частости |
частоты |
|
|
(n − n* )2 |
|||||||||||||||
вала |
|
xi0 |
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
pi* = h f (xi0 ) |
ni* = n pi* |
2 |
: |
|
i |
i |
|
|
|
|
|
|
|
|
x |
|
|
x0 − x |
|
|
|
n (x0 − x )2 |
|
||||||||||||||||
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
* |
||||||||||||||||
i |
|
|
|
|
|
|
|
|
|
B |
i |
B |
|
i i |
B |
|
|
|
|
|
|
|
ni |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
2,47 – |
7,52 |
1 |
0,01 |
|
|
|
0,0752 |
-39,592 |
|
|
15,67526 |
|
|
0,0130495 |
1,304953 |
|
0,071264 |
|
||||||||||||
|
12,57 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
12,57 – |
17,62 |
6 |
0,06 |
|
|
|
1,0572 |
-29,492 |
|
|
52,18668 |
|
|
0,0482933 |
4,829328 |
|
0,283781 |
|
||||||||||||
|
22,67 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
22,67 – |
27,72 |
17 |
0,17 |
|
|
|
4,7124 |
-19,392 |
|
|
63,92844 |
|
|
0,1219021 |
12,19021 |
|
1,897759 |
|
||||||||||||
|
32,77 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
32,77 – |
37,82 |
12 |
0,12 |
|
|
|
4,5384 |
-9,292 |
|
|
10,36095 |
|
|
0,2098788 |
20,98788 |
|
3,848982 |
|
||||||||||||
|
42,87 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
42,87 – |
47,92 |
24 |
0,24 |
|
|
11,5008 |
0,808 |
|
|
0,156687 |
|
|
0,246467 |
24,64669 |
|
0,016969 |
|
|||||||||||||
|
52,97 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
52,97 – |
58,02 |
26 |
0,26 |
|
|
15,0852 |
10,908 |
|
|
30,93596 |
|
|
0,1974158 |
19,74158 |
|
1,984029 |
|
|||||||||||||
|
63,07 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7 |
63,07 – |
68,12 |
8 |
0,08 |
|
|
|
5,4496 |
21,008 |
|
|
35,30688 |
|
|
0,1078544 |
10,78544 |
|
0,719364 |
|
||||||||||||
|
73,17 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
73,17 – |
78,22 |
6 |
0,06 |
|
|
|
4,6932 |
31,108 |
|
|
58,06246 |
|
|
0,0401907 |
4,01908 |
|
0,976356 |
|
||||||||||||
|
83,27 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
DB = |
|
|
|
|
|
2 |
|
|
= 9,7985 |
|||||
|
|
|
|
|
|
|
|
x |
B |
= |
47,112 |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
набл |
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
266,6133 |
|
|
|
|
|
|
|
|
|
|
|
|
- 2 -