
3.3.1 Гипотезы и критерии о законе распределения.
В параграфе 3.1.2 была изложена методика преобразования выборки в статистический ряд. Одной из целей такого преобразования является проверка гипотезы о законе распределения ГС, из которой получена выборка. Сформулировав гипотезу
H0 = {F0 – гипотетическая ФР} = {F = F0}, (242)
мы можем протестировать либо отклонения F0 от статистической ФР:
(xi)
= Q(X
< xi)
=
, (172)
либо отклонения выборочных частот j статистического ряда (см. 3.1.2) от гипотетических частот nj = pj * n, где pj – вероятность попадания гипотетической СВ в j-ый интервал. В первом случае тестирование осуществляется по критерию Колмогорова-Смирнова, а во втором – по критерию Пирсона.
3.3.1.1 Критерий согласия Колмогорова – Смирнова.
В данном критерии [19] предполагается, что гипотетическая непрерывная ФР F0 известна с точностью до числовых значений своих параметров (без привлечения информации из выборки!). На практике этот критерий применяют и к сгруппированным данным. При этом возрастает вероятность ошибки второго рода.
Вычисляется разность
Dn
=
|
j
– N0j
|, (243)
где j – эмпирические частоты, накопленные к j-му интервалу, а N0j - гипотетические значения этих же частот. Далее, следуя [19], находят эмпирическое значение критерия Колмогорова-Смирнова:
DЭ = Dn / n. (244)
Объединив две последние формулы в одно выражение, получим другую форму эмпирического критерия (244):
DЭ
=
|Φj
- Fj|. (245)
Здесь Φj = Nj / n – эмпирическое значение статистической ФР к j-му интервалу, а Fj = F(ξj+1) – значение гипотетической ФР для правой границы j-го интервала.
Критическое значение данного критерия либо табулируется для определённого уровня значимости , либо вычисляется по приближённым формулам. При n>50 [19]рекомендует выражение
DT
= D 46
Более простой вариант для = 0,05 и n > 80 рекомендован [18]:
DT
= D0.05
47
Сопоставляя эмпирическое значение критерия (245) с его критическим значением (246) или (247), принимают решение по нулевой гипотезе. Если DЭ > DT, то на уровне значимости нулевая гипотеза (242) отвергается.
Задача 3.6. В таблице 3.3 приведена простая выборка, объёмом 120 элементов. Она получена по формуле (170), опирающейся на ЦПТ. Необходимо оценить качество работы генератора стандартных нормальных чисел.
С этой целью
проверим гипотезу
о стандартности нормальной генеральной
совокупности
по критерию Колмогорова-Смирнова, т.е.
проверим нулевую гипотезу H0
= {X
N(E(X)
= 0; x
= 1)} против
альтернативной Ha
= {X
N(E(X)
= 0; x
= 1)}.
Преобразуем исходную выборку в статистический ряд, положив число интервалов k = 10 и воспользовавшись необходимыми формулами из раздела 3.1.2.
Выборка.
Табл. 3.3
1,09 |
-0,33 |
-0,85 |
0,66 |
-0,26 |
1,32 |
0,03 |
0,31 |
-0,66 |
0,52 |
-0,99 |
-0,17 |
0,28 |
0,29 |
0,52 |
-1,28 |
-1,95 |
-0,24 |
0,84 |
-1,50 |
1,99 |
-0,45 |
1,01 |
1,72 |
1,76 |
0,76 |
0,07 |
0,33 |
0,09 |
-1,58 |
-0,83 |
-0,33 |
1,25 |
0,10 |
-0,06 |
1,09 |
-0,77 |
0,37 |
-0,45 |
0,45 |
-1,17 |
0,18 |
1,60 |
1,04 |
-0,25 |
1,54 |
-1,50 |
0,40 |
1,00 |
1,48 |
0,01 |
1,01 |
-0,66 |
-1,10 |
-0,70 |
-2,35 |
-1,03 |
-0,23 |
0,98 |
-1,15 |
0,74 |
0,67 |
0,77 |
-0,32 |
2,19 |
1,59 |
-1,19 |
-0,73 |
0,87 |
1,10 |
0,34 |
0,21 |
-0,58 |
0,32 |
-1,25 |
-0,09 |
-1,20 |
-0,09 |
-0,03 |
-0,16 |
-0,55 |
-1,43 |
-0,55 |
0,86 |
-0,58 |
-0,99 |
-0,05 |
-0,90 |
0,85 |
0,75 |
0,85 |
0,65 |
-0,20 |
0,50 |
-0,33 |
-0,31 |
0,40 |
0,12 |
2,61 |
-0,37 |
-0,24 |
1,16 |
-1,08 |
-1,04 |
-0,45 |
-1,41 |
0,35 |
-1,43 |
-1,28 |
1,36 |
0,61 |
0,21 |
1,62 |
0,53 |
-2,74 |
-1,05 |
-0,92 |
1,98 |
-1,33 |
-0,89 |
Определимmin
= –2,74 и
max
= 2,61.
Размах выборки, согласно (180), будет равен
R
= max
– min
= 5,35.
Ширина интервала, вычисленного по (181)
и округлённая до чётного разряда,
принимает значение c
= R
/k0,54.
Далее, оперируя формулой (182), вычисляем
границы интервалов
j = j + c,
(колонка 2, Табл. 3.4). В колонках 3 и 4 той же таблицы для каждого интервала зафиксированы выборочные наблюдённые и накопленные частоты:
=
{xi
[j;
j[}, (183)
Nj
==Nj
-1
+ νj. (248)
В 5-ой колонке вычислены эмпирические значения статистической ФР, соответствующие частотам, накопленным к j-му интервалу:
j = Nj / n. (249)
Соседняя, 6-ая колонка включает значения гипотетической (стандартной нормальной) ФР F(t), определяемой по аргументам ξ = t:
F(t)
=
–
dt. (78)
Последняя, 7-ая колонка содержит абсолютные значения разностей Φj – Fj.
Табл. 3.4
Критерий Колмогорова-Смирнова | ||||||
Интервалы |
Границы |
Эмпир. |
Эмпир. |
Эмпир. |
Гип. ФР
|
Абс. разн. |
частоты |
нак. част. |
ФР |
Ф и F | |||
j |
|
|
N |
Ф |
FN |
Ф и FN |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
-2,76 |
|
|
|
|
|
1 |
|
2 |
2 |
0,0167 |
0,0132 |
0,0035 |
|
-2,22 |
|
|
|
|
|
2 |
|
1 |
3 |
0,0250 |
0,0465 |
0,0215 |
|
-1,68 |
|
|
|
|
|
3 |
|
14 |
17 |
0,1417 |
0,1271 |
0,0145 |
|
-1,14 |
|
|
|
|
|
4 |
|
17 |
34 |
0,2833 |
0,2743 |
0,0091 |
|
-0,60 |
|
|
|
|
|
5 |
|
24 |
58 |
0,4833 |
0,4761 |
0,0073 |
|
-0,06 |
|
|
|
|
|
6 |
|
22 |
80 |
0,6667 |
0,6844 |
0,0177 |
|
0,48 |
|
|
|
|
|
7 |
|
21 |
101 |
0,8417 |
0,8461 |
0,0045 |
|
1,02 |
|
|
|
|
|
8 |
|
10 |
111 |
0,9250 |
0,9406 |
0,0156 |
|
1,56 |
|
|
|
|
|
9 |
|
7 |
118 |
0,9833 |
0,9821 |
0,0012 |
|
2,10 |
|
|
|
|
|
10 |
|
2 |
120 |
1,0000 |
0,9959 |
0,0041 |
|
2,64 |
|
|
|
|
|
Максимальное абсолютное значение такой разности принимаем за эмпирическое значение критерия Колмогорова-Смирнова:
DЭ
=
|Φj
- Fj|
= 0,0215.
Критическое значение критерия на уровне значимости = 0,05 определяем по формуле (246) или (247). Для выборки объёмом в 120 элементов оба результата совпадают в пределах 0,001:
DT = 0,124.
Итак, нулевая
гипотеза H0
= {X
N(E(X)
= 0; x
= 1)} не
отвергается,
поскольку неравенство DЭ
> DT
не выполнено.
Таким образом, параметры генератора стандартных нормальных чисел (E(X) = 0; x = 1), построенного с использованием ЦПТ, можно признать не противоречащими выдаваемым результатам.