3.3.1 Гипотезы и критерии о законе распределения.
В параграфе 3.1.2 была изложена методика преобразования выборки в статистический ряд. Одной из целей такого преобразования является проверка гипотезы о законе распределения ГС, из которой получена выборка. Сформулировав гипотезу
H0 = {F0 – гипотетическая ФР} = {F = F0}, (242)
мы можем протестировать либо отклонения F0 от статистической ФР:
(xi) = Q(X < xi) = , (172)
либо отклонения выборочных частот j статистического ряда (см. 3.1.2) от гипотетических частот nj = pj * n, где pj – вероятность попадания гипотетической СВ в j-ый интервал. В первом случае тестирование осуществляется по критерию Колмогорова-Смирнова, а во втором – по критерию Пирсона.
3.3.1.1 Критерий согласия Колмогорова – Смирнова.
В данном критерии [19] предполагается, что гипотетическая непрерывная ФР F0 известна с точностью до числовых значений своих параметров (без привлечения информации из выборки!). На практике этот критерий применяют и к сгруппированным данным. При этом возрастает вероятность ошибки второго рода.
Вычисляется разность
Dn = | j – N0j |, (243)
где j – эмпирические частоты, накопленные к j-му интервалу, а N0j - гипотетические значения этих же частот. Далее, следуя [19], находят эмпирическое значение критерия Колмогорова-Смирнова:
DЭ = Dn / n. (244)
Объединив две последние формулы в одно выражение, получим другую форму эмпирического критерия (244):
DЭ = |Φj - Fj|. (245)
Здесь Φj = Nj / n – эмпирическое значение статистической ФР к j-му интервалу, а Fj = F(ξj+1) – значение гипотетической ФР для правой границы j-го интервала.
Критическое значение данного критерия либо табулируется для определённого уровня значимости , либо вычисляется по приближённым формулам. При n>50 [19]рекомендует выражение
DT = D 46
Более простой вариант для = 0,05 и n > 80 рекомендован [18]:
DT = D0.05 47
Сопоставляя эмпирическое значение критерия (245) с его критическим значением (246) или (247), принимают решение по нулевой гипотезе. Если DЭ > DT, то на уровне значимости нулевая гипотеза (242) отвергается.
Задача 3.6. В таблице 3.3 приведена простая выборка, объёмом 120 элементов. Она получена по формуле (170), опирающейся на ЦПТ. Необходимо оценить качество работы генератора стандартных нормальных чисел.
С этой целью проверим гипотезу о стандартности нормальной генеральной совокупности по критерию Колмогорова-Смирнова, т.е. проверим нулевую гипотезу H0 = {X N(E(X) = 0; x = 1)} против альтернативной Ha = {X N(E(X) = 0; x = 1)}.
Преобразуем исходную выборку в статистический ряд, положив число интервалов k = 10 и воспользовавшись необходимыми формулами из раздела 3.1.2.
Выборка.
Табл. 3.3
1,09 |
-0,33 |
-0,85 |
0,66 |
-0,26 |
1,32 |
0,03 |
0,31 |
-0,66 |
0,52 |
-0,99 |
-0,17 |
0,28 |
0,29 |
0,52 |
-1,28 |
-1,95 |
-0,24 |
0,84 |
-1,50 |
1,99 |
-0,45 |
1,01 |
1,72 |
1,76 |
0,76 |
0,07 |
0,33 |
0,09 |
-1,58 |
-0,83 |
-0,33 |
1,25 |
0,10 |
-0,06 |
1,09 |
-0,77 |
0,37 |
-0,45 |
0,45 |
-1,17 |
0,18 |
1,60 |
1,04 |
-0,25 |
1,54 |
-1,50 |
0,40 |
1,00 |
1,48 |
0,01 |
1,01 |
-0,66 |
-1,10 |
-0,70 |
-2,35 |
-1,03 |
-0,23 |
0,98 |
-1,15 |
0,74 |
0,67 |
0,77 |
-0,32 |
2,19 |
1,59 |
-1,19 |
-0,73 |
0,87 |
1,10 |
0,34 |
0,21 |
-0,58 |
0,32 |
-1,25 |
-0,09 |
-1,20 |
-0,09 |
-0,03 |
-0,16 |
-0,55 |
-1,43 |
-0,55 |
0,86 |
-0,58 |
-0,99 |
-0,05 |
-0,90 |
0,85 |
0,75 |
0,85 |
0,65 |
-0,20 |
0,50 |
-0,33 |
-0,31 |
0,40 |
0,12 |
2,61 |
-0,37 |
-0,24 |
1,16 |
-1,08 |
-1,04 |
-0,45 |
-1,41 |
0,35 |
-1,43 |
-1,28 |
1,36 |
0,61 |
0,21 |
1,62 |
0,53 |
-2,74 |
-1,05 |
-0,92 |
1,98 |
-1,33 |
-0,89 |
Определимmin = –2,74 и max = 2,61. Размах выборки, согласно (180), будет равен R = max – min = 5,35. Ширина интервала, вычисленного по (181) и округлённая до чётного разряда, принимает значение c = R /k0,54. Далее, оперируя формулой (182), вычисляем границы интервалов
j = j + c,
(колонка 2, Табл. 3.4). В колонках 3 и 4 той же таблицы для каждого интервала зафиксированы выборочные наблюдённые и накопленные частоты:
= {xi[j; j[}, (183)
Nj ==Nj -1 + νj. (248)
В 5-ой колонке вычислены эмпирические значения статистической ФР, соответствующие частотам, накопленным к j-му интервалу:
j = Nj / n. (249)
Соседняя, 6-ая колонка включает значения гипотетической (стандартной нормальной) ФР F(t), определяемой по аргументам ξ = t:
F(t) = –dt. (78)
Последняя, 7-ая колонка содержит абсолютные значения разностей Φj – Fj.
Табл. 3.4
Критерий Колмогорова-Смирнова | ||||||
Интервалы |
Границы |
Эмпир. |
Эмпир. |
Эмпир. |
Гип. ФР
|
Абс. разн. |
частоты |
нак. част. |
ФР |
Ф и F | |||
j |
|
|
N |
Ф |
FN |
Ф и FN |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
-2,76 |
|
|
|
|
|
1 |
|
2 |
2 |
0,0167 |
0,0132 |
0,0035 |
|
-2,22 |
|
|
|
|
|
2 |
|
1 |
3 |
0,0250 |
0,0465 |
0,0215 |
|
-1,68 |
|
|
|
|
|
3 |
|
14 |
17 |
0,1417 |
0,1271 |
0,0145 |
|
-1,14 |
|
|
|
|
|
4 |
|
17 |
34 |
0,2833 |
0,2743 |
0,0091 |
|
-0,60 |
|
|
|
|
|
5 |
|
24 |
58 |
0,4833 |
0,4761 |
0,0073 |
|
-0,06 |
|
|
|
|
|
6 |
|
22 |
80 |
0,6667 |
0,6844 |
0,0177 |
|
0,48 |
|
|
|
|
|
7 |
|
21 |
101 |
0,8417 |
0,8461 |
0,0045 |
|
1,02 |
|
|
|
|
|
8 |
|
10 |
111 |
0,9250 |
0,9406 |
0,0156 |
|
1,56 |
|
|
|
|
|
9 |
|
7 |
118 |
0,9833 |
0,9821 |
0,0012 |
|
2,10 |
|
|
|
|
|
10 |
|
2 |
120 |
1,0000 |
0,9959 |
0,0041 |
|
2,64 |
|
|
|
|
|
Максимальное абсолютное значение такой разности принимаем за эмпирическое значение критерия Колмогорова-Смирнова:
DЭ = |Φj - Fj| = 0,0215.
Критическое значение критерия на уровне значимости = 0,05 определяем по формуле (246) или (247). Для выборки объёмом в 120 элементов оба результата совпадают в пределах 0,001:
DT = 0,124.
Итак, нулевая гипотеза H0 = {X N(E(X) = 0; x = 1)} не отвергается, поскольку неравенство DЭ > DT не выполнено.
Таким образом, параметры генератора стандартных нормальных чисел (E(X) = 0; x = 1), построенного с использованием ЦПТ, можно признать не противоречащими выдаваемым результатам.