3.3.1.2 Критерий Пирсона.
Как было отмечено в начале раздела 3.3.1, можно анализировать отклонения выборочных частот j статистического ряда от гипотетических частот nj = pj * n. В качестве меры расхождения выборочных и гипотетических частот К. Пирсон, как это изложено в [15], опираясь на принцип наименьших квадратов, предложил вычислять величину
, (250)
которая, при , имеет распределение с r = k – 1 степенью свободы, где k – число интервалов статистического ряда. Это справедливо в предположении, что гипотетическая ФР F0 полностью определена, т.е. в её выражении не содержится никаких неизвестных параметров.
На практике мы сталкиваемся с двумя нарушениями теоретических предпосылок вывода Пирсона:
1) отдельные интервалы содержат менее десяти частот nj;
2) гипотетическая ФР F0 определена с точностью до оценок её m параметров, найденных по выборке.
Первое нарушение можно исправить, объединив s малообъёмных интервалов с соседними, для того, чтобы расширенные интервалы имели не менее десяти частот nj. Естественно, что число интервалов уменьшится и станет равным =k – s. Некоторые авторы [Митр] смягчают это требование до пяти единиц.
Второе нарушение предложил учитывать Р. Фишер [15]. Для важного класса методов оценивания m параметров генеральной совокупности по выборке необходимо дополнительно уменьшать число степеней свободы критерия r на количество оцениваемых параметров: r = –m – 1.
Эмпирическое значение критерия Пирсона , найденное по формуле (250), сопоставляется с теоретическим значением , представляющим собой двухсторонний доверительный интервал, нижняя и верхняя границы которого – это квантили распределения с r степенями свободы:
= [;]. (251)
Нулевая гипотеза (242) отвергается, когда
. (252)
Задача 3.7. Для простой выборки, объёмом 120 элементов, приведённой в таблице 3.3, проверить по критерию Пирсона нулевую гипотезу о нормальности генеральной совокупности H0 = {X N(E(X) = ; x = s)} против альтернативной гипотезы Ha = {X N(E(X) =; x = s)}. Параметры ГС и s оценить по статистическому ряду.
Преобразование выборки (Табл. 3.3) в статистический ряд выполняем аналогично тому, как это было сделано в Задаче 3.6, и размещаем результаты в Табл. 3.4. Первые три колонки обеих таблиц идентичны по форме и содержанию.
Табл. 3.4
Критерий Пирсона | ||||||||||
Интерв. |
Границы |
Эмпир. |
Сред. |
Центр. |
ЦСМ_1 |
ЦСМ_2 |
Норм. |
Гипот. |
Гипот. |
Пирс_2 |
част. |
интерв. |
сред. |
границы |
ФР |
част. | |||||
j |
|
|
(ср.) |
|
|
|
t |
F(t) |
n |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
|
-2,76 |
|
|
|
|
|
-2,73 |
0,0000 |
|
|
1 |
|
2 |
-2,49 |
-2,50 |
-5,0 |
12,5 |
|
|
1,7 |
|
|
-2,22 |
3 |
|
|
|
|
-2,20 |
0,0139 |
5,7 |
1,6 |
2 |
|
1 |
-1,95 |
-1,96 |
-2,0 |
3,8 |
|
|
4,1 |
|
|
-1,68 |
|
|
|
|
|
-1,67 |
0,0477 |
|
|
3 |
|
14 |
-1,41 |
-1,42 |
-19,9 |
28,3 |
|
|
9,7 |
20,3 |
|
-1,14 |
|
|
|
|
|
-1,14 |
0,1282 |
|
|
4 |
|
17 |
-0,87 |
-0,88 |
-15,0 |
13,2 |
|
|
17,4 |
16,6 |
|
-0,60 |
|
|
|
|
|
-0,60 |
0,2732 |
|
|
5 |
|
24 |
-0,33 |
-0,34 |
-8,2 |
2,8 |
|
|
23,8 |
24,2 |
|
-0,06 |
|
|
|
|
|
-0,07 |
0,4717 |
|
|
6 |
|
22 |
0,21 |
0,20 |
4,4 |
0,9 |
|
|
24,7 |
19,6 |
|
0,48 |
|
|
|
|
|
0,46 |
0,6776 |
|
|
7 |
|
21 |
0,75 |
0,74 |
15,5 |
11,4 |
|
|
19,4 |
22,7 |
|
1,02 |
|
|
|
|
|
0,99 |
0,8397 |
|
|
8 |
|
10 |
1,29 |
1,28 |
12,8 |
16,3 |
|
|
11,6 |
8,6 |
|
1,56 |
|
|
|
|
|
1,53 |
0,9364 |
|
|
9 |
|
7 |
1,83 |
1,82 |
12,7 |
23,1 |
|
|
5,3 |
|
|
2,10 |
9 |
|
|
|
|
2,06 |
0,9802 |
7,6 |
10,6 |
10 |
|
2 |
2,37 |
2,36 |
4,7 |
11,1 |
|
|
2,4 |
|
|
2,64 |
|
|
|
|
|
2,59 |
1,0000 |
|
|
|
|
120 |
= |
0,012 |
0,00 |
1,030 |
= s2 |
|
эмп= |
4,2 |
|
|
|
|
|
s = |
1,015 |
т |
0,8 |
12,8 |
] |
Для оценивания параметров E(X) и σx гипотетического распределения вычисляем середины интервалов
= (j +j+1) / 2 (253)
и размещаем результаты в колонке 4.
Оцениваем первый параметр гипотетического распределения – E(X):
= () /n = 0,01. (186)
В колонке 5 выполнено центрирование средин интервалов:
, (254)
значения которых используются для нахождения центральных статистических моментов (ЦСМ):
= () /n. (187)
Промежуточные вычисления для ЦСМ первого и второго порядков (r =1;2) заносим в колонки 6 и 7.
ЦСМ первого порядка контролирует правильность нахождения среднего статистического:
= () /n. = 0. (255)
Оценка второго параметра нормального распределения σx, найденная с помощью формулы (187), близка к единице: = s = 1,015.
Нормированные границы t (колонка 8) находят по формуле
t = (x – a) / b, (67)
используя в качестве параметров a и b их статистические оценки: и =s. Значения стандартной нормальной функции выбирают из Приложения 2 и вписывают в колонку 9. При этом для упрощения, открывают первую и последнюю границы «на минус и плюс бесконечность» соответственно: F(t1 = – ∞) = 0 и F(tk+1 = ∞) = 1. В колонке 10 располагают значения гипотетических интервальных частот:
nj = (F(tj+1) – F(tj))*n, (256)
Последняя, 11-ая колонка – это слагаемые «уменьшаемого» второго варианта предложенной выше формулы (250) критерия Пирсона:
(257)
В соответствие с ограничениями, накладываемыми на использование этого критерия (см. начало данного параграфа), гипотетические и, как следствие, эмпирические частоты 1-го и 2-го, а также 9-го и 10-го интервалов были объединены. Общее число интервалов k уменьшилось до 8-ми.
Критические (теоретические) значения критерия Пирсона на уровне значимости = 0,05 равны
= [0,8; 12,8]. (258)
Окончательное решение по проверяемой гипотезе выглядит следующим образом: «Гипотеза H0 = {X N(E(X) = = 0,012; x = s = 1,015)} не отвергается, так как ».
3.3.2 Гипотезы о равенстве дисперсий.
3.3.2.1 Распределение Фишера.
Распределение Фишера, или F-распределение, является законом распределения дроби [W&K]
3.3.3 Гипотезы о равенстве МО.
3.3.4 Гипотезы о попарной независимости случайных величин.