Теория вероятностей и математическая статистика методические указа
..pdf2.2. Проверка статистических гипотез
Важнейшим разделом математической статистики является проверка статистических гипотез.
Статистической называют гипотезу о виде неизвестного закона распределения, или о параметрах известных распределений случайной величины. Например, статистическими будут гипотезы: а) долговечность рассматриваемых деталей подчиняется нормальному закону распределения; б) дисперсии температур, полученные при одинаковых условиях в двух различных термостатах, равны между собой.
Выдвинутая гипотеза называется нулевой (основной). Выдвинутая гипотеза может быть правильной или неправильной, и поэтому возникает необходимость ее статистической проверки. Для проверки статистической гипотезы используют специально подобранную случайную величину K (критерий согласия), распределенную по некоторому закону. Из опытных данных находят наблюдаемое значение Kн. Из специальных таблиц находят критическое значение Kкр. Если Kн < Kкр, то выдвинутая гипотеза (например, гипотеза о нормальном законе распределения) принимается; если Kн > Kкр, выдвинутая гипотеза отвергается.
Следует заметить, что условие Kн < Kкр совсем не означает, что выдвинутая гипотеза доказана и является единственно верной; это означает лишь то, что гипотеза не противоречит опытным данным.
Критерии проверки гипотезы о предполагаемом законе распределения называются критериями согласия. Имеется несколько критериев согласия: Пирсона, Колмогорова, Смирнова и др. Наиболее часто используется критерий Пирсона.
Критерий согласия Пирсона χ2 (хи квадрат)
Критерий согласия χ2 имеет наибольшее применение при
проверке согласования теоретического и эмпирического законов распределения случайной величины. Наблюдаемое значение критерия вычисляется по формуле
61
2 |
r |
(ni − ni′)2 |
, |
(2.1) |
χн |
= |
ni′ |
||
|
i=1 |
|
|
где r – число интервалов, на которые разбиты исходные опытные данные;
ni – число опытных данных, попавших в i-й интервал;
ni′ – теоретическое число, попавшее в i-й интервал, находится по формуле
xi+1
ni′ = n P(xi < x < xi+1 ) = n f (x)dx,
xi
где n – объем выборки.
В случае нормального закона
n′ = n |
Ф |
xi+1 − x |
|
− Ф |
xi − x |
|
, |
|||||
|
|
|
||||||||||
i |
|
|
S |
|
|
|
|
|
S |
|
|
|
где |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ф(x) = |
|
1 |
|
x |
− |
t2 |
|
|
|
||
|
|
|
e |
2 dt. |
|
|
||||||
|
|
2π |
|
|
|
|||||||
|
|
|
|
|
0 |
|
|
|
|
|
В случае показательного закона
xi+1
ni′ = n λe−λxdx = n(e−λxi − e−λxi+1 ).
xi
(2.2)
(2.3)
В случае равномерного закона распределения
xi+1 |
dx |
|
x |
i+1 |
− x |
i |
|
ni′ = n |
|
= n |
|
|
. |
||
b − a |
|
b − a |
|
||||
x |
|
|
|
|
|||
i |
|
|
|
|
|
|
|
При практическом использовании критерия согласия χ2 необходимо учесть следующие замечания:
1. Число опытных данных при использовании критерия χ2
должно быть достаточно большим: n ≥ 100 (критерий справедлив при n → ∞ ).
62
2.Рекомендуется иметь в каждом интервале не менее 5–10 на-
блюдений ni. Если ni в отдельных интервалах очень малы, следует объединить интервалы в один, суммируя частоты. В соответствии
сэтим число исходных интервалов должно быть уменьшено.
3.Уровень значимости α – вероятность ошибки первого рода, т.е. вероятность ошибки отвергнуть выдвинутую гипотезу, когда в действительности она верна. Чаще всего берут α = 0,05, но встречаются и другие уровни значимости.
4.χ2-распределение зависит от числа степеней свободы, это число находится по формуле
k = r −1− l,
где r – число интервалов, на которыеразбиты статистические данные; l – число параметров предполагаемого теоретического закона, использованных для вычисления теоретических частот и оцени-
ваемых по выборке.
Если предполагаемое распределение нормальное, то по выборке оценивают два параметра (a, σ), поэтому число степеней
свободы k = r − 3. Таким же будет число степеней свободы в случае равномерного законараспределения(оцениваемыепараметры– а иb). В случае показательного закона распределения по выборке оценивают один параметр, следовательно, в этом случае k = r − 2.
5.По заданному уровню значимости α и числу степеней свободы k из таблицыраспределения χ2 (прил. 5) находятзначение χкр2 .
6.Если χн2 < χкр2 , то гипотеза о виде закона не отвергается.
63
2.3.Методические указания к выполнению расчетной работы
2.3.1.Проверка гипотезы о нормальном распределении генеральной совокупности
1.По данной выборке построить эмпирическое распределение
ввиде последовательности равноотстоящих вариант и соответствующих им частот, для чего:
а) упорядочить выборку по возрастанию, найти xmin и xmax;
б) весь интервал, в который попали опытные данные, разбить
на r частичных интервалов (xi; xi+1) одинаковой длины. Для определения длин частичных интервалов рекомендуется формула
x = xmax − xmin .
1+ 3,3lgn
За длину частичного интервала принимается некоторое удобное число, ближайшее к полученному значению x. Границы интервалов выбираются так, чтобы результаты измерений не совпали с границами интервалов. Начало первого интервала сдвинуть влево от значения xmin (например, взять xmin – 0,5);
в) для каждого частичного интервала (xi; xi+1) найти ni – сумму частот вариант и считать, что ni сосредоточено в середине i-го ин-
тервала, т.е. взять xicp = xi +2xi+1 .
2.Построить гистограмму частот.
3.Найти выборочную среднюю x и выборочное среднее
квадратическое отклонение S по формулам
x = 1 r xiср ni ,
n i=1
(2.4)
|
1 |
|
r |
. |
S = |
|
xi2ср ni − n x 2 |
||
|
||||
|
n −1 i 1 |
|
||
|
|
|
= |
|
4. Найти теоретические частоты ni′ , попавшие в i-й интервал, по формуле (2.2).
64
5. Вычислить наблюдаемое значение критерия χн2 по фор-
муле (2.1).
6. По таблице χ2-распределения при уровне значимости α = = 0,05 и числе степеней свободы k найти критическое значение χкр2
(см. прил. 5).
7. Сравнить два значения χн2 и χкр2 . Если χн2 ≤ χкр2 , то нулевая
гипотеза не отвергается, т.е. в этом случае отклонения от предполагаемого теоретического закона считаются незначительными. Если
χн2 > χкр2 , то нулевая гипотеза отвергается.
Задача 2.1. Контролировался диаметр у 150 цапф передней оси, изготовленных на токарном станке. В результате были получены следующие значения положительных отклонений в микронах (мк) от номинального размера 20 мк:
48 |
39 |
43 |
36 |
39 |
34 |
32 |
48 |
46 |
37 |
25 |
31 |
34 |
36 |
35 |
37 |
45 |
49 |
49 |
44 |
43 |
46 |
34 |
48 |
43 |
36 |
41 |
34 |
42 |
35 |
38 |
40 |
46 |
34 |
39 |
41 |
38 |
39 |
36 |
42 |
30 |
43 |
41 |
39 |
37 |
33 |
35 |
42 |
45 |
43 |
37 |
42 |
38 |
40 |
34 |
39 |
32 |
40 |
39 |
37 |
43 |
30 |
44 |
45 |
37 |
34 |
49 |
41 |
51 |
32 |
37 |
30 |
50 |
32 |
32 |
35 |
45 |
42 |
41 |
48 |
43 |
45 |
44 |
46 |
42 |
39 |
41 |
38 |
31 |
32 |
40 |
52 |
45 |
47 |
35 |
45 |
33 |
38 |
36 |
40 |
44 |
52 |
44 |
34 |
44 |
44 |
43 |
43 |
40 |
30 |
32 |
42 |
49 |
39 |
42 |
43 |
48 |
41 |
43 |
42 |
40 |
48 |
35 |
42 |
44 |
44 |
34 |
33 |
48 |
51 |
44 |
50 |
47 |
34 |
33 |
33 |
40 |
46 |
50 |
43 |
44 |
50 |
40 |
40 |
35 |
35 |
41 |
42 |
42 |
47 |
Проверить соответствие нормального закона распределения с опытными данными по критерию Пирсона при уровне значимо-
сти α = 0,05 .
65
Решение:
1. Случайную величину (отклонения от номинального разме-
ра) обозначим как Х. |
|
примера находим xmin = 25 мк, |
|
Из выборки |
приведенного |
||
xmax = 52 мк . |
|
|
|
Вычисляем: |
x = |
52 − 25 |
= 3,3 мк. |
1+ 3,3lg150 |
Возьмем длину частичного интервала 3,0 мк. Левый конец первого интервала возьмем 24,5 мк. Из данной выборки найдем число опытных данных, попавших в каждый частичный интервал.
Полученные данные сведем в табл. 2.1.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 2.1 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
i |
|
|
xi − xi+1 |
|
ni |
|
Номер |
|
|
xi − xi+1 |
|
|
|
|
|
ni |
|||||
1 |
|
|
24,5–27,5 |
|
1 |
|
6 |
|
39,5–42,5 |
|
|
|
|
30 |
|
||||||
2 |
|
|
27,5–30,5 |
|
4 |
|
7 |
|
42,5–45,5 |
|
|
|
|
29 |
|
||||||
3 |
|
|
30,5–33,5 |
|
13 |
|
8 |
|
45,5–48,5 |
|
|
|
|
16 |
|
||||||
4 |
|
|
33,5–36,5 |
|
23 |
|
9 |
|
48,5–51,5 |
|
|
|
|
10 |
|
||||||
5 |
|
|
36,5–39,5 |
|
22 |
|
10 |
|
51,5–54,5 |
|
|
|
|
|
|
2 |
|
||||
|
2. Для каждого частичного интервала найдем |
x : |
x |
i |
|
|
= |
xi + xi+1 |
. |
||||||||||||
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
cp |
|
|
cp |
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Вычислим значения |
x и S по формулам (2.4); |
расчеты поместим |
|||||||||||||||||||
в табл. 2.2. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 2.2 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
i |
|
|
x − x |
xi |
|
n |
|
x2 |
|
|
xi ni |
|
|
|
|
|
x2 |
n |
|||
|
|
|
i i+1 |
|
ср |
|
i |
|
iср |
|
|
ср |
|
|
|
|
|
iср |
i |
||
1 |
|
|
24,5–27,5 |
26 |
|
1 |
|
676 |
|
|
26 |
|
|
|
676 |
|
|||||
2 |
|
|
27,5–30,5 |
29 |
|
4 |
|
841 |
|
|
116 |
|
|
|
3364 |
|
|||||
3 |
|
|
30,5–33,5 |
32 |
|
13 |
|
1024 |
|
|
416 |
|
|
|
13 312 |
|
|||||
4 |
|
|
33,5–36,5 |
35 |
|
23 |
|
1225 |
|
|
805 |
|
|
|
28 175 |
|
|||||
5 |
|
|
36,5–39,5 |
38 |
|
22 |
|
1444 |
|
|
836 |
|
|
|
31 768 |
|
|||||
6 |
|
|
39,5–42,5 |
41 |
|
30 |
|
1681 |
|
|
1230 |
|
|
|
50 430 |
|
|||||
66 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Окончание табл. 2.2
i |
x − x |
xi |
n |
x2 |
xi |
ni |
x2 |
n |
|
|
i |
i+1 |
ср |
i |
iср |
|
ср |
iср |
i |
7 |
42,5–45,5 |
44 |
29 |
1936 |
1276 |
56 144 |
|||
8 |
45,5–48,5 |
47 |
16 |
2209 |
752 |
35 344 |
|||
9 |
48,5–51,5 |
50 |
10 |
2500 |
500 |
25 000 |
|||
10 |
51,5–54,5 |
53 |
2 |
2809 |
106 |
5618 |
|||
∑ |
|
– |
– |
150 |
– |
6063 |
249 831 |
Находим:
x = 6063150 = 40,4 мк; S 2 = 1491 (249 831−150 (40,4)2 ) = 33,6; S = 5,8. 3. Построим гистограмму эмпирических частот (рис. 2.4).
Рис. 2.4. Гистограмма эмпирических частот (к задаче 2.1)
По виду гистограммы (см. рис. 2.4) можно предположить, что исследуемый признак подчиняется нормальному закону распределения.
4. Найдем теоретические частоты ni′ по формуле (2.2) при n = 150, x = 40,4, S = 5,8:
n′ = 150 |
Ф |
xi+1 |
− 40,4 |
− Ф |
xi − 40,4 |
. |
||
|
|
|
|
|||||
i |
|
|
5,8 |
|
5,8 |
|
||
|
|
|
|
|
67
В первом интервале левый конец изменим на −∞, а в последнем интервале – правый конец на +∞. Таким образом, первый интервал будет (−∞;27,5), а последний (51,5;+ ∞). Значения функции
Φ(x) находятся из таблицы (см. прил. 7). При этом нужно учесть, что Φ(− x)= −Φ(x) и для х > 5 значение Φ(x) = 0,5.
Приведем пример расчета значения ni′ :
n′ |
= 150 |
|
Ф |
27,5 − 40,4 |
|
− Ф |
−∞ |
|
= 150 |
( |
Ф |
−2,22 |
) |
+ Ф |
∞ |
)) |
= |
1 |
|
|
|
5,8 |
|
( |
|
) |
|
( |
|
( |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= 150 |
( |
|
|
|
|
|
|
) |
= 2,0; |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
−0,4868 + 0,5 |
|
|
|
|
|
|||||||||||||
|
|
n′ |
= 150 |
|
Ф 30,5 − 40,4 |
− Ф |
27,5 − 40,4 |
= |
|
|
|||||||||||||||
|
|
|
2 |
|
|
|
|
|
|
|
5,8 |
|
|
|
|
|
|
|
5,8 |
|
|
|
|
||
|
|
( |
|
( |
|
|
|
( |
|
|
)) |
|
|
|
( |
|
|
|
) |
|
|||||
|
= 150 |
Ф |
|
) |
− Ф |
−2,22 |
= 150 |
|
|
|
|
|
= 4,6 |
||||||||||||
|
|
|
−1,71 |
|
|
|
−0,4546 + 0,4868 |
|
|||||||||||||||||
и т.д. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Расчеты для нахождения критерия χн2 приведены в табл. 2.3. |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 2.3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
i |
(xi ;xi+1) |
|
|
|
|
|
|
ni |
|
|
|
|
|
|
ni′ |
|
|
|
(ni − ni′)2 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ni′ |
1 |
−∞ |
|
|
|
27,5 |
|
|
|
|
|
1,0 |
|
|
|
|
|
|
2,0 |
|
|
|
|
|
||
2 |
|
|
|
|
|
|
|
|
|
|
|
5,0 |
|
|
|
|
|
|
|
|
|
|
0,39 |
||
27,5 |
|
|
|
30,5 |
|
|
|
|
|
|
|
|
|
|
|
6,6 |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
4,0 |
|
|
|
|
|
|
4,6 |
|
|
|
|
|
||||
3 |
30,5 |
|
|
|
33,5 |
|
|
|
|
|
13,0 |
|
|
|
|
|
11,0 |
|
|
|
|
0,36 |
|||
4 |
33,5 |
|
|
|
36,5 |
|
|
|
|
|
23,0 |
|
|
|
|
|
20,2 |
|
|
|
|
0,39 |
|||
5 |
36,5 |
|
|
|
39,5 |
|
|
|
|
|
22,0 |
|
|
|
|
|
27,8 |
|
|
|
|
2,8 |
|||
6 |
39,5 |
|
|
|
42,5 |
|
|
|
|
|
30,0 |
|
|
|
|
|
30,6 |
|
|
|
|
1,21 |
|||
7 |
42,5 |
|
|
|
45,5 |
|
|
|
|
|
29,0 |
|
|
|
|
|
24,4 |
|
|
|
|
2,45 |
|||
8 |
45,5 |
|
|
|
48,5 |
|
|
|
|
|
16,0 |
|
|
|
|
|
15,4 |
|
|
|
|
1,49 |
|||
9 |
48,5 |
|
|
|
51,5 |
|
|
|
|
10,0 |
|
|
|
|
|
|
7,9 |
|
|
|
|
|
0,00 |
||
|
|
|
|
|
|
|
|
|
|
|
|
12,0 |
|
|
|
|
|
|
|
|
|
|
|||
10 |
51,5 |
|
|
|
+∞ |
|
|
|
|
|
|
|
|
|
|
|
12,1 |
|
|
|
|
|
|||
|
|
|
|
|
|
|
2,0 |
|
|
|
|
|
|
4,2 |
|
|
|
|
|
||||||
∑ |
|
|
– |
|
|
|
|
|
|
|
150,0 |
|
|
|
|
150,0 |
|
|
|
|
χн2 = 3,26 |
||||
68 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5. Число интервалов r с учетом объединения частот равно 8. Проверку гипотезы о нормальном распределении проводим при уровне значимости α = 0,05 и числе степеней свободы, равном
k = r − 3 = 8 − 3 = 5. Из таблицы (см. прил. 5) находим χк2p = 11,1.
В нашем примере χн2 = 3,26, т.е. χн2 < χкр2 .
Следовательно, опытные данные согласуются с нормальным законом распределения. На гистограмму наложим теоретическую кривую, полученную в соответствии с нормальным законом распределения.
6. Для построения нормальной кривой по опытным данным
находим ординаты yi (выравнивающие частоты) по формуле |
|||||||||||||||||||||||
|
yi = hi ϕ(ui ), где |
|
hi = |
n(xi+1 − xi ) |
; |
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
s |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
ui = |
xi − x |
; ϕ(u) |
= |
1 |
|
|
e− |
u |
, гдеn − объем выборки. |
|||||||||||||
|
|
|
2 |
||||||||||||||||||||
|
|
|
2π |
|
|||||||||||||||||||
|
|
s |
|
|
|
|
( |
) |
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
находим в таблице (см. прил. 6). |
||||||||||||
|
Значения функции ϕ u |
|
|
||||||||||||||||||||
|
Вычислим выравнивающие частоты для нашего примера. |
||||||||||||||||||||||
Имеем |
|
|
|
|
|
150 |
|
|
|
|
|
|
xi − 40,4 |
|
|
|
|||||||
|
|
|
|
s = 5,8; |
|
hi = |
3 = 77,6; ui = |
|
yi =77,6ϕ(ui ). |
||||||||||||||
x |
= 40,4; |
|
|
|
|
|
|
; |
|||||||||||||||
5,8 |
5,8 |
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
Результаты вычислений поместим в табл. 2.4. |
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 2.4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
i |
|
|
xi |
|
|
ni |
|
|
|
|
|
ui |
|
ϕ(ui ) |
|
|
yi |
|||||
|
1 |
|
|
26 |
|
1 |
|
|
|
|
|
–2,48 |
|
0,02 |
|
|
1,6 |
||||||
|
2 |
|
|
29 |
|
4 |
|
|
|
|
|
–1,96 |
|
0,05 |
|
|
3,9 |
||||||
|
3 |
|
|
32 |
|
13 |
|
|
|
|
|
–1,45 |
|
0,14 |
|
|
10,8 |
||||||
|
4 |
|
|
35 |
|
23 |
|
|
|
|
|
–0,94 |
|
0,26 |
|
|
20,2 |
||||||
|
5 |
|
|
38 |
|
22 |
|
|
|
|
|
–0,41 |
|
0,37 |
|
|
28,7 |
||||||
|
6 |
|
|
41 |
|
30 |
|
|
|
|
0,10 |
|
0,39 |
|
|
30,3 |
|||||||
|
7 |
|
|
44 |
|
29 |
|
|
|
|
0,62 |
|
0,33 |
|
|
25,6 |
|||||||
|
8 |
|
|
47 |
|
16 |
|
|
|
|
1,14 |
|
0,21 |
|
|
16,3 |
|||||||
|
9 |
|
|
50 |
|
10 |
|
|
|
|
1,66 |
|
0,09 |
|
|
7,0 |
|||||||
10 |
|
|
53 |
|
2 |
|
|
|
|
2,17 |
|
0,04 |
|
|
3,1 |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
69 |
В прямоугольной системе координат строим точки (xi , yi )
и соединяем их плавной кривой (рис. 2.5). Близость выравнивающих частот к наблюдаемым подтверждает правильность допущения о том, что исследуемый признак распределен нормально.
Рис. 2.5. Гистограмма теоретических частот (к задаче 2.1)
Задача 2.2. Эмпирическое распределение выборки объемом n = 100 приведено в табл. 2.5.
Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупностиХc эмпирическим распределением выборки.
|
|
|
|
|
Таблица 2.5 |
|
|
|
|
|
|
|
|
i |
xi − xi+1 |
ni |
i |
xi − xi+1 |
|
ni |
1 |
3–8 |
6 |
5 |
23–28 |
|
16 |
2 |
8–13 |
8 |
6 |
28–33 |
|
8 |
3 |
13–18 |
15 |
7 |
33–38 |
|
7 |
4 |
18–23 |
40 |
– |
– |
|
– |
Решение:
1. Построим гистограмму эмпирических частот (рис. 2.6).
70