книги / Методические указания к проведению практических занятий по разделу математическая статистика дисциплины Основы системного анализа и математической статистики
..pdf
|
|
21 |
|
|
|
|
|
|
|
2 |
|
( di )2 |
|
|
|
|
|
|
di |
|
|
|
|
Sd |
вычисляется по формуле: Sd |
n |
|
. |
|||
|
|
|
|
||||
|
n |
(n 1) |
|
||||
|
|
|
|
|
Число степеней свободы k n 1.
Пример 11
Используя t - критерий Стьюдента для равных по численности выборок, принять или отклонить гипотезу о том, что в результате отработки навыков время решения эквивалентных задач , имеющих один и тот же алгоритм решения, будет значимо уменьшаться.
Нулевая гипотеза H0: время решения задач не отличается. Альтернативная гипотеза H1: время решения третьей задачи меньше
времени решения первой.
Результаты измерения времени решения (в мин.) первой и третьей
задач у восьми испытуемых, а также необходимые расчеты представим
в виде таблице 7.
|
|
|
|
|
|
Таблица 7 |
|
|
|
|
|
|
|
|
|
№ |
1 задача |
3 задача |
di |
xi |
yi |
di2 |
|
|
|
|
|||||
xi |
yi |
|
|||||
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
1 |
4,0 |
3,0 |
|
1,0 |
|
1,0 |
|
|
|
|
|
|
|
|
|
2 |
3,5 |
3,0 |
|
0,5 |
|
0,25 |
|
|
|
|
|
|
|
|
|
3 |
4,1 |
3,8 |
|
0,3 |
|
0,09 |
|
|
|
|
|
|
|
|
|
4 |
5,5 |
2,1 |
|
3,4 |
|
11,56 |
|
|
|
|
|
|
|
|
|
5 |
4,6 |
4,9 |
|
-0,3 |
0,09 |
|
|
|
|
|
|
|
|
|
|
6 |
6,0 |
5,3 |
|
0,7 |
|
0,49 |
|
|
|
|
|
|
|
|
|
7 |
5,1 |
3,1 |
|
2,0 |
|
4,00 |
|
|
|
|
|
|
|
|
|
8 |
4,3 |
2,7 |
|
1,6 |
|
2,56 |
|
|
|
|
|
|
|
|
|
|
37,1 |
27,9 |
|
9,2 |
|
20,04 |
|
|
|
|
|
|
|
|
|
22
Решение:
Вначале произведем расчет по формуле
|
|
|
di |
|
(xi yi ) |
|
9,2 |
1,15. |
|
||||
d |
|
|
|
||||||||||
n |
|
n |
|
8 |
|
||||||||
|
|
|
|
|
|
|
|
|
|
||||
Затем вычислим Sd |
20,04 9,2 |
2 /8 |
0,41. |
||||||||||
|
8 |
(8 1) |
|||||||||||
|
|
|
|
|
|
|
|
|
|
||||
Получим t |
эмп |
|
1,15 |
2,8. |
|
|
|
|
|
||||
0,41 |
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
Число степеней свободы k 8 1 7. По таблице критических точек распределения Стъюдента при уровне значимости 0,05 находим tкр 2,37.
Таким образом, на 5% уровне значимости среднее время решения
третьей задачи существенно меньше среднего времени решения первой
задачи. В терминах статистических гипотез делаем вывод: на 5%
уровне принимается гипотеза H1.
4.3. F -- критерий Фишера
Критерий Фишера позволяет сравнивать величины выборочных дисперсий двух выборок. Для вычисления F'эмп нужно найти отношение
дисперсий двух выборок с объемами n1 и n2, причем так, чтобы
большая по величине дисперсия находилась бы в числителе, а меньшая знаменателе.
F |
|
S 2 |
, (F |
1). |
|
x |
|||
|
||||
'эмп |
|
S y2 |
'эмп |
|
|
|
|
|
Sx2 |
1 |
(xi |
|
)2 , S y2 |
1 |
|
(yi |
|
)2 |
|
||
X |
Y |
|
||||||||||
|
|
|
||||||||||
|
n |
n |
2 |
|
|
|
|
|
|
|||
1 |
|
|
|
|
|
|
|
|
|
|
||
Число степеней свободы определяется k1 |
n1 |
1 |
для первой |
|||||||||
выборки, величина дисперсии которой больше, и |
k2 |
n2 |
1для второй |
23
выборки. В таблице 18 Приложения 6 критические значения F-критерия Фишера Fкр находятся по величинам k1 и k2 .
Для применения F-критерия Фишера необходимо, чтобы сравниваемые выборки были распределены по нормальному закону. Измерение может быть проведено в шкале интервалов и отношений.
Пример 12
В двух третьих классах школы проводилось тестирование умственного развития десяти учащихся. Полученные значения величин средних достоверно не различались, однако психолога интересует
существуют ли различия в степени однородности показателей умственного развития между классами.
Результаты тестирования представлены в табл. 8.
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 8 |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
№ уч-ся |
1 кл (X) |
2 кл (Y) |
xi |
|
|
yi |
|
|
(xi |
|
)2 |
|
(yi |
|
)2 |
X |
Y |
X |
Y |
||||||||||||
|
|
|
|
|
|
|
|
|
|
||||||
1 |
90 |
41 |
29,4 |
|
-22,6 |
|
864,36 |
|
510,76 |
||||||
|
|
|
|
|
|
|
|
|
|
||||||
2 |
29 |
49 |
-31,6 |
|
-14,6 |
|
998,56 |
|
213,16 |
||||||
|
|
|
|
|
|
|
|
|
|
||||||
3 |
39 |
56 |
-21,6 |
|
-7,6 |
|
466,56 |
|
57,76 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|||||
4 |
79 |
64 |
18,4 |
|
0,4 |
|
338,56 |
|
0,16 |
|
|||||
|
|
|
|
|
|
|
|
|
|
||||||
5 |
88 |
72 |
27,4 |
|
8.4 |
|
750,76 |
|
70,56 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|||||
6 |
53 |
65 |
-7,6 |
|
1,4 |
|
57,76 |
|
1,96 |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|||||
7 |
34 |
63 |
-26,6 |
|
-0,6 |
|
707,56 |
|
0,36 |
|
|||||
|
|
|
|
|
|
|
|
|
|
||||||
8 |
40 |
87 |
-20,6 |
|
23,4 |
|
424,36 |
|
547,56 |
||||||
|
|
|
|
|
|
|
|
|
|
||||||
9 |
75 |
77 |
14,4 |
|
13,4 |
|
207,36 |
|
179,56 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|||||
10 |
79 |
62 |
18,4 |
|
-1,6 |
|
338,56 |
|
2,56 |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
606 |
636 |
|
|
|
|
|
|
5154,4 |
|
1584,4 |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
среднее |
60,6 |
63,6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
24
Решение:
Как видно из таблицы, величины средних в обеих группах практически совпадают между собой 60,6 63,6. Величина t - критерия Стьюдента оказалась равной 0, 347 и незначимой.
Вычислим дисперсии для переменных X и Y
Sx2 |
|
1 |
|
(xi |
|
|
)2 |
515,44 |
|
|||||
X |
|
|||||||||||||
n |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
S y2 |
|
|
1 |
|
(yi |
|
)2 158,44 |
|
||||||
|
|
Y |
|
|||||||||||
|
|
|
|
|||||||||||
|
|
|
n2 |
|
|
|
|
|
||||||
|
Следовательно, |
F |
эмп |
|
515,44 |
3,25 . |
||||||||
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
158,44 |
|
Для F – критерия Фишера при степенях свободы k1 k2 10 1 9 находим Fкр:
Fкр 3,18для 0,05
Психолог может утверждать, что по степени однородности умственное развитие, имеется различие между выборками из двух
классов.
4.4. Критерий 2 (Пирсона)
Критерий Пирсона – наиболее часто употребляемый критерий для проверки простой гипотезы о законе распределения. Наблюдаемое значение критерия:
|
m |
(n |
i |
n' )2 |
|
эмп2 |
|
|
i |
. |
|
|
|
|
|||
|
i 1 |
|
|
ni' |
m- число интервалов, на которые разбит вариационный ряд,
ni - эмпирическая частота, ni' - теоретическая частота i – го интервала.
25
Алгоритм применения критерия 2
1.Вариационный ряд разбить на ряд частичных интервалов (столбец 1,таблицы 11). За длину интервала выбрать число h , ближайшее к
x xmax xmin .. Промежуточные интервалы получают, прибавляя к
1 3,3lgn
концу предыдущего интервала длину частичного интервала h.
2.Для каждого частичного интервала подсчитать ni - эмпирическую частоту (столбец 7).
3.Найти середину каждого полученного интервала (столбец 2).
4.По выборке найти точечные оценки неизвестных параметров предполагаемого закона распределения (используя результаты столбца 2):
X1 n xi ni , n i 1
DВ 1 k xi x 2 ni , n i 1
|
|
|
1 |
. |
|
|
|||
1 |
|
|||
|
|
n |
||
|
|
n |
xi |
|
|
|
i 1 |
5.Вычислить теоретические частоты ni (столбец 6):
Вслучае нормального закона распределения
n' |
|
x |
a |
x |
a |
||||
n |
i 1 |
|
|
|
i |
|
|
||
|
|
|
|
||||||
i |
|
|
|
|
|
|
|
, (столбцы 3,4,5,6) |
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
где (x)находим по таблице значений функции Лапласа.
В случае показательного закона распределения
ni' n |
xi 1 |
n e xi |
e xi 1 . |
e x dx |
xi
|
|
|
26 |
|
|
|
|
|
|
|
В случае равномерного закона распределения |
|
|
|
|
||||||
' |
xi 1 |
1 |
|
x |
i 1 |
|
x |
i |
|
|
n i n |
|
dx |
n |
|
|
|
. |
|||
b a |
|
b |
a |
|
||||||
|
xi |
|
|
|
|
|||||
6. Выбрав уровень |
значимости |
, по |
таблице |
2 - |
распределения, |
находим квантиль 2,k , где k (m r 1) число степеней свободы, r - число параметров предполагаемого распределения. Если распределение нормальное, то оценивают два параметра (a, ), число степеней свободы k (m 3). Таким же будет число степеней свободы в случае равномерного распределения (оцениваемые параметры a и b ). В случае показательного распределения
оценивается один параметр, следовательно k (m 2).
7. Если эмп2 кр2 , то гипотеза H0 не противоречит опытным данным.
Если эмп2 кр2 , то гипотеза H0 отвергается.
Число опытных данных при использовании критерия 2 должно быть большим, критерий справедлив при n . Достаточно большим должно быть и число наблюдений ni в отдельных интервалах, не менее 5-10. Если ni в отдельных интервалах мало, то следует объединить интервалы.
27
Пример 13.
В результате эксперимента получены данные, записанные в виде статистического ряда:
|
|
|
|
|
|
|
|
|
|
Таблица 9 |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
44,8 |
46,2 |
45,6 |
44,0 |
46,4 |
|
45,2 |
|
46,7 |
45,4 |
45,3 |
46,1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
44,3 |
45,3 |
45,6 |
46,7 |
44,5 |
|
46,0 |
|
45,7 |
45,0 |
46,4 |
45,9 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
44,4 |
45,4 |
46,1 |
43,4 |
46,5 |
|
45,9 |
|
43,9 |
45,7 |
47,1 |
44,9 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
43,8 |
45,6 |
45,2 |
46,4 |
44,2 |
|
46,5 |
|
45,7 |
44,7 |
46,0 |
45,8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
44,3 |
45,5 |
46,7 |
44,9 |
46,2 |
|
46,7 |
|
44,6 |
46,0 |
45,4 |
45,0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
45,4 |
45,3 |
44,1 |
46,6 |
44,8 |
|
45,6 |
|
43,7 |
46,8 |
45,2 |
46,1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
44,5 |
45,4 |
45,1 |
46,2 |
44,2 |
|
46,4 |
|
45,7 |
43,9 |
47,2 |
45,0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
43,9 |
45,6 |
44,9 |
44,5 |
46,2 |
|
46.7 |
|
44,3 |
46,1 |
47,7 |
45,8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
45,6 |
45,2 |
44,2 |
46,0 |
44,7 |
|
46,5 |
|
43,5 |
45,4 |
47,1 |
44,0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
46,2 |
44,2 |
45,5 |
46,0 |
45,7 |
|
46,4 |
|
44,6 |
47,0 |
45,2 |
46,9 |
|
|
|
|
|
|
|
|
|
|
|
|
||
Приняв в качестве нулевой |
гипотезу |
H0: |
генеральная |
|
||||||||
совокупность, из которой извлечена выборка, |
подчинена |
|||||||||||
нормальному закону распределения, |
проверить её по критерию 2 |
|||||||||||
при уровне значимости 0,01. |
|
|
|
|
|
|
|
28
Решение:
Составляем вариационный ряд:
Таблица 10
43,4 |
43,5 |
43,7 |
43,8 |
43,9 |
43,9 |
43,9 |
44,0 |
44,0 |
44,1 |
|
|
|
|
|
|
|
|
|
|
44,2 |
44,2 |
44,2 |
44,3 |
44,3 |
44,3 |
44,4 |
44,5 |
44,5 |
44,5 |
|
|
|
|
|
|
|
|
|
|
44,6 |
44,6 |
44,7 |
44,7 |
44,8 |
44,8 |
44,8 |
44,9 |
44,9 |
44,9 |
|
|
|
|
|
|
|
|
|
|
45,0 |
45,0 |
45,1 |
45,2 |
45,2 |
45,2 |
45,2 |
45,2 |
45,3 |
45,3 |
|
|
|
|
|
|
|
|
|
|
45,3 |
45,4 |
45,4 |
45,4 |
45,4 |
45,4 |
45,4 |
45,5 |
45,5 |
45,6 |
|
|
|
|
|
|
|
|
|
|
45,6 |
45,6 |
45,6 |
45,6 |
45,7 |
45,7 |
45,7 |
45,7 |
45,7 |
45,7 |
|
|
|
|
|
|
|
|
|
|
45,8 |
45,8 |
45,9 |
45,9 |
46,0 |
46,0 |
46,0 |
46,0 |
46,0 |
46,0 |
|
|
|
|
|
|
|
|
|
|
46,1 |
46,1 |
46,1 |
46,1 |
46,2 |
46,2 |
46,2 |
46,2 |
46,2 |
46,4 |
|
|
|
|
|
|
|
|
|
|
46,4 |
46,4 |
46,4 |
46,4 |
46,5 |
46,5 |
46,5 |
46,6 |
46,7 |
46,7 |
|
|
|
|
|
|
|
|
|
|
46,7 |
46,7 |
46,7 |
46,8 |
46,9 |
47,0 |
47,1 |
47,1 |
47,2 |
47,7 |
|
|
|
|
|
|
|
|
|
|
|
m |
(n |
i |
n' )2 |
|
Для вычисления эмп2 |
|
|
i |
составим таблицу 11. |
|
|
|
ni' |
|||
|
i 1 |
|
|
|
Для заполнения столбцов 1,2 и 7 таблицы 11 (подробно их
заполнение рассмотрено в примере 1) вычислим
h |
47,7 43,96 |
|
3,74 |
|
0,56. |
|
1 log 200 |
1 3,322lg200 |
|||||
|
|
|
||||
|
2 |
|
|
|
|
29
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 11 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
6 |
|
|
|
|
|
|
|
|
1 |
2 |
|
3 |
|
4 |
|
|
5 |
|
7 |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Середи- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Частота интервала |
|
||||||
|
|
|
|
на |
|
|
|
|
|
|
|
|
|
|||||
|
Границы |
|
Нормирован- |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
интер- |
ные границы |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
теорети |
|
|
|
|
||||||||
i |
интер- |
|
вала |
интервала |
z |
|
|
|
|
ческая |
|
|
|
эмпи- |
|
|||
|
вала |
|
xiс |
|
z |
|
i |
|
zi 1 |
|
( zi 1 |
|
|
|
ричес- |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
xi xi 1 |
|
xi xi |
|
i |
|
|
|
|
|
|
|
|
|
кая |
|
||
|
|
|
xi x |
|
|
|
|
|
|
zi )*N |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
ni |
|
||||
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
2 |
В |
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
n 'i |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
1 |
43,40 |
– 43,96 |
43,68 |
− 1,31 |
-0,5000 |
-0,4049 |
9,51 |
|
|
7 |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
2 |
43,96 |
– 44,52 |
44,24 |
-1,31 − 1,02 |
-0,4049 |
-0,3461 |
|
5,88 |
|
|
13 |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
3 |
44,52 |
– 45,08 |
44,80 |
-1,02 − -0,41 |
-0,3461 |
-0,1591 |
|
18,70 |
|
|
12 |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
4 |
45,08 |
– 45,64 |
45,36 |
-0,41 − 0,21 |
-0,1591 |
0,0832 |
|
24,23 |
|
|
22 |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
5 |
45,64 |
– 46,20 |
45,92 |
0,21 − 0,82 |
0,0832 |
0,2939 |
|
21,07 |
|
|
25 |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
6 |
46,20 |
– 46,76 |
46,48 |
0,82 − 1,44 |
0,2939 |
0,4251 |
|
13,12 |
|
|
14 |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
7 |
46,76 – 47,7 |
47,04 |
1,44 − |
0,4251 |
0,5000 |
|
7,49 |
|
|
7 |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
– |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
– |
|
– |
|
100 |
|
|
|
100 |
|
||||
i |
|
|
|
|
|
– |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Используя данные столбцов 1,2,7, находим выборочное среднее:
x1 k xiсni
n i 1
|
|
|
|
|
DВ |
1 |
k |
|
|
и выборочную дисперсию: |
xi x 2 ni . |
|
|||||||
|
|
|
|
|
|
n i 1 |
|
|
|
получаем: |
x |
4544,96 |
|
45,45 |
, DВ |
206653 |
45,452 |
0,84, |
|
|
100 |
||||||||
|
100 |
|
|
|
|
|
|
||
В DВ |
0,91. |
|
|
|
|
|
|
30
Далее заполняем столбцы 3,4,5,6 и рассчитываем
|
2 |
|
(7 9,51)2 |
|
(13 5,88)2 |
|
(12 18,70)2 |
|
(22 24,23)2 |
|
(25 21,07)2 |
|
|||
эмп |
|
9,51 |
|
5,88 |
18,70 |
24,23 |
21,07 |
||||||||
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
||||||
|
(14 13,12)2 |
(7 7,49)2 |
0,6625 8,6215 2,4005 0,2052 0,7330 0,0590 |
||||||||||||
|
13,12 |
|
|
|
7,49 |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
0,0321 12,7138 |
|
|
|
|
|
|
|
|
|
|
По |
таблице |
распределения 2 |
находим |
кр2 , соответствующее |
||
уровню |
значимости |
0,01 |
и |
числу |
степеней свободы |
|
k m 3 7 3 4, кр2 |
13,3. |
|
|
|
||
Так |
как эмп2 |
кр2 , |
то гипотеза |
H0 |
нормальном распределении |
генеральной совокупности не противоречит опытным данным.
4.5. Критерий А.Н. Колмогорова
Вводят в рассмотрение функцию, которая называется статистикой Колмогорова
Dn max Fn (x) F0 (x)
x
Fn (x) nnx , где nx - сумма наблюдаемых значений меньших x .
F0 (x) nnx' , где nx' - сумма теоретических значений меньших x
Пример 14.
Используя данные примера 13, и приняв в качестве нулевой
гипотезу H0: генеральная совокупность, из которой извлечена
выборка, подчинена нормальному закону распределения, проверить её по критерию Колмогорова. Уровень значимости 0,01.
Решение:
Воспользуемся результатами вычислений примера 13.