- •I. Теоретическая часть
- •II. Расчетно-графическая часть
- •1. Построение вариационного ряда
- •3. Определение расчетных статистических характеристик (мер положения, рассеивания и характеристики формы кривой распределения): а) определение мер положения:
- •4. Графическое изображение вариационных рядов
- •5. Изучение формы кривой распределения
- •6. Проверка статистических гипотез
- •8. Определение объема выборки
- •III. Порядок выполнения расчетно-графической Работы
- •1.Построение вариационного ряда (Xmin - … - Xmax)
- •2. Группировка вариационного ряда
- •3. Определение мер положения, рассеивания и параметров формы кривой распределения:
- •4. Изучение формы распределения
- •5. Графическое представление сгруппированных рядов данных натурных наблюдений
- •6. Проверка статистических гипотез:
- •7. Построение доверительных интервалов
- •8. Определение объема выборки
- •Приложение 1
- •Приложение 2
- •Приложение 3
- •Приложение 4
5. Графическое представление сгруппированных рядов данных натурных наблюдений
Для графического изображения рядов распределения строится гистограмма . Результаты расчетов сводим в таблицу 3.
Таблица 3
Определение ординат эмпирических кривых распределений
|
Границы интервалов, мг/л |
Частота, ni |
Относительная частота, nотн |
Приведенная частота, nпр |
||||
1 |
2 |
3 |
4 |
5 |
||||
1 |
18,86 — 22,93 |
1 |
0,05 |
0,012 |
||||
2 |
22,93 — 27,00 |
5 |
0,25 |
0,06 |
||||
3 |
27,00 — 31,07 |
7 |
0,35 |
0,086 |
||||
4 |
31,07 — 35,14 |
6 |
0,30 |
0,07 |
||||
5 |
35,14 — 39,21 |
1 |
0,05 |
0,012 |
nотн — относительная частота определяется отношением эмпирической частоты к объему выборки и характеризует вероятность появления случайной величины в каждом интервале.
nпр — приведенная частота или плотность распределения случайной величины в заданном интервале:
Гистограмма
6. Проверка статистических гипотез:
а) проверка выборок на однородность;
Вопросы удлинения рядов данных натурных наблюдений преследует цель корректировки статистических параметров. Для проверки выборок в сходстве формирования случайных величин используют статистические критерии однородности. Как правило, анализируются выборки попарно. Результатом статистического анализа на однородность является объединение двух выборок в одну или отрицание однородности между сравниваемыми совокупностями. В качестве примера использования статистических критериев однородности при практических расчетах студенты обмениваются выборками и проверяют их на однородность. Для расчетов используются критерии однородности: параметрический — критерий Фишера; непараметрический — критерий Вилкоксона.
Критерий Фишера основан на равенстве дисперсий выборок распределенных приближено нормально. Расчетное значение критерия Фишера определяется по следующей формуле:
|
, |
(23) |
причем необходимо выполнение условия Dx > Dy, где
Dx — дисперсия выборки X (допустим, что выполняется вышеприведенное условие);
Dy — дисперсия выборки Y (по условию меньше дисперсии выборки X).
Для определения области допустимых значений необходимо задаться уровнем значимости и числом степеней свободы (для практических расчетов уровень значимости принимаем равным 0,05, число степеней свободы рассчитывается по следующей зависимости:
).
Используя таблицы F-распределения (Приложение 2), определяется критическое значения критерия в зависимости от выбранного уровня значимости и числа степеней свободы. Если выполняется условие, при котором расчетное значение критерия Фишера не превосходит критическое, то можно предположить, что наши ряды однородны и сравниваемые выборки можно объединить в один ряд.
Из непараметрических критериев однородности можно выделить статистический критерий однородности Вилкоксона. Расчеты проводим в следующем виде и последовательности: значения обеих выборок (X и Y) упорядочиваются вместе по величине, с учетом выборки из которой взято значение. Сумма инверсий определяется следующим образом: по построенному вариационному ряду из двух сравниваемых выборок проводят подсчет инверсий (инверсией считается величина, характеризующаяся следующим неравенством xi > yi) т. е. определяют, сколько значений Y-выборки находится перед каждым значением X-выборки. Расчетное значение критерия Вилкоксона определяется по формуле:
|
. |
(24) |
Критическое значение статистического критерия однородности Вилкоксона определяется по таблицам или с помощью формулы:
|
, |
(25) |
где коэффициент Z определяется по формуле:
|
2Ф0(Z)=1-, |
(26) |
где Фо — функция нормированного и центрированного закона нормального распределения (Приложение 1).
Допустим, необходимо сравнить две выборки на принадлежность их одной генеральной совокупности:
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Х |
18,86 |
24,24 |
24,50 |
24,55 |
25,14 |
26,71 |
27,03 |
28,20 |
28,42 |
28,74 |
№ |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
Х |
28,87 |
30,02 |
31,03 |
31,19 |
31,91 |
32,91 |
33,49 |
34,06 |
34,27 |
39,21 |
|
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
Y |
18.56 |
23.62 |
23.64 |
26.06 |
26.26 |
28.17 |
28.27 |
28.44 |
28.51 |
29.53 |
|||
|
№ |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
|||
|
Y |
34.78 |
34.84 |
35.52 |
35.59 |
36.66 |
37.03 |
37.77 |
38.02 |
38.43 |
42.85 |
|||
|
|
|
||||||||||||
|
|
|
|
|||||||||||
Dx = 15,73 |
|
Dy = 32,77
|
|
Критерий Фишера:
.
Область допустимых значений определяется в зависимости от уровня значимости и числа степеней свободы: = 0,05; m1 = 19; m2 = 19. По таблицам F-распределения (Приложение 2) определяем, что критическое значение критерия Фишера равно 2,15. Полученное расчетное значение критерия Фишера не превышает критического. Исходя из этого можно сделать вывод, что оно находится в области допустимых значений, и нулевая гипотеза подтверждается, а это значит, что сравниваемые выборки однородны (принадлежат одной генеральной совокупности), и их можно объединить в одну. Данное предположение (о принадлежности сравниваемых выборок одной генеральной совокупности) проверим непараметрическим критерием однородности Вилкоксона. Для этого необходимо провести следующие действия:
1) Величины обеих выборок располагаются в порядке возрастания с учетом того из какой выборки взято значение. Используя рассматриваемый пример получим:
18,56(y);18,86(х);23,62(y);23,64(y);24,24(х);24,50(х);24,55(x);25,14(x);26,06(y);26,26(y);26,71(х);27,03(x);28,17(y);28,20(x);28,27(y);28,42(x);28,44(y);28,51(y);28,74(x);28,87(x);29,53(y);30,02(x);31,03(x);31,19(x);31,91(x);32,91(x);33,49(x);34,06(x);34,27(x);34,78(y);34,84(y);35,52(y);35,59(y);36,66(y);37,03(y);37,77(y);38,02(y);38,43(y);39,21(x);42,85(y)
U = 1 + 3 + 3 + 3 + 3 + 5 + 5 + 6 + 7 + 9 + 9 + 10 +10 + 10 + 10 + 10 + 10 + 10 + 10 + 19 = 153;
2) По формулам (23, 24) определяются расчетное и критическое значение критерия Вилкоксона:
; ;
расчетное значение критерия Вилкоксона равно Bрас = 47.
; ;
3) По таблицам нормированной и центрированной кривой нормального распределения (Приложение 1) определяем аргумент по значению функции (Z = 1,96), критическое значение равно Bкр = 72,46.
Расчетное значение критерия Вилкоксона оказалось меньше критического. С учетом того, что критическая область данного критерия правосторонняя, принимаем нулевую гипотезу, которая подтверждает однородность сравниваемых совокупностей.
б) Использование критериев согласия преследует цель поиска закона распределения генеральной совокупности, которой принадлежит данная анализируемая выборка. Расчеты проводятся для исходной выборки (X) при N = 20. Цель расчетов заключается в следующем: с помощью критерия согласия Пирсона проверить принадлежность эмпирического материала нормальной кривой распределения (кривая Гаусса). Основные положения по кривой распределения приведены выше.
Как и при проверке однородности выдвигается нулевая гипотеза, но в данном случае она утверждает согласие значений выборки со значениями нормальной кривой распределения, т. е. при увеличении данных натурных наблюдений до бесконечности, распределение случайных чисел отвечает выбранному закону распределения. Расчет по критерию Пирсона основан на определении теоретической частоты в эмпирических интервалах, и если эмпирическая частота и теоретическая отличаются незначительно, то принимается нулевая гипотеза при выбранном уровне значимости и числе степеней свободы. Расчетная формула статистического критерия согласия Пирсона или 2 имеет следующий вид:
|
, |
(27) |
где К — количество интервалов;
ni — эмпирическая частота;
nt — теоретическая частота.
Для того, чтобы использовать аналитические законы распределения, необходимо знать область возможных значений случайных величин (для нормально распределенной случайной величины область возможных значений определяется интервалом (-; +)). Расчеты сводим в таблицу 4. При этом необходимо выполнить следующее условие: для граничных классов NPi > 1, а для внутренних — NPi > 5. Если условие не соблюдается, то классы необходимо укрупнять.
Таблица 4
Определение выборочного значения 2рас на согласие эмпирического распределения с нормальным законом распределения
N |
аi |
ni |
bi |
Фo(bi) |
Pi |
NPi |
ni-NPi |
2рас(i) |
||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
||
0 |
- - 18,86 |
0 |
- |
-2,61 |
-0,50 |
-0,495 |
0,005 |
0,1 |
-0,10 |
0,1 |
1 |
18,86 - 22,93 |
1 |
-2,61 |
-1,59 |
-0,495 |
-0,44 |
0,055 |
1,1 |
-0,10 |
0,01 |
2 |
22,93 - 27,00 |
5 |
-1,59 |
-0,56 |
-0,44 |
-0,21 |
0,23 |
4,6 |
0,40 |
0,03 |
3 |
27,00 - 31,07 |
7 |
-0,56 |
0,46 |
-0,21 |
0,18 |
0,39 |
7,8 |
-0,80 |
0,08 |
4 |
31,07 - 35,14 |
6 |
0,46 |
1,49 |
0,18 |
0,43 |
0,25 |
5,0 |
1,00 |
0,20 |
5 |
35,14 - 39,21 |
1 |
1,49 |
2,51 |
0,43 |
0,494 |
0,064 |
1,28 |
-0,28 |
0,06 |
6 |
39,21 - + |
0 |
2,51 |
+ |
0,494 |
+0,5 |
0,006 |
0,12 |
-0,12 |
0,12 |
|
|
|
|
|
1,00 |
20,00 |
0,00 |
0,6 |
Условные обозначения:
ai — границы интервалов;
ni — эмпирическая частота;
bi — нормированная и центрированная случайная величина:
|
, |
(28) |
Фо(bi) — значение функции нормального закона распределения на границах интервалов определяется по таблицам (Приложение 1);
Pi — теоретическая вероятность попадания случайной величины в заданный интервал, Pi = Фо(bi) - Фо(bi-1);
N — объем выборки, N = 20;
NPi — теоретическая частота.
Порядок определения табличных значений нормированного и центрированного нормального закона распределения. В таблице приложение 1 приведены значения функции в зависимости от аргумента Х. Столбец Х соответствует целому значению и десятой доли, строка –это сотая часть аргумента. Обратим внимание на нулевой столбец, он шире всех остальных за счет первых двух цифр (0,0; 0,1; 0,2; и т.д.). Это начало искомого значения функции. Трехзначное значение в столбиках – «хвост» который увеличивается по строке. Для определения значения функции необходимо по аргументу найти соответственное трехзначное значение и из «0» столбика подставить начало величины. Округлить полученное значение до двух знаков после запятой. Если аргумент отрицательная величина, то и перед значением функции должен быть поставлен знак минус.
В результате проведенных расчетов получили искомое расчетное значение критерия Пирсона 2рас = 0,6.
Критическое значение критерия Пирсона определяется по таблицам (Приложение 3) или по формуле:
|
, |
(29) |
где m — число степеней свободы, m = K – 1;
Z2 — коэффициент, определяемый по формуле:
|
, |
(30) |
, .
Учитывая это, критическое значение критерия Пирсона равно:
.
Критическое значение критерия Пирсона можно определить по таблицам 2-распределения в Приложении 3.
Если расчетное значение не превышает критического на выбранном уровне значимости нулевая гипотеза принимается, что подтверждает принадлежность исследуемой выборки нормальному закону распределения.