- •Теоретическая часть
- •II. Расчетно-графическая часть
- •4. Графическое изображение кривых распределения.
- •5. Изучение формы кривой распределения.
- •Построение вариационного ряда ( ):
- •3.Определение мер положения, рассеивания и параметров формы кривой распределения
- •4. Изучение формы кривой распределения
- •5. Графическое представление сгруппированных рядов данных натурных наблюдений
- •6. Проверка статистических гипотез.
5. Графическое представление сгруппированных рядов данных натурных наблюдений
Для графического изображения рядов распределения строятся гистограмма и интегральные кривые распределения. Результаты расчетов сводим в таблицу 3.
Таблица 3
Определение ординат эмпирических кривых распределений
N |
Границы интервалов |
Частота
|
Относительная частота, |
Приведённая частота, |
1 |
2 |
3 |
4 |
5 |
1 |
14.59 – 16.79 |
7 |
0.23 |
0.1 |
2 |
16.79 – 18.99 |
3 |
0.1 |
0.05 |
3 |
18.99 – 21.19 |
12 |
0.4 |
0.18 |
4 |
21.19 – 23.39 |
4 |
0.13 |
0.06 |
5 |
23.39 – 25.59 |
1 |
0.03 |
0.01 |
6 |
25.59 – 27.79 |
3 |
0.1 |
0.05 |
nотн – относительная частота определяется отношением эмпирической частоты к объёму выборки и характеризует вероятность появления случайно величины в каждом интервале
nпр – приведённая частота или плотность распределения случайно величины в заданном интервале:
nпр= nотн/h
Гистограмма.
6. Проверка статистических гипотез.
а) Проверка выборок на однородность.
Вопросы удлинения рядов данных натурных наблюдений преследует цель корректировки статистических параметров. Для проверки выборок в сходстве формирования случайных величин используют статистические критерии однородности. Как правило, анализируются выборки попарно. Результатом статистического анализа на однородность является объединение двух выборок в одну или отрицание однородности между сравниваемыми совокупностями. В качестве примера использования статистических критериев однородности при практических расчетах студенты обмениваются выборками и проверяют их на однородность. Для расчетов используются критерии однородности: параметрический — критерий Фишера; непараметрический — критерий Вилкоксона.
Критерий Фишера основан на равенстве дисперсий выборок распределенных приближено нормально. Расчетное значение критерия Фишера определяется по следующей формуле:
причем необходимо выполнение условия D1> D2 , где
D1 — дисперсия выборки X (допустим, что выполняется
вышеприведенное условие);
D2 — дисперсия выборки Y (по условию меньше дисперсии выборки X).
Для определения области допустимых значений необходимо задаться уровнем значимости и числом степеней свободы (для практических расчетов уровень значимости принимаем равным 0,05, число степеней свободы рассчитывается по следующей зависимости:
, ;
Используя таблицы F-распределения, определяется критическое значения критерия в зависимости от выбранного уровня значимости и числа степеней свободы. Если выполняется условие, при котором расчетное значение критерия Фишера не превосходит критическое, то можно предположить, что наши ряды однородны и сравниваемые выборки можно объединить в один ряд.
Из непараметрических критериев однородности можно выделить статистический критерий однородности Вилкоксона. Расчеты проводим в следующем виде и последовательности: значения обеих выборок (Х и Y) упорядочиваются вместе по величине, с учетом выборки из которой взято значение. Сумма инверсий определяется следующим образом: по построенному вариационному ряду из двух сравниваемых выборок проводят подсчет инверсий (инверсией считается величина, характеризующаяся следующим неравенством хi > yi) т. е. определяют, сколько значений У- выборки находится перед каждым значением Х-выборки. Расчетное значение критерия Вилкоксона определяется по формуле:
Критическое значение статистического критерия однородности Вилкоксона определяется по таблицам или с помощью формулы:
где коэффициент Za определяется по формуле:
,
где Ф0 — функция нормированного и центрированного закона нормального распределения.
Допустим, необходимо сравнить две выборки на принадлежность их одной генеральной совокупности:
Х Y
|
18.46 |
|
20.72 |
|
20.93 |
|
21.17 |
|
21.59 |
|
21.95 |
|
21.97 |
|
22.06 |
|
22.22 |
|
22.43 |
|
22.71 |
|
23.07 |
|
24.59 |
|
24.63 |
|
24.72 |
|
24.79 |
|
24.81 |
|
25.16 |
|
25.48 |
|
25.54 |
|
25.58 |
|
26.05 |
|
26.11 |
|
26.33 |
|
26.97 |
|
27.74 |
|
28.31 |
|
29.02 |
|
30.51 |
|
35.56 |
|
14.59 |
|
14.97 |
|
15.23 |
|
15.53 |
|
15.56 |
|
16.34 |
|
16.76 |
|
17.35 |
|
17.47 |
|
18.99 |
|
19.03 |
|
19.31 |
|
19.37 |
|
19.44 |
|
19.55 |
|
19.57 |
|
19.64 |
|
19.79 |
|
20.19 |
|
20.62 |
|
21.06 |
|
21.34 |
|
21.66 |
|
21.78 |
|
22.41 |
|
24.47 |
|
24.75 |
|
25.65 |
|
26.62 |
|
27.77 |
D1 = 10.62 D2 = 9.846
Критерий Фишера:
Область допустимых значений определяется в зависимости от уровня значимости и числа степеней свободы: а = 0,05; m1 = 29; m2 — 29. По таблицам F-распределения определяем, что критическое значение критерия Фишера равно 2,15. Полученное расчетное значение критерия Фишера не превышает критического. Исходя из этого можно сделать вывод, что оно находится в области допустимых значений, и нулевая гипотеза подтверждается, а это значит, что сравниваемые выборки однородны (принадлежат одной генеральной совокупности), и их можно объединить в одну. Данное предположение (о принадлежности сравниваемых выборок одной генеральной совокупности) проверим непараметрическим критерием однородности Вилкоксона. Для этого необходимо провести следующие действия:
Величины обеих выборок располагаются в порядке возрастания с учетом того из какой выборки взято значение. Используя рассматриваемый пример получим:
14.59(х);14.97(х);15.23(х);15.53(x);15.56(x);16.34(х);16.76(х);
17.35(х);17.47(х);18.46(y);18.99(х);19.03(х);19.31(х);19.37(х);
19.44(х);19.55(х);19.57(х); 19.64(х);19.79(х);20.19(х);20.62(х);
20.72(y);20.93(y);21.06(х);21.17(у);21.34(х);21.59(у);21.66(х);
21.78(х);21.95(y);21.97(y);22.06(y);22.22(y);22.41(х);22.43(y);
22.71(у);23.07(у);24.47(х);24.59(у);24.63(у);24.72(у);24.75(х);
24.79(у);24.81(у);25.16(y);25.48(y);25.54(y);25.58(y);25.65(х);
26.05(y);26.11(у);26.33(у);26.62(х);26.97(у);27.74(у);27.77(х);
28.31(у);29.02(у);30.51(y);35.56(y).
u =l + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 3 + 4 + 5 + 5 + 8 + 11 + 14 + 20 + +23+25=129;
По формулам определяются расчетное и критическое значение критерия Вилкоксона:
;
расчетное значение критерия Вижоксона равно Врас = 321.
По таблицам нормированной и центрированной кривой нормального распределения определяем аргумент по значению функции (Za = 1,96), критическое значение равно Вкр = 132.57.
Расчетное значение критерия Вилкоксона оказалось меньше критического. С учетом того, что критическая область данного критерия правосторонняя, принимаем нулевую гипотезу, которая подтверждает однородность сравниваемых совокупностей.
Использование критериев согласия преследует цель поиска закона распределения генеральной совокупности, которой принадлежит данная анализируемая выборка. Расчеты проводятся для исходной выборки (X) при N = 30. Цель расчетов заключается в следующем: с помощью критерия согласия Пирсона проверить принадлежность эмпирического материала нормальной кривой распределения (кривая Гаусса). Основные положения по кривой распределения приведены выше.
Как и при проверке однородности выдвигается нулевая гипотеза, но в данном случае она утверждает согласие значений выборки со значениями нормальной кривой распределения, т. е. при увеличении данных натурных наблюдений до бесконечности, распределение случайных чисел отвечает выбранному закону распределения. Расчет по критерию Пирсона основан на определении теоретической частоты в эмпирических интервалах, и если эмпирическая частота и теоретическая отличаются незначительно, то принимается нулевая гипотеза при выбранном уровне значимости и числе степеней свободы. Расчетная формула статистического критерия согласия Пирсона или х2 имеет следующий вид:
где К— количество интервалов;
ni — эмпирическая частота;
nt — теоретическая частота.
Для того, чтобы использовать аналитические законы распределения, необходимо знать область возможных значений случайных величин (для нормально распределенной случайной величины область возможных значений определяется интервалом (-оо; +оо)). Расчеты сводим в таблицу 4. При этом необходимо выполнить следующее условие: для граничных классов N-Pi > 1, а для внутренних — N-Pi > 5. Если условие не соблюдается, то классы необходимо укрупнять.
Таблица 4
Определение выборочного значения х2рас на согласие эмпирического распределения с нормальным законом распределения.
N |
|
|
|
|
|
|
|
|
||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
||
0 |
-∞ - 14.59 |
0 |
-∞ |
-1.64 |
-0.5 |
-0.45 |
0.05 |
1.5 |
-1.5 |
1.5 |
1 |
14.59 – 16.79 |
7 |
-1.64 |
-0.97 |
-0.45 |
- 0.33 |
0.12 |
3.6 |
3.4 |
3.21 |
2 |
16.79 – 18.99 |
3 |
-0.97 |
-0.29 |
-0.33 |
-0.01 |
0.32 |
9.6 |
-6.6 |
4.54 |
3 |
18.99 – 21.19 |
12 |
-0.29 |
0.38 |
-0.01 |
0.15 |
0.16 |
4.8 |
7.2 |
10.8 |
4 |
21.19 – 23.39 |
4 |
0.38 |
1.06 |
0.15 |
0.36 |
0.2 |
6.3 |
-2.3 |
0.84 |
5 |
23.39 – 25.59 |
1 |
1.06 |
1.73 |
0.36 |
0.46 |
0.1 |
3 |
-2 |
1.33 |
6 |
25.59 – 27.79 |
3 |
1.73 |
2.41 |
0.46 |
0.49 |
0.03 |
0.9 |
2.1 |
4.9 |
7 |
27.79 - +∞ |
0 |
2.41 |
+∞ |
0.49 |
0.5 |
0.01 |
0.3 |
-0.3 |
0.3 |
|
|
|
|
|
|
|
1 |
30 |
0 |
27.42 |
Условные обозначения:
ai — границы интервалов;
ni — эмпирическая частота;
bi — нормированная и центрированная случайная величина:
Ф0(bi) — значение функции нормального закона распределения на границах интервалов определяется по таблицам;
Pi — теоретическая попадания случайной величины в заданный интервал, Pi = Ф0(bi) - Ф0(bi-1);
N—объем выборки, N~ 30;
N-Pi — теоретическая частота.
В результате проведенных расчетов получили искомое расчетное значение критерия Пирсона х2рас =27.42.
Критическое значение критерия Пирсона определяется по таблицам или по формуле:
где т — число степеней свободы, т = К- 1;
Z2a— коэффициент, определяемый по формуле:
,
0.45, Z2a=1.65.
Учитывая это, критическое значение критерия Пирсона равно:
10.81
Если расчетное значение не превышает критического на выбранном уровне значимости нулевая гипотеза принимается, что подтверждает принадлежность исследуемой выборки нормальному закону распределения.
Вывод: условие не соблюдается, принимается альтернативная гипотеза. Наша империческая прямая не согласуется с нормальным распределением. Результаты расчётов не могут быть использованы в дальнейших исследованиях, в частности, для математического моделирования, трансформации загрязняющего вещества в водной или воздушной среде методом Монте-Карло. Необходимо взять для дальнейших исследований другой закон распределения и выполнить расчёты.
Заключение
Мы построили вариационный ряд, сгруппировали данные, графически изобразили ряды. Результаты расчетов могут быть использованы в дальнейших исследованиях, в частности, для математического моделирования трансформации загрязняющего вещества в водной или воздушной среде.