
9. Оценить стационарность связи.
9.1. Рассчитать коэффициенты корреляции по первой и второй половине совместного периода наблюдений. Расчет вести по форме табл.5.1.
9.2. Проверить статистическую гипотезу о равенстве действительных значений коэффициента корреляции по разным периодам.
10. По уравнению регрессии восполнить пропуски наблюдений в ряду Y.
11. Оценить адекватность модели рассматриваемой связи
Примеры расчетов и построений
1. Исследовать связь значений максимального стока (Y) и средних годовых расходов (X) реки Волга у п. Вязовые за период с 1911 по 1950 г.. Исследование связи проводиться в соответствии с изложенным выше планом.
1. Нанести точки связи Y=f(X) в поле графика в декартовых координатах (рис. П.5.1).
Для построения по оси ординат откладываются значения ряда Y, а по оси абсцисс значения ряда X. При этом по осям Y и X выбирается один из стандартных масштабов (1 : 1, 1 : 2, 1 : 2,5, 1 : 5, 1 : 10, 1 : 20 …). Обычно выбор масштаба определяется размером рисунка и амплитудой колебаний значений Y и X. Кроме того, желательно, чтобы линия связи проходила примерно под углом 450 к оси X или амплитуда разброса точек связи в поле графика была примерно одинакова по осям Y и X.
2. Рассчитать коэффициент корреляции ryx между исходными рядами Y и X.
Расчет коэффициента корреляции производиться в соответствии с формой табл. 5.1. В результате расчетов получаем (табл. П.5.1):
x= 3540, y= 22100, x= 667, y= 7440, ∑δyiδxi = 123566556
В свою очередь по значениям x, y, x, y и сумме ∑δyiδxi, рассчитывается по формуле (5.10) значение коэффициента корреляции:
yx =0,71.
Таблица П.5.1.- Расчёт числовых характеристик и коэффициента корреляции средних годовых (X) и максимальных расходов(Y) : р.Волга - п. Вязовые, 1911 – 1950 г
№ n/n |
xi |
yi |
δxi |
δyi |
iδxi 2 |
δyi 2 |
δyi δxi |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1 |
3490 |
21600 |
-33 |
-222 |
1093 |
49383 |
7346 |
2 |
3490 |
22900 |
-33 |
1078 |
1093 |
1161605 |
-35627 |
3 |
4030 |
22000 |
507 |
178 |
256993 |
31605 |
90123 |
4 |
4680 |
31300 |
1157 |
9478 |
1338520 |
89828272 |
10965262 |
5 |
4920 |
27600 |
1397 |
5778 |
1951454 |
33382716 |
8071235 |
6 |
4140 |
31700 |
617 |
9878 |
380620 |
97570494 |
6094040 |
7 |
3710 |
23300 |
187 |
1478 |
34948 |
2183827 |
276262 |
8 |
3740 |
32000 |
217 |
10178 |
47065 |
103587160 |
2208012 |
9 |
3170 |
30400 |
-353 |
8578 |
124648 |
73578272 |
-3028432 |
10 |
3580 |
25200 |
57 |
3378 |
3243 |
11409383 |
192346 |
11 |
4150 |
26000 |
627 |
4178 |
393059 |
17453827 |
2619235 |
12 |
4000 |
30300 |
477 |
8478 |
227476 |
71872716 |
4043429 |
13 |
3620 |
14600 |
97 |
-7222 |
9398 |
52160494 |
-700154 |
14 |
4520 |
41400 |
997 |
19578 |
993898 |
383289383 |
19517957 |
15 |
4000 |
23100 |
477 |
1278 |
227476 |
1632716 |
609429 |
16 |
4560 |
26200 |
1037 |
4378 |
1075254 |
19164938 |
4539512 |
17 |
4220 |
29900 |
697 |
8078 |
485732 |
65250494 |
5629762 |
18 |
3080 |
12200 |
-443 |
-9622 |
196298 |
92587160 |
4263179 |
19 |
3760 |
32300 |
237 |
10478 |
56143 |
109783827 |
2482651 |
20 |
3140 |
12200 |
-383 |
-9622 |
146732 |
92587160 |
3685846 |
21 |
3000 |
20500 |
-523 |
-1322 |
273587 |
1748272 |
691596 |
22 |
3270 |
13600 |
-253 |
-8222 |
64037 |
67604938 |
2080679 |
23 |
3290 |
27100 |
-233 |
5278 |
54315 |
27854938 |
-1230015 |
24 |
2230 |
13600 |
-1293 |
-8222 |
1671993 |
67604938 |
10631790 |
25 |
2740 |
15700 |
-783 |
-6122 |
613176 |
37481605 |
4794040 |
26 |
2350 |
15400 |
-1173 |
-6422 |
1376059 |
41244938 |
7533623 |
27 |
2610 |
17200 |
-913 |
-4622 |
833670 |
21364938 |
4220346 |
28 |
3630 |
20100 |
107 |
-1722 |
11437 |
2966049 |
-184182 |
29 |
3060 |
12200 |
-463 |
-9622 |
214420 |
92587160 |
4455623 |
30 |
3130 |
15500 |
-393 |
-6322 |
154493 |
39970494 |
2484985 |
31 |
2850 |
12100 |
-673 |
-9722 |
453004 |
94521605 |
6543596 |
32 |
3360 |
17500 |
-163 |
-4322 |
26587 |
18681605 |
704762 |
33 |
4240 |
20300 |
717 |
-1522 |
514009 |
2317160 |
-1091349 |
34 |
3430 |
19900 |
-93 |
-1922 |
8659 |
3694938 |
178873 |
35 |
2560 |
14900 |
-963 |
-6922 |
927476 |
47917160 |
6666485 |
∑= |
126830 |
785600 |
0 |
0 |
15344364 |
1950482222 |
123566556 |
cреднее= |
3540 |
22100 |
|
σ= |
667 |
7440 |
|
3. Рассчитать параметры уравнения регрессии Y=f(X) a и b и уравнения регрессии X=f(Y) - a' и b' соответственно по формулам (5.3 – 5.6):
a = 0,71• 7440 / 667 =7,92; b = 22100 – 7,92 • 3540 = - 5950;
a' = 0,71•667/7440 = 0,064, b'=3540 – 0,063 • 22100 = 2130.
Подставляя значения этих параметров в формулы (5.1) и (5.2) получаем
расчетный вид уравнения регрессии
yi = 7,92хi -5950 , (5.40)
xi = 0,064 yi +2130
4. В поле графика (рис.1) провести линии регрессии Y=f(X) и X=f(Y). Для этого необходимо для каждого уравнения найти координаты, как минимум, двух точек и затем провести через них прямые линии.
В таблице П.5.2 для построения линии регрессии У = f (X) приведены максимальное, минимальное и среднее значения X и соответствующие им значения Y, рассчитанные по уравнению регрессии (5.40). Аналогичные координаты для построения линии регрессии X = f(Y) представлены в таблице П.5.3
Таблица П.5.2.Значения координат линии регрессии Y=f(X)
-
Xmin
2230
Y1
11700
Xcp
3520
Y2
22000
Xmax
4920
Y3
33000
Таблица П.5.3.Рассчет координат линии регрессии X=f(Y).
-
Ymin
12200
X1
2910
Ycp
21600
X2
3510
Ymax
41400
X3
4780
По этим координатам в поле графика с нанесенными ранее точками связи (рис. П.5.1) проведены линии уравнений регрессии.
Рисунок 6.2 – График связи средних годовых (Qср) и максимальных (Qмакс) расходов реки Волга у п. Вязовые (--- линия регрессии Y по X, - - - линия регрессии X по Y, ○○○○○ - точки связи значений Y и X, ■■■■■ – точки связи ранжированных значений Y и X)
5. Рассчитать средние квадратические погрешности параметров уравнений регрессии и их доверительные интервалы.
5.1. Оценка коэффициента корреляции при n>30 и коэффициенте корреляции r > 0,4 производиться с помощью преобразования Фишера. С этой целью по формуле (5.20) с помощью приложения 11 по полученному значению коэффициента корреляции yx =0,71 определяется значение z=0,887. Затем по формуле (5.22) рассчитывается средняя квадратическая погрешность статистики Фишера - σz =0,164 и по формуле (5.23) определяются доверительные границы z при уровне значимости 2α (2α=10%, tα= 1,69).
0,61 < z < 1,17.
Отсюда, переведя верхнюю и нижнюю доверительную границу z по формуле (5.19) в значения коэффициента корреляции, получаем доверительный интервал коэффициента корреляции
0,54 < r < 0,83
Для оценки значимости коэффициента корреляции, учитывая, что выборочное значение коэффициента корреляции больше 0,4 (см. выше), необходимо перейти к преобразованию Фишера. В этом случае проверяется нулевая гипотеза
H0: z = 0. (5.41)
Доверительный интервал этой гипотезы определяется по формуле (5.23). Исходя из этой формулы доверительные границы - zкр, начиная с которых нулевая гипотеза опровергается, определяются по формуле
Zкр = tα σz. (5.42)
В данном случае имеем
z =0,887 , σz = 0,164 , tα=1,96 , Zкр = 0,32.
Таким образом, преобразование Фишера на много превышает доверительные границы нулевой гипотезы об отсутствии связи между рядами Y и X и следовательно нулевая гипотеза о равенстве действительного значения коэффициента корреляции нулю опровергается, то есть связь является значимой.
При определении значимости связи по коэффициенту корреляции нулевая гипотеза определяется относительно коэффициента корреляции
H0: r = 0. (5.43)
В этом случае доверительные границы нулевой гипотезы rk определяется по формуле (5.18).). В этой формуле - средняя квадратическая погрешность коэффициента корреляции - определяется в свою очередь по формуле (5.11),
= (1- 0,712)/ 350,5 = 0,08.
Отсюда, , при уровне значимости 2α = 10% получаем следующее выражение для доверительных границ гипотезы об отсутствии связи (см. формлу 5.13)
/rk / ≥ 1,68 * 0,08≥ 0,14.
Очевидно, что значение выборочного коэффициента корреляции, равного 0,71, намного превышает критическое значение, то есть выходит в критическую область. Поэтому гипотеза об отсутствии связи опровергается с
большой степенью достоверности и коэффициент корреляции является значимым.
Заметим, что последний расчет приводиться лишь как пример, и практического значения не имеет, так как в данном случае, учитывая величину коэффициента корреляции, необходимо использовать преобразование Фишера.
5.2. Для оценки погрешностей расчетов a, a', и b, b' и их доверительных интервалов используются формулы (5.24) – (5.27). Расчет по этим формулам дает следующие результаты
= 1,33, ,= 0,01, = 4570, ,= 54,0.
Подставляя рассчитанные значения в формулы (5.26) и (5.27) получаем следующие значения доверительных интервалов.
5,81≤ a <10,3
0.051≤ a, <0,076
-14200≤ b <1130
2050≤ b <2230
6. Расчет средней квадратической погрешности уравнений регрессии Y=f(X) и X=f(Y), без учета и с учетом и погрешности аппроксимации стохастической связи прямой линией, производиться соответственно по формулам (5.28) и (5.29). При расчетах по первой из названных формул погрешность принимается постоянной, не зависящей от X, и равняется 5240. При расчетах по второй формуле, учитывающей увеличение погрешности с увеличением X, погрешность рассчитывается отдельно для каждого значения Y (табл. П.5.4)
Таблица П.5.4.- Расчёт доверительных границ уравнения регрессии Y по X средних годовых расходов, р. Волга - п. Вязовые
№ |
X |
Y |
Y(x) |
σy(x) |
Доверительные границы |
|
Yв |
Yн |
|||||
2 |
3490 |
21600 |
21691 |
5315 |
30673 |
12709 |
3 |
3490 |
22900 |
21691 |
5315 |
30673 |
12709 |
4 |
4030 |
22000 |
25968 |
5354 |
35016 |
16919 |
5 |
4680 |
31300 |
31116 |
5526 |
40454 |
21777 |
6 |
4920 |
27600 |
33016 |
5621 |
42517 |
23516 |
7 |
4140 |
31700 |
26839 |
5374 |
35920 |
17757 |
8 |
3710 |
23300 |
23433 |
5319 |
32423 |
14444 |
9 |
3740 |
32000 |
23671 |
5321 |
32663 |
14678 |
10 |
3170 |
30400 |
19156 |
5337 |
28176 |
10137 |
12 |
3580 |
25200 |
22404 |
5315 |
31385 |
13422 |
13 |
4150 |
26000 |
26918 |
5376 |
36003 |
17833 |
14 |
4000 |
30300 |
25730 |
5349 |
34770 |
16690 |
15 |
3620 |
14600 |
22720 |
5315 |
31703 |
13737 |
16 |
4520 |
41400 |
29848 |
5471 |
39095 |
20602 |
17 |
4000 |
23100 |
25730 |
5349 |
34770 |
16690 |
18 |
4560 |
26200 |
30165 |
5484 |
39434 |
20897 |
19 |
4220 |
29900 |
27472 |
5390 |
36582 |
18362 |
20 |
3080 |
12200 |
18444 |
5349 |
27484 |
9403 |
22 |
3760 |
32300 |
23829 |
5322 |
32824 |
14834 |
23 |
3140 |
12200 |
18919 |
5341 |
27945 |
9893 |
24 |
3000 |
20500 |
17810 |
5362 |
26873 |
8747 |
25 |
3270 |
13600 |
19948 |
5326 |
28950 |
10947 |
26 |
3290 |
27100 |
20107 |
5325 |
29106 |
11108 |
27 |
2230 |
13600 |
11712 |
5592 |
21162 |
2261 |
28 |
2740 |
15700 |
15751 |
5419 |
24910 |
6592 |
29 |
2350 |
15400 |
12662 |
5544 |
22032 |
3292 |
30 |
2610 |
17200 |
14721 |
5456 |
23942 |
5501 |
32 |
3630 |
20100 |
22800 |
5316 |
31783 |
13816 |
33 |
3060 |
12200 |
18285 |
5352 |
27331 |
9240 |
34 |
3130 |
15500 |
18840 |
5342 |
27868 |
9811 |
35 |
2850 |
12100 |
16622 |
5393 |
25736 |
7508 |
36 |
3360 |
17500 |
20661 |
5320 |
29651 |
11671 |
37 |
4240 |
20300 |
27631 |
5395 |
36748 |
18513 |
38 |
3430 |
19900 |
21216 |
5316 |
30200 |
12231 |
39 |
2560 |
14900 |
14325 |
5471 |
23572 |
5079 |
∑ |
123750 |
771800 |
771850 |
188474,8 |
1090372 |
453327,6 |
По данным табл. 5.4 на рис. 6.1. построены доверительные границы возможных значений Y при заданных значениях X.