
Примеры расчетов и построений
Исследовать связь значений средних годовых расходов р. Оки у г. Калуга (ряд Y) с максимальным стоком р. Оки в этом же створе (ряд X1) и средними годовыми расходами р.Оки у п. Костомарово (ряд X2) за период с 1885 по 1924 г..
Исследование связи проводиться в соответствии с изложенным выше планом.
1. Формирование таблицы исходных данных за совместный период наблюдений.
В таблицу включаются те данные, по которым будет производиться идентификация параметров математической модели множественной корреляции (табл. П.6.1). При этом из таблицы исключаются данные с порядковым номером 1, 11, 21, 31, 40 (данные за 1885, 1895, 1905, 1915, 1924 годы). Эти исключенные данные будут использована для проверки адекватности математической модели на независимом материале
2. Построение в поле декартовых координат графика зависимости Y=f(X1, X2) методом контуров.
В данном случае, по-видимому, более важным фактором является ряд X1. Поэтому при построении графика связи по оси ординат откладываются значения Y, а по оси абсцисс - откладываются значения X1. Подбор масштаба графика по осям абсцисс и ординат проводится в соответствии с рекомендациями, изложенными в предыдущее задании. При нанесении точек (yi,x1i) в поле графика (рис. П.6.1) возле каждой из них выписываются номер интервала, в который попадает соответствующее значение X2.
Для определения номера интервала по ряду X2: находятся минимальное значение расхода - 6 м3/с, максимальное значение - 29,4 м3/с, амплитуда колебаний значений стока (разность между максимальным и минимальным значением ряда) – 23,4 м3/с. Исходя из объема совместного периода наблюдений амплитуда разбивается на три примерно равных интервала: 6 – 13,0 13,1 – 21,0; 21,1 – 29,4. В таблице П.6.1 рядом со значениями X2 в пятой колонке приведены номера интервалов, в которые попадают эти значения.
Затем следует оконтурить точки с одинаковым номером интервала значений X2 и в оконтуренных, пересекающихся или не пересекающихся полях, провести три линии связи для различных интервалов значений X2.
Таблица П.6.1. Данные для идентификации математической модели множественной корреляции (Y- средние годовые расходы р. Оки у г. Калуга, X1 - максимальный сток р. Оки у г. Калуга, X2 - средние годовые расходы р.Оки у п. Костомарово)
Годы |
Y |
X1 |
X2
|
Yр1 |
∆ |
|||
значения |
интервал |
|||||||
1886 |
298 |
4630 |
15,2 |
2 |
275 |
-22 |
||
1887 |
231 |
3040 |
11,3 |
1 |
227 |
-4 |
||
1888 |
392 |
9900 |
22,5 |
3 |
400 |
8 |
||
1889 |
346 |
8860 |
21,6 |
3 |
379 |
33 |
||
1890 |
188 |
3260 |
10 |
1 |
222, |
34 |
||
1891 |
198 |
2160 |
11,2 |
1 |
213 |
15 |
||
1892 |
332 |
5380 |
15,7 |
2 |
290 |
-42 |
||
1893 |
350 |
3230 |
22,9 |
3 |
304 |
-46 |
||
1894 |
240 |
3940 |
10,6 |
1 |
236 |
-4 |
||
1896 |
373 |
8630 |
19,4 |
2 |
362 |
-11 |
||
1897 |
296 |
9180 |
20,9 |
2 |
380 |
84 |
||
1898 |
210 |
3770 |
11,3 |
1 |
238 |
28 |
||
1899 |
281 |
5250 |
17,4 |
2 |
299 |
18 |
||
1900 |
281 |
5860 |
18,7 |
2 |
316 |
35 |
||
1901 |
333 |
5820 |
26,7 |
3 |
367 |
34 |
||
1902 |
382 |
6960 |
15,2 |
2 |
310 |
-72 |
||
1903 |
259 |
3260 |
14,6 |
2 |
252 |
-7 |
||
1904 |
235 |
3990 |
14,2 |
2 |
260 |
25 |
||
1906 |
329 |
2760 |
17,2 |
2 |
261 |
-68 |
||
1907 |
378 |
5330 |
25 |
3 |
349 |
-29 |
||
1908 |
540 |
12600 |
29,4 |
3 |
484 |
-56 |
||
1909 |
389 |
4300 |
13,8 |
2 |
262 |
-127 |
||
1910 |
240 |
2110 |
15,7 |
2 |
242 |
2 |
||
1911 |
219 |
3620 |
11,9 |
1 |
240 |
21 |
||
1912 |
310 |
3660 |
12,2 |
1 |
242 |
-68 |
||
1913 |
261 |
4230 |
13,1 |
2 |
256 |
-5 |
||
1914 |
247 |
2540 |
12 |
1 |
224 |
-23 |
||
1916 |
347 |
5700 |
18,2 |
2 |
311 |
-36 |
||
1917 |
418 |
10100 |
24 |
3 |
413 |
-5 |
||
1918 |
220 |
3560 |
14,4 |
2 |
255 |
35 |
||
1919 |
313 |
6280 |
23,6 |
3 |
354 |
41 |
||
1920 |
258 |
2850 |
18,2 |
2 |
268 |
10 |
||
1921 |
138 |
2300 |
6 |
1 |
183 |
45 |
||
1922 |
184 |
2870 |
20,1 |
2 |
281 |
97 |
||
1923 |
260 |
7340 |
15,6 |
2 |
319 |
59 |
||
Среднее |
294 |
5120 |
16,9 |
|
294 |
0,00 |
||
σ |
81,3 |
2620 |
5,33 |
|
66,8 |
46,3 |
3. Расчет оценок числовых характеристик исходных рядов (математического ожидания и среднего квадратического отклонения).
Расчет производился в табличном процессоре Microsoft Excel (мастер функций, статистические функции: срзнач, стандоткл). Результаты расчета представлены в табл. П.6.1. в конце каждого ряда наблюдений.
4.Расчет и анализ коэффициентов корреляции r0j ( j = 1, 2).
Расчет производился по формуле (6.3) с помощью мастера функций в табличном процессоре Microsoft Excel (мастер функций, статистические функции: коррел). В результате получены следующие значения коэффициентов корреляции:
r01 = 0,76, r02 =0,74,
и их средних квадратических погрешностей
σr01 = 0,072, σr02 = 0,077
Проверка значимости связей Y=f(X1,) и Y=f(X2), выполненная по схеме изложенной в предыдущем задании, показала, что обе связи являются значимыми и, следовательно, оба ряда X1 и X2 являются эффективными предикторами ряда Y.
6. Расчет коэффициента корреляции r12 и анализ связи между рядами X1 и X2 .
Расчет производился по формуле (6.1), как и в предыдущем случае, в табличном процессоре Microsoft Excel (мастер функций, статистические функции: коррел). В результате получены следующие значения: r12 = 0,68, σr12 = 0,091918. Проверка показала, что связь является значимой.
Проверка на наличие дублирующих переменных по формуле Алексеева (6.8) показала, что критическое допустимое значение коэффициента корреляции равно 0,82. Полученное нами значение коэффициента корреляции r12 меньше этого значения, следовательно, переменные X1 и X2 не являются дублирующими и обе могут войти в уравнение регрессии.
7. Расчет оценки сводного коэффициента корреляции – R0.
Расчет производиться по формулам (6.16), (6.17) и (6.18). В результате получаем
D0 = 0,174, D00 = 0,536, R0 = 0,82
7. Расчет оценок коэффициентов веса и вывод расчетного уравнения множественной линейной корреляции.
В начале по формулам (6.13) и (6.14) рассчитываются определители D01 и D02 , а затем по формуле (6.12) коэффициенты веса a1 и a2. В данном случае по приведенным выше значениям средних квадратических отклонений (σy, σ1 , σ2 ) и коэффициентов корреляции (r01, r02, r12) получаем
D00 =0,536 , D01 = 0,257, D02 = 0,224,
a1 = 0,015, a2 = 6,36.
Подставляя эти значения a1 и a2 в формулу (6.5) получаем расчетное уравнение регрессии
δyiр = a1 δx1i + a2 δx2i = 0,01484 δx1i + 6,363 δx2i (6.31)
или, после несложных преобразований, в более простом виде
yiр = 0,01484 x1i + 6,363 x2i +110,34 (6.32)
8. Расчет средних квадратических погрешностей и доверительных интервалов параметров уравнения регрессии при двустороннем уровне значимости α:
- Построение доверительного интервала сводного коэффициента корреляции в данном случае должно производиться на основе преобразования Фишера, так его величина больше, чем 0,3. Схема такого построения изложена в предыдущем задании. В результате расчетов с использованием Microsoft Excel (мастер функций, статистические функции, Фишер) имеем z= 1,163, σz = 0,36, при двустороннем уровне значимости 10% tα = 1,69. Отсюда получаем
0,8757 < z < 1,4503
и затем переводя нижнюю и верхнюю границу доверительного интервала z в значения нижней и верхней границы коэффициента корреляции (мастер функций, статистические функции, Фишеробр), получаем
0,704 < R0 < 0,896.
Очевидно что связь является значимой, так как коэффициент корреляции, равный нулю не входит в доверительный интервал.
Средние квадратические погрешности коэффициентов веса рассчитываются по формуле (6.24). Получаем:
σa1 =0,0043, σa2 = 2,09.
Зная эти значения можно построить доверительный интервал значений весовых коэффициентов (см. формулу 6.27)
0,0076 < a1 <0,2205
2.83 <a2 <9,90
9. По значениям X1 и X2, представленным в табл. П.6.1, рассчитать по уравнению регрессии значения Y – Yр .Сопоставить оценки числовых характеристик исходного и рассчитанного по уравнению регрессии ряда.
Результаты расчетов значений Y – Yр по формуле (6.32) представлены в табл. П.6.1 (6 –я колонка). В табл. П.6.2. представлены числовые характеристики значений исходного ряда (Y ) и ряда рассчитанного по уравнению регрессии ряда (Yр ). Здесь же представлены числовые характеристики остатков или иначе – погрешностей расчетов (отклонений рассчитанных значений от фактических).
Таблица П.6.2. Оценки числовых характеристик исходного и рассчитанного ряда Y
Числовые характеристики |
Исходный ряд, Y |
Рассчитанный ряд, Yр |
Остатки, ∆= Yр - Y |
my |
293,6 |
293,6 |
0 |
σy |
81,3 |
66,9 |
46.3 |
Dу |
6608 |
4466 |
2142 |
10. Построение и анализ графика связи фактических и рассчитанных значений Y. Расчет средней квадратической погрешности и построение доверительного интервала уравнения регрессии Y=f(Yр).
Построение графика зависимости Y=f(Yр) (рис. П.6.2) производиться в соответствии с методикой, изложенной в предыдущем задании.
Расчет доверительного интервала действительных значений Y при данных значениях X производиться по приближенной формуле (6.29), где величина σ∆ определяется по формуле (6.25). В результате расчетов получаем
σ∆ =46,3 и доверительный интервал при двухстороннем уровне значимости 10%
yр - 78,2 < y < yр + 78,2
Полученные значения доверительных границ нанесены в поле графика зависимости Y=f(Yр) (рис. П.6.2). В критическую область связи выходит 3 точки , которые необходимо в дальнейшем проанализировать.