Вариант второй Задача №1
По территориям Южного федерального округа приводятся статистические данные за 2006 год:
Территории федерального округа |
Валовой региональный продукт, млрд руб., Y |
Среднегодовая численность занятых в экономике, млн чел., X |
1. Республика Адыгея |
5,1 |
0,157 |
2. Республика Дагестан |
13,0 |
0,758 |
3. Республика Ингушетия |
2,0 |
0,056 |
4. Кабардино-Балкарская Республика |
10,5 |
0,287 |
5. Республика Калмыкия |
2,1 |
0,119 |
6. Карачаево-Черкесская Республика |
4,3 |
0,138 |
7. Республика Северная Осетия – Алания |
7,6 |
0,220 |
8. Краснодарский край |
109,1 |
2,033 |
9. Ставропольский край |
43,4 |
1,008 |
10. Астраханская обл. |
18,9 |
0,422 |
11. Волгоградская обл. |
50,0 |
1,147 |
12. Ростовская обл. |
69,0 |
1,812 |
Итого, |
335,0 |
8,157 |
Средняя |
27,917 |
0,6798 |
Среднее квадратическое отклонение, |
32,20 |
0,6550 |
Дисперсия, D |
1036,87 |
0,4290 |
Задание:
1. Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X.
2. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.
3. Рассчитайте параметры а1 и а0 парной линейной функции .
4. Оцените тесноту связи с помощью показателей корреляции (ryx ) и детерминации (r2yx), проанализируйте их значения.
5. Надёжность уравнений в целом оцените через F -критерий Фишера для уровня значимости =0,05.
6. По лучшему уравнению регрессии рассчитайте теоретические значения результата ( ), по ним постройте теоретическую линию регрессии и определите среднюю ошибку аппроксимации - ε'ср., оцените её величину.
7. Рассчитайте прогнозное значение результата , если прогнозное значение фактора ( ) составит 1,023 от среднего уровня ( ).
8. Рассчитайте интегральную и предельную ошибки прогноза (для =0,05), определите доверительный интервал прогноза ( ; ), а также диапазон верхней и нижней границ доверительного интервала ( ), оцените точность выполненного прогноза.
Решение:
1. Расположим территории по возрастанию фактора X:
Территории федерального округа |
Среднегодовая численность занятых в экономике, млн. чел., X |
Валовой региональный продукт, млрд. руб., Y |
3. Республика Ингушетия |
0,056 |
2 |
5. Республика Калмыкия |
0,119 |
2,1 |
6. Карачаево-Черкесская Республика |
0,138 |
4,3 |
1. Республика Адыгея |
0,157 |
5,1 |
7. Республика Северная Осетия – Алания |
0,22 |
7,6 |
4. Кабардино-Балкарская Республика |
0,287 |
10,5 |
10. Астраханская обл. |
0,422 |
18,9 |
2. Республика Дагестан |
0,758 |
13 |
9. Ставропольский край |
1,008 |
43,4 |
11. Волгоградская обл. |
1,147 |
50 |
12. Ростовская обл. |
1,812 |
69 |
8. Краснодарский край |
2,033 |
109,1 |
Анализируя полученную таблицу, видим, что при увеличении факторного признака Х (среднегодовой численности занятых в экономике) результативный признак Y (валовой региональный продукт) также растет, значит между рассматриваемыми признаками имеется прямая зависимость.
2. Построим корреляционное поле:
По виду поля корреляции можно сделать вывод о том, что между рассматриваемыми признаками имеется прямая зависимость, а также наиболее близкая форма связи между у и х линейная.
3. Рассчитаем параметры а1 и а0 парной линейной функции , методом наименьших квадратов. Построим вспомогательную таблицу:
№ n/n |
хi |
yi |
хi yi |
хi2 |
yi2 |
|
ei |
ei2 |
Ai |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
1 |
5,1 |
0,157 |
0,8007 |
26,01 |
0,0246 |
0,231 |
-0,074 |
0,0055 |
0,474 |
2 |
13 |
0,758 |
9,854 |
169 |
0,5746 |
0,387 |
0,371 |
0,1379 |
0,490 |
3 |
2 |
0,056 |
0,112 |
4 |
0,0031 |
0,171 |
-0,115 |
0,0131 |
2,045 |
4 |
10,5 |
0,287 |
3,0135 |
110,25 |
0,0824 |
0,338 |
-0,051 |
0,0026 |
0,176 |
5 |
2,1 |
0,119 |
0,2499 |
4,41 |
0,0142 |
0,172 |
-0,053 |
0,0029 |
0,449 |
6 |
4,3 |
0,138 |
0,5934 |
18,49 |
0,019 |
0,216 |
-0,078 |
0,0060 |
0,563 |
7 |
7,6 |
0,22 |
1,672 |
57,76 |
0,0484 |
0,281 |
-0,061 |
0,0037 |
0,275 |
8 |
109,1 |
2,033 |
221,8 |
11902,81 |
4,1331 |
2,275 |
-0,242 |
0,0585 |
0,119 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
9 |
43,4 |
1,008 |
43,747 |
1883,56 |
1,0161 |
0,984 |
0,024 |
0,0006 |
0,024 |
10 |
18,9 |
0,422 |
7,9758 |
357,21 |
0,1781 |
0,503 |
-0,081 |
0,0065 |
0,191 |
11 |
50 |
1,147 |
57,35 |
2500 |
1,3156 |
1,114 |
0,033 |
0,0011 |
0,029 |
12 |
69 |
1,812 |
125,03 |
4761 |
3,2833 |
1,487 |
0,325 |
0,1056 |
0,179 |
∑ |
335 |
8,157 |
472,2 |
21794,5 |
10,693 |
8,157 |
0 |
0,3440 |
5,015 |
Ср. знач. |
27,92 |
0,68 |
39,35 |
1816,21 |
0,89 |
- |
- |
0,03 |
0,42 |
Находим параметры линейного уравнения по следующим формулам:
и
4. Для оценки тесноты связи вычислим коэффициент парной корреляции:
По значению rxv можно сделать вывод о том, что связь между х и у очень тесная.
Найдем коэффициент детерминации: R2 = г2ху = (0,966)2 = 0,933.
Это означает, что вариация валового регионального продукта на 93,3% объясняется вариацией среднегодовой численности занятых в экономике, а необъясненные факторы составляют 6,7%.
5. Надёжность уравнения в целом оценим через F -критерий Фишера для уровня значимости = 0,05.
Для этого вычислим вначале фактическое значение критерия:
Из таблицы критических значений для критерия Фишера по уровню значимости α = 0,05 и числу степеней свободы k1 = 1 и k2 = n – 1 – 1 = 10 находим Fma6 = 4,96.
В силу того, что F > Fma6 делаем вывод, что уравнение регрессии значимо (адекватно) и исследуемая зависимая переменная у достаточно хорошо описывается включенной в регрессионную модель переменной х.
6. По полученному уравнению регрессии рассчитаем теоретические значения результата ( ) и занесем их в таблицу. По полученным теоретическим значениям построим теоретическую линию регрессии:
Качество модели определяет средняя относительная ошибка аппроксимации:
(%)
В итоге получаем А = 42,0%. В среднем расчетные значения переменной у отклоняются от фактических на 42,0%.
7. Рассчитаем прогнозное значение результата , если прогнозное значение фактора ( ) составит 1,023 от среднего уровня ( ).
Если прогнозное значение х составит:
(млн. чел.)
тогда прогнозное значение у составит:
(млрд. руб.)
Ошибка прогноза составит:
для числа степеней свободы и составит 2,23, тогда предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
.
Доверительный интервал прогноза:
Таким образом, прогнозное значение валового регионального продукта при численности занятых в экономике 0,6954 млн. чел. с вероятностью 95% находится в пределах до 0,5753 млрд. руб.