- •Задание №1
- •Решение:
- •3. Оценка статистической значимости по критерию Фишера.
- •4. Оценка статистической значимости по критерию Стьюдента.
- •Задание №2
- •Решение:
- •3. Оценка статистической значимости по критерию Фишера.
- •4. Оценка статистической значимости по критерию Стьюдента.
- •1Вводим данные в таблицу
- •3. Рассчитаем коэффициент корреляции:
- •5. Оценка статистической значимости по критерию Фишера.
- •Оценка статистической значимости по критерию Фишера.
3. Рассчитаем коэффициент корреляции:
-по формуле:
-с помощью
статистической функции КОРРЕЛ-
При таком значении коэффициент корреляции линейная связь между величинами x и y практически отсутствует. Поэтому вышеприведенное уравнение не имеет смысл, т.е. средняя заработная плата и выплаты социального характера по районам не связаны с потребительскими расходами.
4. Средняя ошибка аппроксимации рассчитывается по формуле:
.
Полученное значение
средняя ошибка аппроксимации
%.
Это означает, что в среднем, расчетные
значения модели отклоняются от фактических
значений на 10,9%, что подтверждает низкое
качество модели.
Коэффициент детерминации, рассчитанный с помощью функции ЛИНЕЙН, равен R2 = 0,001687, что также не подтверждает связь между средней заработной платой и выплатами социального характера по районам с потребительскими расходами. Т.е. точность подбора уравнения регрессии составляет в среднем 0,17%
5. Оценка статистической значимости по критерию Фишера.
Выдвигаем нулевую гипотезу о статистически незначимом отличии показателей от нуля: a0=а1=rxy=0.
Табличное значение критерия Фишера для заданного уровня значимости и числа степеней свободы ν=14 (ν=n-m-1, где n=16 – число измерений, m=1 – число независимых переменных) равно Fтабл = 4,60.
Если Fтабл > Fфакт , то нулевая гипотеза не отвергается. В данном случае Fфакт =0,024, а Fтабл = 4,60. Т.е. полученный результат статистически не значим.
Сравниваем фактические значения t-критерия с табличным значением:
=2,145
;
;
.
Нулевую гипотезу для параметров принимаем. Их нельзя считать статистически значимыми и надежными.
Поскольку модель отвергается, рассчитывать доверительные интервалы для параметров регрессии не имеет смысла.
Выводы:
Средняя заработная плата и выплаты социального характера по регионам не связаны с прожиточным минимумом. Поскольку модель отвергнута, не имеет смысл рассчитывать по ней прогнозные значения.
Задание №4
ЗАДАЧА:
Представлена сравнительная таблица данных:
- денежные доходы на душу населения
- потребительские расходы на душу населения.
-
Район
потр.расх. на д/н. Х
ден.доходы на д/н. У
Бурятия
524
408
Тыва
371
249
Хакасия
453
253
Краснодарский край
1006
580
Иркутская обл.
997
651
Усть - Ордынский авт.окр.
217
139
Читинская обл.
486
322
Саха
1989
899
Еврейский авт.окр.
595
330
Чукотский авт.окр.
1550
446
Приморский край
937
642
Хабаровский край
761
542
Амурская обл.
767
504
Камчатская обл.
1720
861
Магаданская обл.
1735
707
Сахалинская обл.
1052
557
ТРЕБУЕТСЯ:
Рассчитать параметры уравнения линейной регрессии.
Оценить статистическую надежность регрессионного моделирования с помощью критерия Фишера.
Оценить статистическую надежность регрессионного моделирования с помощью t-критерия Стьюдента.
Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 7% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости =0,05.
Оценить полученные результаты и сделать выводы.
РЕШЕНИЕ:
1.1. Вводим данные в таблицу Excel:
потр.расходы на д/н. Х |
ден.доходы на душу нас. У |
yi |
(y-yi)/y |
|(y-yi)/y| |
|(y-yi)/y|*100 |
524 |
408 |
356,146 |
0,127 |
0,127 |
12,709 |
371 |
249 |
302,143 |
-0,213 |
0,213 |
21,343 |
453 |
253 |
331,086 |
-0,309 |
0,309 |
30,864 |
1006 |
580 |
526,273 |
0,093 |
0,093 |
9,263 |
997 |
651 |
523,097 |
0,196 |
0,196 |
19,647 |
217 |
139 |
247,787 |
-0,783 |
0,783 |
78,264 |
486 |
322 |
342,733 |
-0,064 |
0,064 |
6,439 |
1989 |
899 |
873,234 |
0,029 |
0,029 |
2,866 |
595 |
330 |
381,206 |
-0,155 |
0,155 |
15,517 |
1550 |
446 |
718,284 |
-0,611 |
0,611 |
61,050 |
937 |
642 |
501,919 |
0,218 |
0,218 |
21,819 |
761 |
542 |
439,798 |
0,189 |
0,189 |
18,857 |
767 |
504 |
441,916 |
0,123 |
0,123 |
12,318 |
1720 |
861 |
778,287 |
0,096 |
0,096 |
9,607 |
1735 |
707 |
783,582 |
-0,108 |
0,108 |
10,832 |
1052 |
557 |
542,509 |
0,026 |
0,026 |
2,602 |
1.2. Рассчитаем параметры уравнения y=a0+a1x с помощью статистической функции ЛИНЕЙН. Получаем следующую статистику:
а1 |
0,353 |
171,194 |
а0 |
случ.ошибка а1 |
0,0523 |
56,569 |
случ.ошибка а0 |
R2 |
0,765 |
109,343 |
S2 |
Fфакт. |
45,598 |
14 |
число степеней свободы |
|
545169,843 |
167383,907 |
|
Уравнение парной линейной регрессии имеет вид:
y=171,19+0,35х
Экономический смысл уравнения: при увеличении потребительских расходов в расчете на душу населения по районам на 1 тыс. руб. – денежный доход на душу населения увеличился в среднем на 0,35 тыс. руб.
2.1. Рассчитаем коэффициент корреляции:
-по формуле: rxy = a*(σx/σy)= 0.35*(171.19/211.03) = 0.29
-с помощью статистической функции КОРРЕЛ-rxy.= 0.29
При таком значении коэффициент корреляции линейная связь между величинами x и y средняя. Поэтому вышеприведенное уравнение имеет смысл, т.е. средняя заработная плата и выплаты социального характера по районам связаны с потребительскими расходами.
2.2. Средняя ошибка аппроксимации рассчитывается по формуле:
.
Полученное значение средняя ошибка аппроксимации A cp=20.87%. Это означает, что в среднем, расчетные значения модели отклоняются от фактических значений на 14,03%, что подтверждает низкое качество модели.
2.3. Коэффициент детерминации, рассчитанный с помощью функции ЛИНЕЙН, равен R2 = 0,70509 что также подтверждает связь между денежными доходами и потребительскими расходами населения. Т.е. точность подбора уравнения регрессии составляет в среднем 70,5%.
