- •Содержание заданий контрольной работы
- •Построить корреляционное поле и предложить гипотезу о связи исследуемых факторов, сделать предположения о наличии выбросов;
- •1.2 Определить коэффициенты корреляции;
- •1.3 Оценить статистическую надежность и значимость вычисленных коэффициентов корреляции
- •Сделать итоговые выводы.
- •1.1.1 Расчет в Excel по формулам, реализующим метод наименьших квадратов;
- •Расчет с помощью функции линейн с расшифровкой полученных результатов;
- •1.1.4 Инструмент «Регрессия»
- •1.2 Оценить статистическую надежность результатов регрессионного моделирования для чего построить доверительные интервалы коэффициентов регрессии по t-критерию Стьюдента
- •Оценить качество уравнения регрессии с помощью средней ошибки аппроксимации.
- •1.5 Дать с помощью общего (среднего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
- •Сделать итоговые выводы.
1.2 Оценить статистическую надежность результатов регрессионного моделирования для чего построить доверительные интервалы коэффициентов регрессии по t-критерию Стьюдента
Определение коэффициента корреляции
Для определения коэффициента корреляции, определим дисперсию:
320,3118-17,52=14,06182
29566,27273-169,36362=882,2314
Определим коэффициент корреляции:
.-1,69*
=
-0,21393
Данный коэффициент корреляции характеризует низкую тесноту связи
Определим коэффициент детерминации:
0,045764
Это значит, что 4% вариации "у" объясняется вариацией фактор "х".
Определение статистической значимости уравнения регрессии с помощью F-критерия Фишера
Определим F- критерий Фишера:
= 0,43163
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы 1 и (11-2)=9 составляет Fтаб = 5,12.
Имеем F< Fтаб, следовательно уравнение регрессии не значимо, статистически не надежно.
Оценка статистической значимости параметров регрессии с помощью t-статистики Стьюдента
Табличное значение t-критерия для числа степеней свободы df=n-2=11-2=9 и уровня значимости α=0,05 составит tтабл=2,2622.
Определим стандартные ошибки:
46,15977
2,579153
0,325617
Тогда
4,311477
-0,65699
-0,65699
Фактические значения t-статистики превосходят табличное значение:
ta>ttab, tb< ttab, tr< ttab поэтому параметр а статистически значим, а b, и rxy статистически не значимы.
Рассчитаем доверительные интервалы для параметров регрессии а и b. Для этого определим предельную ошибку для каждого показателя:
104,4226
5,83456
Получаем доверительные интервалы:
199,02±104,4226 и 94,59≤а≤303,44
-1,69±5,83456 и -7,53≤b≤4,14
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью р=1-α=1-0,05=0,95 параметры а и b, находятся в указанных границах, не принимают нулевых значений, т.е. являются статистически значимыми и существенно отличны от нуля.
Оценить качество уравнения регрессии с помощью средней ошибки аппроксимации.
Подставляя
в уравнение регрессии фактические
значения x, определим теоретические
(расчетные) значения
(таблица
1) и найдем величину средней ошибки
аппроксимации (
):
=
1,68799304=15,34539
Так
как допустимый предел значений
более 8-10%, качество модели по данному
показателю не удовлетворительное.
Однако средняя ошибка аппроксимации
не является главным критерием оценки
значимости модели.
1.5 Дать с помощью общего (среднего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
Определим коэффициент эластичности
,
В случае линейной регрессии
.
где
-
1,69
-
1,69*17,5/169,3636=-0,17509
Следовательно при изменении фактора"х" на 1% от своего среднего значения, "у" изменится на 0,17509% от своей средней величины.
В случае полиномиальная аппроксимация со степенью 2
Y= -0,6367x2 +20,931х+7,0255
где 2*-0,6367х+20,931
=(2*(-0,6367)*17,5+20,931)* 17,5/169,3636=-0,13985
Следовательно при изменении фактора"х" на 1% от своего среднего значения, "у" изменится на 0,13985% от своей средней величины, что лучше предыдущего результата.
