- •Задание к лабораторной работе №1
- •1.Найти корреляционную зависимость между фактором (х) и результирующим признаком (у). Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
- •2. На одном графике построить исходные данные и теоретическую прямую.
- •3. Найти коэффициент вариации.
- •4. Найти коэффициент корреляции.
- •5. Найти коэффициент детерминации.
- •11. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
- •12. Найти доверительный интервал для индивидуальных значений зависимой переменной.
- •13. Найти коэффициент эластичности.
- •14. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков.
- •15. Проверить выполнение предпосылок мнк.
2. На одном графике построить исходные данные и теоретическую прямую.
2.1. Построим точечный график по исходным данным.

Получили поле корреляции – зависимость, изображенную графическими точками на координатной плоскости (диаграмму рассеяния).
Из
поля корреляции можно сделать вывод о
связи между
количеством
удобрений, расходуемых на гектар(т/га)
и урожайностью
зерновых культур (ц/га)
у.
Из
поля корреляции видно, что связь прямая,
то есть с ростом количества удобрений,
расходуемых на гектар(т/га)
,
растет и урожайность
зерновых культур (ц/га)
у.
Для того, чтобы построить теоретическую прямую по исходному столбцу х необходимо рассчитать теоретическое значение функции по найденным коэффициентам регрессии:
a
+ bx
|
yt |
|
9,29616944 |
|
9,734512789 |
|
9,263699562 |
|
9,474753767 |
|
9,377344134 |
|
9,458518828 |
|
9,117585112 |
|
9,101350173 |
|
9,377344134 |
|
9,961801933 |
|
9,182524867 |
|
9,409814012 |
|
10,10791638 |
|
8,987705601 |
|
8,922765846 |
|
9,101350173 |
|
9,474753767 |
|
9,961801933 |
|
10,38391034 |
|
10,09168144 |
|
10,01050675 |
|
9,036410418 |
|
9,117585112 |
|
9,312404378 |
|
9,507223645 |
|
9,685807972 |
|
8,890295968 |
|
9,263699562 |
|
9,539693523 |
|
9,117585112 |
|
9,052645356 |
|
10,31897059 |
|
9,896862178 |
|
9,620868217 |
|
9,913097117 |
|
10,14038626 |
|
9,945566994 |
|
9,685807972 |
|
9,426048951 |
|
9,231229684 |
По полученным значениям на имеющемся графике строим теоретическию прямую.
3. Найти коэффициент вариации.


Рассчитаем коэффициенты вариации.
|
вариация по х |
0,546839 |
|
вариация по y |
0,200251 |
Коэффициент
вариации показывает какую долю среднего
значения количества удобрений, расходуемых
на гектар(т/га)
[урожайности
зерновых культур (ц/га)
у]
составляет ее средний разброс.
4. Найти коэффициент корреляции.
Коэффициент
корреляции используется для оценки
тесноты линейной связи между количеством
удобрений, расходуемых на гектар(т/га)
и урожайностью
зерновых культур (ц/га)
у.

|
корелляция ху |
0,211241 |
0,2112412 |
Коэффициент
корреляции показывает на сколько величин
изменится в среднем урожайность
зерновых культур (ц/га)
у,
когда количеством
удобрений, расходуемых на гектар(т/га)
изменяется на одну
.
Так
как
>
0, то корреляционная связь между
количеством
удобрений, расходуемых на гектар(т/га)
и урожайностью
зерновых культур (ц/га)
у.
является прямой.
Так
как значение
близится к единице, то между количеством
удобрений, расходуемых на гектар(т/га)
и урожайностью
зерновых культур (ц/га)
у.
является тесной.
5. Найти коэффициент детерминации.
Коэффициент детерминации используется для оценки качества подбора уравнения линейной регрессии.
Коэффициент детерминации характеризует долю дисперсии урожайности зерновых культур (ц/га) у, объясняемую регрессией в общей дисперсии урожайности зерновых культур (ц/га) у.

,
где
- факторная сумма,
- остаточная сумма.
Факторная
сумма определяет разброс теоретических
значений от среднего значения урожайности
зерновых культур (ц/га)
у.
Это мера рассеяния теоретических
значений урожайности
зерновых культур (ц/га)
,
обусловленная влиянием количества
удобрений, расходуемых на гектар(т/га)

Остаточная сумма находится под влиянием случайных необъясненных регрессий. Желательна ее минимизация.
|
факторная сумма |
6,476726 |
|
|
|
остаточная сумма |
138,667 |
|
|
|
общая сумма |
145,1438 |
|
|
|
|
|
|
|
|
детерминация ху |
0,044623 |
0,0446228 |
0,044622837 |
Воспользуемся
шкалой оценки силы связи между переменными
в зависимости от
.
Так как
, то сила связи между
количеством
удобрений, расходуемых на гектар(т/га)
и урожайностью
зерновых культур (ц/га)
у
является слабой. Необходимо произвести
спецификацию модели и подобрать другое
уравнение регрессии.
Значит уравнение регрессии объясняется 4,5% дисперсии урожайностью зерновых культур (ц/га) у, на долю прочих факторов, приходящихся на 94,5%.
6. Оценка точности модели.

А – ошибка аппроксимации.

|
аппроксимация |
16,16791 |
Ошибка
, что свидетельствует о неудовлетворительной
подборке модели к исходным данным.
7.Схема дисперсионного анализа.
|
Дисперсионный анализ |
|||
|
компоненты дисперсии |
сумма квадратов |
число степеней свободы |
дисперсия на 1 степень свободы |
|
общая |
145,1438 |
39 |
3,721634615 |
|
факторная |
6,476726 |
1 |
6,476725926 |
|
остаточная |
138,667 |
38 |
3,649132212 |
8. Адекватность модели по F-критерию Фишера (α=0,05).
Оценка
статистической значимости уравнения
регрессии в целом осуществляется с
помощью F-критерия
Фишера, которая заключается в проверке
гипотезы
о
статистической незначимости уравнения
регрессии.
,
для линейной регрессии m=1
|
Fрассчетная |
1,774867 |
1,7748674 |
1,774867434 |
-
это максимально возможное значение
критерия, которое могло сформироваться
под влиянием случайных факторов при
данных степенях свободы:
и уровнем значимости α.
Уровень значимости α – это вероятность отвергнуть правильную гипотезу при условии, что она верна.
α,
=

|
Fтабличная |
4,098172 |
Так
как
>
, то гипотеза
о
статистической незначимости уравнения
регрессии признается и отклоняется
статистическая значимость и надежность
уравнения регрессии.
9. Оценка статистической значимости коэффициентов регрессии и корреляции по t-критерию Стьюдента (α=0,05).
Сначала
проверим статистическую
значимость параметра b
по t-критерию
Стьюдента (α=0,05). Для этого выдвигаем
гипотезу
(нет связи между количеством
удобрений, расходуемых на гектар(т/га)
и урожайностью
зерновых культур (ц/га)
у.
Конкурирующая гипотеза
(есть связь между количеством
удобрений, расходуемых на гектар(т/га)
и урожайностью
зерновых культур (ц/га)
у).
Рассчитываем Т-статистику для коэффициента b:
,
где
– случайная стандартная ошибка, где


|
mb |
1,250276 |
1,2186183 |
2,3755244 |
|
tb рассчетная |
1,298508 |
|
|
-
максимально возможное значение
урожайности
зерновых культур (ц/га)
у
под влиянием количества
удобрений, расходуемых на гектар(т/га)
при данной степени свободы ( в нашей
задаче k
= n
- 2 )
|
tтабличная |
2,024394 |
Так
как
, то гипотеза
признается и отвергается значимость
коэффициента регрессии b.
Для оценки параметра а:


|
ma |
0,629529 |
0,6295287 |
|
ta рассчетная |
13,94162 |
|
|
tтабличная |
2,024394 |
|
Так
как
, то признается значимость коэффициента
регрессии a.
Оценка на статистическую значимость коэффициента корреляции.


|
mr |
0,158561 |
|
|
tr рассчетная |
1,332242 |
1,3322415 |
|
tтабличная |
2,024394 |
|
Так
как
, то отвергается значимость коэффициента
корреляции r.
10. Доверительные интервалы для статистически значимых параметров модели.
Доверительный интервал – это интервал, в котором с определенной вероятностью можно ожидать фактические значения изучаемой величины.
b
-
b +

a
-
a +

r
-
r +

|
доверительный интервал для a фактическое |
7,502237 |
10,051066 |
