·Таблица 4
-
Диапазон изменения |rxy|
0,1 – 0,3
0,3 – 0,5
0,5 – 0,7
0,7 – 0,9
0,9 – 0,99
Характер тесноты связи
слабая
умеренная
заметная
высокая
весьма высокая
Положительная величина rxy свидетельствует о прямой связи между X и Y. Величина вычисленного линейного коэффициента корреляции составила 0,964, что достаточно близко к 1, и по таблице Чеддока - связь весьма высокая.
При rxy достаточно близком к 0 линейная корреляционная связь отсутствует, что не означает отсутствия связи между признаками X и Y. При иной спецификации модели и иной выборке связь между признаками может оказаться достаточно тесной.
5)
Коэффициент
детерминации
является одним из показателей качества
модели. Он представляет собой отношение
объясненной (уравнением) признака
результата к общей дисперсии результативного
признака Y.
Известно,
что общая дисперсии результативного
признака
раскладывается на две составляющие:
Для расчета сумм квадратов SSобщ., SSR и SSост., составим расчетную таблицу (таблица 5.):
Таблица 5
№ |
|
|
|
|
|
|
|
|
|
1 |
2,9 |
3,622 |
-4,8 |
-4,078 |
-0,722 |
23,04 |
16,630 |
0,521 |
0,249 |
2 |
7,1 |
6,343 |
-0,6 |
-1,357 |
0,757 |
0,36 |
1,841 |
0,573 |
0,107 |
3 |
11,8 |
11,79 |
4,1 |
4,09 |
0,02 |
16,81 |
16,728 |
0,000 |
0,001 |
4 |
6,3 |
5,433 |
-1,4 |
-2,267 |
0,867 |
1,96 |
5,139 |
0,752 |
0,138 |
5 |
7,2 |
8,153 |
-0,5 |
0,453 |
-0,953 |
0,25 |
0,205 |
0,908 |
0,132 |
6 |
8,4 |
9,064 |
0,7 |
1,364 |
-0,664 |
0,49 |
1,860 |
0,441 |
0,079 |
7 |
4,8 |
4,526 |
-2,9 |
-3,174 |
0,273 |
8,41 |
10,074 |
0,075 |
0,057 |
8 |
11,2 |
9,966 |
3,5 |
2,266 |
1,233 |
12,25 |
5,135 |
1,523 |
0,110 |
9 |
6,7 |
7,246 |
-1 |
-0,454 |
-0,546 |
1 |
0,206 |
0,298 |
0,081 |
10 |
10,6 |
10,873 |
2,9 |
3,173 |
-0,273 |
8,41 |
10,068 |
0,075 |
0,026 |
|
77 |
77,016 |
0 |
- |
- |
72,98 |
67,888 |
5,166 |
0,980 |
Правильность
расчета параметров уравнения регрессии
может быть проверена сравнением:
.
Используя
табличные данные, получим
,
Коэффициент
детерминации
показывает, что в исследуемой ситуации
93% общей дисперсии издержек обращения
объясняется изменениями объема
товарооборота, в то время как на все
остальные неучтенные факторы приходится
7% изменчивости издержек обращения. Для
парной линейной регрессии
=
rxy2
.
6)
Средняя
ошибка аппроксимации Ā
– среднее
отклонение расчетных значений от
фактических
.
Чем меньше это отклонение, тем лучше
качество искомой модели. Ошибка
аппроксимации определяется в процентах
по модулю,
т.к. величина
может быть
как величиной
положительной, так и отрицательной.
В среднем расчетные значения отклоняются от фактических на 8,89%, что не превышает допустимый предел значений Ā (не более 8 – 10%. ), следовательно, модель линейной регрессии целесообразно использовать.
7) Находим доверительные интервалы для параметров регрессии с надежностью γ = 0,95, где γ – это вероятность того, что построенный нами доверительный интервал покроет истинное значение параметра a . Справедливы формулы:
Найдем оценку дисперсии случайной составляющей или ошибку у:
где
,
остаточная сумма квадратов.
При доверительной вероятности γ = 0,95 находим t0.95 по таблице “Значения tγ,к - критерия Стьюдента”, получаем t0,95;8=t(0,95;8) = 2,306. Итак, доверительные интервалы для параметров регрессии с заданной надежностью примут вид:
или
Все возможные значения параметров регрессии, выходящие за пределы указанных интервалов, маловероятны.
8)
Чтобы проверить значимость полученных
параметров
и
,т.е.
значимо ли они отличаются от нуля в
«истинном» уравнении регрессии,
используют статистические методы
проверки гипотез. Исходя из значимости
и
,
можем судить о пригодности полученного
уравнения регрессии для практического
использования.
Оценка уравнения регрессии в целом дается с помощью F- критерия Фишера. При этом выдвигается нулевая гипотеза, что коэффициент регрессии равен 0, и, следовательно, фактор Х - товарооборот не оказывает влияния на Y - издержки обращения.
9) До сих пор рассматривались в качестве факторов количественные признаки (признаки, принимающие числовые значения: объем товарооборота, издержки обращения, основные и оборотные средства, валовой доход). Однако достаточно часто возникает необходимость исследования влияния качественных признаков, таких, например, как профессия, пол, образование, климатические условия, новые технологии.
Чтобы ввести такие признаки в модель, они должны быть преобразованы в количественные, т.е. им должны быть присвоены цифровые метки. Сконструированные на основе качественных факторов числовые переменные называют фиктивными переменными.
Рассмотрим применение фиктивных переменных для нашего примера по качественному признаку – использование новых технологий рассматриваемых предприятий. Введем фиктивную переменную:
Значения фиктивной переменной представлены в столбце Z:
Таблица 6
-
Фирмы
X
Y
Z
1
60
2,9
0
2
90
7,1
0
3
150
11,8
1
4
80
6,3
0
5
110
7,2
1
6
120
8,4
1
7
70
4,8
0
8
130
11,20
1
9
100
6,7
0
10
140
10,6
1
Введем фиктивную переменную в уравнение (1):
Используя МНК, получим расчетную систему:
Решая эту систему, получим: a = -2,96; b = 0,106;c = -1,045 и соответствующее уравнение:
ŷ = - 2,96 + 0,106·x – 1,045z.
ŷ1 = - 2,96 + 0,106·x – 1,045·1 = - 4,011 + 0,106·x при z = 1 (использование новых технологий);
ŷ2 = - 2,96 + 0,106·x – 1,045·0 = - 2,96 + 0,106·x при z = 0 ( не использование новых технологий);
Из полученных частных уравнений регрессии видно, что с увеличением товарооборота X при использовании новых технологий издержки обращения Y уменьшаются.
