
Уравнение парной регрессии
..rtfУравнение парной регрессии.
На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.
Линейное уравнение регрессии имеет вид y = bx + a + ε
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Для наших данных система уравнений имеет вид
12a + 1042 b = 1709
1042 a + 91556 b = 149367
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = 0.9, a = 64.21
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 0.9 x + 64.21
Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.
Для расчета параметров линейной регрессии построим расчетную таблицу (табл. 1)
x |
y |
x2 |
y2 |
x • y |
83 |
137 |
6889 |
18769 |
11371 |
88 |
142 |
7744 |
20164 |
12496 |
75 |
128 |
5625 |
16384 |
9600 |
89 |
140 |
7921 |
19600 |
12460 |
85 |
133 |
7225 |
17689 |
11305 |
79 |
153 |
6241 |
23409 |
12087 |
81 |
142 |
6561 |
20164 |
11502 |
97 |
154 |
9409 |
23716 |
14938 |
79 |
132 |
6241 |
17424 |
10428 |
90 |
150 |
8100 |
22500 |
13500 |
84 |
132 |
7056 |
17424 |
11088 |
112 |
166 |
12544 |
27556 |
18592 |
1042 |
1709 |
91556 |
244799 |
149367 |
1. Параметры уравнения регрессии.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
1.1. Коэффициент корреляции
Ковариация.
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
1.2. Уравнение регрессии (оценка уравнения регрессии).
Линейное уравнение регрессии имеет вид y = 0.9 x + 64.21
1.3. Коэффициент эластичности.
Коэффициент эластичности находится по формуле:
1.4. Ошибка аппроксимации.
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.
1.5. Эмпирическое корреляционное отношение.
Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].
где
Индекс корреляции.
Для линейной регрессии индекс корреляции равен коэфииценту корреляции rxy = 0.79.
Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:
1.6. Коэффициент детерминации.
Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.
R2= 0.792 = 0.62
Для оценки качества параметров линейной регрессии построим расчетную таблицу (табл. 2)
x |
y |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
(xi-xcp)2 |
|y - yx|:y |
83 |
137 |
138.96 |
29.34 |
3.86 |
14.69 |
0.0143 |
88 |
142 |
143.47 |
0.17 |
2.15 |
1.36 |
0.0103 |
75 |
128 |
131.76 |
207.84 |
14.13 |
140.03 |
0.0294 |
89 |
140 |
144.37 |
5.84 |
19.08 |
4.69 |
0.0312 |
85 |
133 |
140.77 |
88.67 |
60.3 |
3.36 |
0.0584 |
79 |
153 |
135.36 |
112.01 |
311.12 |
61.36 |
0.12 |
81 |
142 |
137.16 |
0.17 |
23.4 |
34.03 |
0.0341 |
97 |
154 |
151.57 |
134.17 |
5.89 |
103.36 |
0.0158 |
79 |
132 |
135.36 |
108.51 |
11.3 |
61.36 |
0.0255 |
90 |
150 |
145.27 |
57.51 |
22.38 |
10.03 |
0.0315 |
84 |
132 |
139.86 |
108.51 |
61.85 |
8.03 |
0.0596 |
112 |
166 |
165.08 |
556.17 |
0.84 |
633.36 |
0.00552 |
1042 |
1709 |
1709 |
1408.92 |
536.31 |
1075.67 |
0.43 |
2. Оценка параметров уравнения регрессии.
2.1. Значимость коэффициента корреляции.
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия
и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если tнабл < tкрит оснований отвергнуть нулевую гипотезу. Если |tнабл| > tкрит — нулевую гипотезу отвергают.
По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=10 находим tкрит:
tкрит (n-m-1;α/2) = (10;0.025) = 2.228
где m = 1 - количество объясняющих переменных.
2.2. Интервальная оценка для коэффициента корреляции (доверительный интервал).
r(0.54;1.03)
2.3. Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:
S2y = 53.63 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
Sy = 7.32 - стандартная ошибка оценки (стандартная ошибка регрессии).
Sa - стандартное отклонение случайной величины a.
Sb - стандартное отклонение случайной величины b.
2.4. Доверительные интервалы для зависимой переменной.
(a + bxp ± ε)
где
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 107
Индивидуальные доверительные интервалы для Y при данном значении X.
(a + bxi ± ε)
где
tкрит (n-m-1;α/2) = (10;0.025) = 2.228
2.5. Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
1) t-статистика. Критерий Стьюдента.
tкрит (n-m-1;α/2) = (10;0.025) = 2.228
Доверительный интервал для коэффициентов уравнения регрессии.
(b - tкрит Sb; b + tкрит Sb)
(a - tкрит Sa; a + tкрит Sa)
2) F-статистика. Критерий Фишера.
Табличное значение критерия со степенями свободы k1=1 и k2=10, Fтабл = 4.96