теория
.pdf
уравнение зависимости |
~ |
= ax + b . Вычислить |
коэффициент |
|||
y |
||||||
корреляции, проинтерпретировать результаты. |
|
|||||
Напишем |
уравнение |
|
регрессии и |
рассчитаем |
его |
|
параметры: |
~ |
|
При увеличении |
прожиточного |
||
y = −2201+ 3.13x . |
||||||
минимума на |
1 рубль |
среднемесячная |
заработная |
плата |
||
увеличится на 3,13 рубля.
Тесноту линейной связи оценит коэффициент корреляции:
r = xy − x y ≈ 0.87 |
|
σx σy |
. |
|
Коэффициент корреляции свидетельствуют о тесной связи между среднемесячной заработной платой и прожиточным минимумом и 76% изменения заработной платы объясняется изменением прожиточного минимума.
Пример 2. Изучается зависимость заработной платой – y (ден.ед.) и стажем работника x (лет). Проверим гипотезу о том, что с увеличением стажа увеличивается вариация заработной платы, т.е. что имеет место гетероскедастичность.
Воспользуемся тестом ранговой корреляции Спирмена. Составим расчетную таблицу.
Составим уравнение парной регрессии: |
y = ax +b; |
где a и b вычисляются |
|||||||||
по формулам a = |
xy − x y |
|
|
|
|
|
|
|
|||
x 2 |
−(x)2 |
; b = y −ax . Получим: |
|
|
|||||||
a = |
3196 −8,8 293 |
= |
|
3196 − 2578,4 |
= |
617,6 |
|
= 27,996 |
|||
|
22,06 |
|
|||||||||
|
|
99,5 −77,44 |
22,06 |
|
|
; |
|||||
|
|
b = 293 −27,996 8,8 = 293 −246,37 = 46,63 . |
|||||||||
Таким образом, регрессионное |
уравнение |
примет |
|
вид: y = 27,996x −46,63. |
|||||||
Уравнение показывает, что при увеличении стажа на 1 год заработная плата возрастает на 27,996 ден.ед.
№ |
x |
y |
xy |
x |
2 |
~ |
~ |
|
y |
y − y |
|||||
1 |
1 |
80 |
80 |
1 |
74,626 |
5,374 |
|
2 |
2 |
70 |
140 |
4 |
102,622 |
-32,622 |
|
3 |
2 |
120 |
240 |
4 |
102,622 |
17,378 |
|
4 |
3 |
140 |
420 |
9 |
130,618 |
9,382 |
|
5 |
4 |
130 |
520 |
16 |
158,614 |
-28,614 |
|
6 |
5 |
160 |
800 |
25 |
186,61 |
-26,61 |
|
7 |
6 |
180 |
1080 |
36 |
214,606 |
-34,606 |
|
8 |
7 |
250 |
1750 |
49 |
242,602 |
7,398 |
|
9 |
8 |
200 |
1600 |
64 |
270,598 |
-70,598 |
|
10 |
9 |
350 |
3150 |
81 |
298,594 |
51,406 |
|
11 |
10 |
450 |
4500 |
100 |
326,56 |
123,44 |
|
12 |
11 |
250 |
2750 |
121 |
354,586 |
-104,586 |
|
13 |
11 |
540 |
5940 |
121 |
354,586 |
185,414 |
|
14 |
12 |
350 |
4200 |
144 |
382,582 |
-32,582 |
|
15 |
|
|
|
|
12 |
|
|
|
|
|
500 |
|
|
|
|
|
6000 |
144 |
|
|
382,582 |
|
|
|
|
|
117,418 |
||||||
16 |
|
|
|
|
13 |
|
|
|
|
|
270 |
|
|
|
|
|
3510 |
169 |
|
|
410,578 |
|
|
|
|
|
-140,578 |
||||||
17 |
|
|
|
|
14 |
|
|
|
|
|
550 |
|
|
|
|
|
7700 |
196 |
|
|
438,574 |
|
|
|
|
|
111,426 |
||||||
18 |
|
|
|
|
15 |
|
|
|
|
|
240 |
|
|
|
|
|
3600 |
225 |
|
|
466,57 |
|
|
|
|
|
-226,57 |
||||||
19 |
|
|
|
|
15 |
|
|
|
|
|
540 |
|
|
|
|
|
8100 |
225 |
|
|
466,57 |
|
|
|
|
|
73,43 |
||||||
20 |
|
|
|
|
16 |
|
|
|
|
|
490 |
|
|
|
|
|
7840 |
256 |
|
|
494,566 |
|
|
|
|
|
-4,566 |
||||||
∑ |
|
|
176 |
|
|
|
|
|
5860 |
|
|
|
|
|
63920 |
1990 |
|
5859,866 |
|
|
|
|
0 |
||||||||||
Среднее |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
значение |
|
8,8 |
|
|
|
|
|
293 |
|
|
|
|
|
3196 |
99,5 |
|
292,99 |
|
|
|
|
|
0 |
||||||||||
Проранжируем значения x и |
|
e |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
№ |
|
|
|
|
|
|
x |
rangx |
|
|
e |
rang |
|
e |
|
(rangx −rang |
|
e |
|
)2 |
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
1 |
|
|
|
|
1 |
|
|
1 |
|
|
|
|
|
|
5,374 |
2 |
|
|
|
1 |
|
|
|
|
|
|
|||||
|
|
2 |
|
|
|
|
2 |
|
|
2,5 |
|
|
|
|
|
-32,622 |
9 |
|
|
|
42,25 |
|
|
|
|
|
|
||||||
|
|
3 |
|
|
|
|
2 |
|
|
2,5 |
|
|
|
|
|
17,378 |
5 |
|
|
|
6,25 |
|
|
|
|
|
|
||||||
|
|
4 |
|
|
|
|
3 |
|
|
4 |
|
|
|
|
|
|
9,382 |
4 |
|
|
|
0 |
|
|
|
|
|
|
|||||
|
|
5 |
|
|
|
|
4 |
|
|
5 |
|
|
|
|
|
|
-28,614 |
7 |
|
|
|
4 |
|
|
|
|
|
|
|||||
|
|
6 |
|
|
|
|
5 |
|
|
6 |
|
|
|
|
|
|
-26,61 |
6 |
|
|
|
0 |
|
|
|
|
|
|
|||||
|
|
7 |
|
|
|
|
6 |
|
|
7 |
|
|
|
|
|
|
-34,606 |
10 |
|
|
|
9 |
|
|
|
|
|
|
|||||
|
|
8 |
|
|
|
|
7 |
|
|
8 |
|
|
|
|
|
|
7,398 |
3 |
|
|
|
25 |
|
|
|
|
|
|
|||||
|
|
9 |
|
|
|
|
8 |
|
|
9 |
|
|
|
|
|
|
-70,598 |
12 |
|
|
|
9 |
|
|
|
|
|
|
|||||
|
|
10 |
|
|
|
|
9 |
|
|
10 |
|
|
|
|
|
|
51,406 |
11 |
|
|
|
1 |
|
|
|
|
|
|
|||||
|
|
11 |
|
|
|
|
10 |
|
|
11 |
|
|
|
|
|
|
123,44 |
17 |
|
|
|
36 |
|
|
|
|
|
|
|||||
|
|
12 |
|
|
|
|
11 |
|
|
12,5 |
|
|
|
|
-106,586 |
14 |
|
|
|
2,25 |
|
|
|
|
|
|
|||||||
|
|
13 |
|
|
|
|
11 |
|
|
12,5 |
|
|
|
|
185,414 |
19 |
|
|
|
42,25 |
|
|
|
|
|
|
|||||||
|
|
14 |
|
|
|
|
12 |
|
|
14,5 |
|
|
|
|
-32,582 |
8 |
|
|
|
42,25 |
|
|
|
|
|
|
|||||||
|
|
15 |
|
|
|
|
12 |
|
|
14,5 |
|
|
|
|
117,418 |
16 |
|
|
|
2,25 |
|
|
|
|
|
|
|||||||
|
|
16 |
|
|
|
|
13 |
|
|
16 |
|
|
|
|
|
|
-140,578 |
18 |
|
|
|
4 |
|
|
|
|
|
|
|||||
|
|
17 |
|
|
|
|
14 |
|
|
17 |
|
|
|
|
|
|
111,426 |
15 |
|
|
|
4 |
|
|
|
|
|
|
|||||
|
|
18 |
|
|
|
|
15 |
|
|
18,5 |
|
|
|
|
-226,57 |
20 |
|
|
|
2,25 |
|
|
|
|
|
|
|||||||
|
|
19 |
|
|
|
|
15 |
|
|
18,5 |
|
|
|
|
73,43 |
13 |
|
|
|
30,25 |
|
|
|
|
|
|
|||||||
|
|
20 |
|
|
|
|
16 |
|
|
20 |
|
|
|
|
|
|
-4,566 |
1 |
|
|
|
361 |
|
|
|
|
|
|
|||||
|
|
|
∑ |
|
|
|
|
- |
|
|
- |
|
|
|
|
|
|
- |
- |
|
|
|
624 |
|
|
|
|
|
|
||||
D = ∑(rangx −rang |
|
e |
|
)2 = 624 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
Вычислим коэффициент ранговой корреляции Спирмена: |
|
||||||||||||||||||||||||||||||||
r =1− |
6 D |
|
|
|
|
6 624 |
3744 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
=1− |
|
|
|
=1− 7980 |
= 0,531, |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
n(n2 −1) |
20 399 |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
r
n −1 = 0,531
19 = 0,531 4,359 = 2,315 ,
t0,05 =1,96 .
Т.к. 2,315>1,96, то имеет место гетероскедастичность.
Избавимся от гетероскедастичности. Для этого вычислим коэффициенты регрессии, где в качестве результативного y возьмем столбец
квадратов остатков e2 :
|
|
|
|
e2 = a0 + a1 x2 , |
где |
a0 |
|
a |
|
|
и 1 вычисляются по формулам: |
|||
a = |
yx 2 |
− y x 2 |
|
|
|
|
−(x 2 )2 ; a0 = y −a1 x 2 , |
||
1 |
x 4 |
|||
|
||||
a |
= |
39271− 293 99,5 |
= |
39271− 29153,5 |
= |
|
10117,5 |
=1,535 |
|
|||
|
|
|
|
|
|
|||||||
1 |
16493,3 −9900,25 |
6593,05 |
6593,05 |
, |
|
|||||||
|
|
|||||||||||
a0 |
= 293 −1,535 99,5 = 293 −152,733 =140,267 , |
|
|
|
||||||||
e2 |
=140,267 +1,535x2 . |
|
|
|
|
|
|
|
|
|||
|
|
|
№ |
|
y |
|
|
x2 |
|
yx2 |
x4 |
|
|
|
|
1 |
|
|
80 |
|
1 |
|
80 |
1 |
|
|
|
|
2 |
|
|
70 |
|
4 |
|
280 |
16 |
|
|
|
|
3 |
|
|
120 |
|
4 |
|
480 |
16 |
|
|
|
|
4 |
|
|
140 |
|
9 |
|
1260 |
81 |
|
|
|
|
5 |
|
|
130 |
|
16 |
|
2080 |
256 |
|
|
|
|
6 |
|
|
160 |
|
25 |
|
4000 |
625 |
|
|
|
|
7 |
|
|
180 |
|
36 |
|
6480 |
1296 |
|
|
|
|
8 |
|
|
250 |
|
49 |
|
12250 |
2401 |
|
|
|
|
9 |
|
|
200 |
|
64 |
|
12800 |
4096 |
|
|
|
|
10 |
|
|
350 |
|
81 |
|
28350 |
6561 |
|
|
|
|
11 |
|
|
450 |
|
100 |
|
45000 |
10000 |
|
|
|
|
12 |
|
|
250 |
|
121 |
|
30250 |
14641 |
|
|
|
|
13 |
|
|
540 |
|
121 |
|
65340 |
14641 |
|
|
|
|
14 |
|
|
350 |
|
144 |
|
50400 |
20736 |
|
|
|
|
15 |
|
|
500 |
|
144 |
|
72000 |
20736 |
|
|
|
|
16 |
|
|
270 |
|
169 |
|
45630 |
28561 |
|
|
|
|
17 |
|
|
550 |
|
196 |
|
107800 |
38416 |
|
|
|
|
18 |
|
|
240 |
|
225 |
|
54000 |
50625 |
|
|
|
|
19 |
|
|
540 |
|
225 |
|
121500 |
50625 |
|
|
|
|
20 |
|
|
490 |
|
256 |
|
125440 |
65536 |
|
|
|
|
∑ |
|
5860 |
|
1990 |
|
785420 |
329866 |
||
|
|
|
Среднее |
|
293 |
|
99,5 |
|
39271 |
16493,3 |
||
|
|
|
значение |
|
|
|
||||||
Вычислим набор значений-весов, каждое из которых равно квадратному
корню из |
соответствующего расчетного |
значения: |
~ 2 |
. |
Этот вектор |
|||||||||
e |
||||||||||||||
называется набором весов и |
на эти значения делятся исходные значения y и |
|||||||||||||
x : |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X = |
x |
|
Y = |
y |
|
|
|
|
|
|
|
|
|
|
|
~2 |
, |
|
~2 |
|
|
|
|
|
|
|
|
|
|
|
e |
|
e |
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
№ |
|
e |
2 |
|
~2 |
|
|
|
~2 |
|
X |
|
|
Y |
|
|
|
e |
|
|
|
e |
|
|
|
||||
1 |
|
28,880 |
|
141,802 |
|
|
|
11,908 |
|
0,084 |
|
|
6,718 |
|
2 |
|
1064,195 |
|
146,407 |
|
|
|
12,100 |
|
0,165 |
|
|
5,785 |
|
3 |
|
301,995 |
|
146,407 |
|
|
|
12,100 |
|
0,165 |
|
|
9,917 |
|
4 |
|
88,022 |
|
154,082 |
|
|
|
12,413 |
|
0,242 |
|
|
11,279 |
|
5 |
|
818,761 |
|
164,827 |
|
|
|
12,838 |
|
0,312 |
|
|
10,126 |
|
6 |
|
708,092 |
|
178,642 |
|
|
|
13,366 |
|
0,374 |
|
|
11,971 |
|
7 |
|
1197,575 |
|
195,527 |
|
|
|
13,983 |
|
0,429 |
|
|
12,873 |
|
8 |
|
54,730 |
|
215,482 |
|
|
|
14,679 |
|
0,477 |
|
|
17,031 |
|
9 |
|
4984,078 |
|
238,507 |
|
|
|
15,444 |
|
0,518 |
|
|
12,950 |
|
10 |
|
2642,577 |
|
264,602 |
|
|
|
16,267 |
|
0,553 |
|
|
21,516 |
|
11 |
|
15237,434 |
|
293,767 |
|
|
|
17,140 |
|
0,583 |
|
|
26,255 |
|
12 |
10938,231 |
326,002 |
18,056 |
0,609 |
13,846 |
13 |
34378,351 |
326,002 |
18,056 |
0,609 |
29,908 |
14 |
1061,587 |
361,307 |
19,008 |
0,631 |
18,413 |
15 |
13786,987 |
361,307 |
19,008 |
0,631 |
26,305 |
16 |
19762,174 |
399,682 |
19,992 |
0,650 |
13,505 |
17 |
12415,753 |
441,127 |
21,003 |
0,667 |
26,187 |
18 |
51333,965 |
485,642 |
22,037 |
0,681 |
10,891 |
19 |
5391,965 |
485,642 |
22,037 |
0,681 |
24,504 |
20 |
20,848 |
533,227 |
23,092 |
0,693 |
21,220 |
∑ |
176216,2 |
5859,99 |
334,526 |
9,755 |
331,199 |
Среднее |
8810,81 |
293 |
16,726 |
0,488 |
16,560 |
значение |
К новым переменным X и Y применяется метод наименьших квадратов. Для этого оценивается регрессия:
Y = aX +b .
Вычислим коэффициенты:
a = |
9,05 −0,488 16,56 |
= |
9,05 −8,081 |
= |
0,969 |
= 26,189 |
|
0,275 −0,238 |
0,037 |
|
0,037 |
||||
|
|
|
|
, |
|||
b =16,56 −26,189 0,488 =16,56 −12,78 = 3,78 .
Регрессия Y = aX +b имеет вид: Y = 26,189X +3,78. Уравнение показывает, что при увеличении стажа на 1 год заработная плата возрастает на 26,189 ден.ед.
№ |
X |
Y |
XY |
X 2 |
1 |
0,084 |
6,718 |
0,564 |
0,007 |
2 |
0,165 |
5,785 |
0,955 |
0,027 |
3 |
0,165 |
9,917 |
1,636 |
0,027 |
4 |
0,242 |
11,279 |
2,730 |
0,059 |
5 |
0,312 |
10,126 |
3,159 |
0,097 |
6 |
0,374 |
11,971 |
4,477 |
0,140 |
7 |
0,429 |
12,873 |
5,523 |
0,184 |
8 |
0,477 |
17,031 |
8,124 |
0,228 |
9 |
0,518 |
12,95 |
6,708 |
0,268 |
10 |
0,553 |
21,516 |
11,898 |
0,306 |
11 |
0,583 |
26,255 |
15,307 |
0,340 |
12 |
0,609 |
13,846 |
8,432 |
0,371 |
13 |
0,609 |
29,908 |
18,214 |
0,371 |
14 |
0,631 |
18,413 |
11,619 |
0,398 |
15 |
0,631 |
26,305 |
16,598 |
0,398 |
16 |
0,65 |
13,505 |
8,778 |
0,423 |
17 |
0,667 |
26,187 |
17,467 |
0,445 |
18 |
0,681 |
10,891 |
7,417 |
0,464 |
19 |
0,681 |
24,504 |
16,687 |
0,464 |
20 |
0,693 |
21,22 |
14,705 |
0,480 |
∑ |
9,755 |
331,199 |
180,998 |
5,496 |
|
0,488 |
16,56 |
9,05 |
0,275 |
1.3.Задачи для самостоятельного решения
Задача 1. Для трех видов продукции A, B и С модели зависимости удельных постоянных расходов от объема выпускаемой продукции выглядят следующим образом: yA = 600, yB = 80+0.7x, yС = 40x0.5. Определите коэффициенты эластичности по каждому виду продукции и поясните их смысл. Сравните при x=1000 эластичность затрат для продукции B и С. Определите, каким должен быть объем выпускаемой продукции, чтобы коэффициенты эластичности для продукции B и С были равны.
Задача 2. Пусть имеется следующая модель регрессии, характеризующая зависимость y от x: y=8-7x. Известно также, что rxy=-0.5; n=20. Постройте доверительный интервал для коэффициента регрессии в этой модели:
а) с вероятностью 90%, б) с вероятностью 99%.
Задача 3. Зависимость среднемесячной производительности труда от возраста рабочих характеризуется моделью: y=a+bx+cx2. Оцените качество модели, определив ошибку аппроксимации, индекс корреляции и F-критерий Фишера, если ее использование привело к результатам, представленным в таблице.
№ |
Производительность труда |
|
п.п. |
рабочих, тыс. руб., y |
|
|
Фактическая |
Расчетная |
1 |
12 |
10 |
2 |
8 |
10 |
3 |
13 |
13 |
4 |
15 |
14 |
5 |
16 |
15 |
6 |
11 |
12 |
7 |
12 |
13 |
8 |
9 |
10 |
9 |
11 |
10 |
10 |
9 |
9 |
Задача 4. Для двух видов продукции А и Б зависимость расходов предприятия y (тыс. руб.) от объема производства x (шт.) характеризуется данными, представленными в табл.
Уравнение регрессии |
Показатели корреляции |
Число наблюдений |
yА=160+0.8x |
0.85 |
30 |
yБ=50x0.6 |
0.72 |
25 |
Поясните смысл величин 0,8 и 0,6 в уравнениях регрессии. Сравните эластичность расходов от объема производства для продукции А и Б при выпуске продукции А в 500 единиц. Определите, каким должен быть выпуск продукции А, чтобы эластичность ее расходов совпадала с эластичностью расходов на продукцию Б. Оцените значимость каждого уравнения регрессии с помощью F-критерия Фишера.
Задача 5. По территориям Центрального района известны данные за сентябрь 2002 г. (приложение 6). Постройте поле корреляции и сформулируйте гипотезу о форме связи. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, обратной, гиперболической, парной регрессии. Оцените тесноту связи с помощью показателей корреляции и детерминации Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом. Оцените с помощью средней ошибки аппроксимации качество уравнений. С помощью F-критерия Фишера оцените статистическую надежность результатов регрессионного моделирования. По значениям характеристик, рассчитанных для разных моделей, выберите лучшее уравнение регрессии и дайте его обоснование. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости α=0,05. Оцените полученные результаты, выводы оформите в аналитической записке.
Задача 6. Рассматривается зависимость между сменной добычей угля на одного рабочего (y, тонн) и мощностью пласта (x, м) по следующим 10 шахтам:
№ |
x |
y |
|
||
1 |
8 |
5 |
|
||
2 |
11 |
10 |
|
||
3 |
12 |
10 |
|
||
4 |
9 |
7 |
5 |
8 |
5 |
6 |
8 |
6 |
7 |
9 |
6 |
8 |
9 |
5 |
9 |
8 |
6 |
10 |
12 |
8 |
Постройте поле корреляции и сформулируйте гипотезу о форме связи. Рассчитайте параметры линейного уравнения и выбранного нелинейного. Оцените тесноту связи с помощью показателей корреляции и детерминации Сделайте прогноз сменной добычи угля на одного рабочего при мощности пласта, равной 102% от среднего уровня. Рассчитайте доверительный интервал прогноза. Изобразите прогноз и доверительный интервал на поле корреляции.
Задача 7. Администрация страховой компании приняла решение о введении нового вида услуг – страхование на случай пожара. С целью определения тарифов по выборке из 10 случаев пожаров анализируется зависимость стоимости ущерба, нанесенного пожаром от расстояния до ближайшей пожарной станции:
№ п/п |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Общая сумма ущерба, |
26,2 |
17,8 |
31,3 |
23,1 |
27,5 |
36,0 |
14,1 |
22,3 |
19,6 |
31,3 |
млн.руб. |
|
|
|
|
|
|
|
|
|
|
Расстояние до ближайшей |
3,4 |
1,8 |
4,6 |
2,3 |
3,1 |
5,5 |
0,7 |
3,0 |
2,6 |
4,3 |
станции, км |
|
|
|
|
|
|
|
|
|
|
Напишите уравнение этой зависимости, оцените ее значимость на 5% уровне. Сделайте вывод.
Глава 2. Множественная регрессия и корреляция
2.1.Теоретические основы
Множественной регрессией называется уравнение связи y = f (x1, x2 ,..., xn )
между результативным признаком y и факторными признаками x1 , x 2 ,..., x n . Уравнение линейной множественной регрессии имеет вид:
y = a 0 +a1 x1 +a 2 x 2 +...+a n x n ,
где a1 , a 2 ,..., a n - коэффициенты регрессии, показывающие абсолютное изменение результативного признака y под влиянием изменения соответствующих факторных признаков на 1 единицу.
Согласно методу наименьших квадратов требуется найти такие значения
коэффициентов a1 , a 2 ,..., a n , которые бы минимизировали сумму квадратов отклонений фактических значений признака от расчетных
S = e12 +e22 +... +en2 → min ,
|
~ |
|
|
|
|
|
|
|
|
|
|
где ei = yi − yi . |
|
|
|
|
|
~ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. Тогда |
|
Рассмотрим случай двух факторных признаков y = a 0 + a1x1 + a 2 x 2 |
|||||||||||
остатки в |
этом случае |
будут равны ei = yi |
|
~ |
|
−a1 x1i |
−a 2 x 2i . |
|
Сумма |
||
− yi = yi −a 0 |
|
||||||||||
|
|
n |
n |
~ |
2 |
|
n |
|
|
2 |
|
|
|
2 |
|
= |
∑(yi − a |
− a1x1i |
− a 2 x 2i ) |
→ min |
|||
квадратов |
остатков |
S = ∑ei |
= ∑(yi − yi ) |
|
|
||||||
i=1 |
i=1 |
|
|
|
i=1 |
|
|
|
. |
||
Необходимые условия первого порядка для минимума имеют следующий вид:
|
∂S |
= 0, |
|||
|
|||||
∂a 0 |
|||||
|
|
|
|||
|
∂S |
= 0, |
|||
|
|
|
|||
∂a1 |
|||||
|
|
|
|||
|
∂S |
|
= 0. |
||
|
|
|
|
||
∂a 2 |
|
||||
|
|
|
|||
|
∂S |
|
n |
|
||
|
|
= −2∑(yi − a 0 − a1 x1i − a 2 x 2i |
)= 0, |
|||
∂a 0 |
||||||
|
|
i=1 |
|
|||
|
∂S |
|
n |
|
||
|
= −2∑(yi − a 0 − a1x1i − a 2 x 2i ) x1i = 0, |
|||||
|
|
|
|
|||
∂a1 |
||||||
|
|
i=1 |
|
|||
|
∂S |
|
n |
|
||
|
|
= −2∑(yi − a 0 − a1x1i − a 2 x 2i |
) x 2i = 0. |
|||
|
|
|
||||
|
∂a 2 |
|
i=1 |
|
||
|
|
|
||||
Разделив каждое уравнение на (− 2n) и переходя к средним, получим систему трех линейных уравнений с тремя неизвестными a 0 , a1 , a 2 :
y − a 0 − a1 x1 − a 2 x 2 = 0,
x1 y − a 0 x1 − a1 x12 − a 2 x1x 2 = 0,x 2 y − a 0 x 21 − a1 x1x 2 − a 2 x 22 = 0.
Для решения этой системы может быть применен метод Крамера, метод Гаусса, метод матричного исчисления, либо другой метод решения систем линейных уравнений.
Тесноту совместного влияния факторов на результат оценивает коэффициент множественной корреляции:
|
|
2 |
|
|
~ |
2 |
||
R yx1x2 ...xp = |
1 − |
σyост |
= |
1 − |
∑(y − y) |
|
||
σ2y |
∑(y − |
|
)2 . |
|||||
y |
||||||||
Значение коэффициента множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу
корреляции R yx1x 2 ...xm ≥ ryxi . Чем ближе коэффициент R к единице, тем теснее связь между результативным признаком и факторными.
Качество построенной модели в целом оценивает коэффициент (индекс) детерминации. Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции:
R 2yx1x 2 ...x m .
Величина R 2yx1x 2 ...x m 100% показывает, сколько процентов изменения результативного признака объясняется изменением факторных признаков, включенных в уравнение регрессии.
При построении уравнения множественной регрессии может возникнуть проблема мультиколлинеарности факторов, их тесной линейной зависимости. Если коэффициент корреляции между факторными признаками,
включенными в уравнение регрессии, rx1x 2 ≥ 0.7 , то факторы считаются мультиколлинераными. Если на этапе отбора факторов обнаружена мультиколлинеарность, то необходимо исключить фактор меньше коррелируемый с y и включить фактор, коррелированный с у и не коррелированный с уже включенным факторным признаком. Рекомендуется отбор факторных признаков осуществлять на основе матрицы парных коэффициентов корреляций, полученной с помощью инструмента анализа данных Корреляция в ППП MS Excel.
Вслучае множественной линейной регрессии ее значимость оценивается
спомощью F-критерия Фишера. Для этого рассчитывается величина:
F |
расчетоне |
= |
|
R 2 |
|
n − m −1 |
, |
|
|
− R 2 |
m |
|
|||||
|
1 |
|
||||||
где m – число факторных признаков в уравнении регрессии, n – число
наблюдений, R – коэффициент множественной корреляции. |
По таблице F- |
критерия Фишера определяется Fтабл (k1 = m, k 2 = n − m −1). |
Если расчетное |
значение больше табличного при уровне значимости α и m и n-m-1 степенях свободы, то уравнение считается статистически значимым, иначе – незначимым.
Оценка значимости коэффициентов регрессии осуществляется с помощью t-критерия Стьюдента и сводится к вычислению значений
|
|
R 2 − r 2 |
||
t α1 |
= |
|
yx2 |
(n − m −1), |
|
1 − R 2 |
|||
|
|
|
R 2 − r 2 |
|
t α2 |
= |
|
yx1 |
(n − m −1), |
|
1 − R 2 |
|||
если эти расчетные значения больше табличного при уровне значимости α и n-m-1 степенях свободы, то коэффициенты регрессии считаются статистически значимыми.
Существует большое количество пакетов прикладных программ, с помощью которых можно облегчить эконометрические расчеты. Они делятся на специализированные (Eviews, Stata, Statistica, Statgraphics) и
универсальные, из которых наиболее распространен Microsoft Excel. Решение примера приведем с использованием ППП MS Excel, как наиболее доступного.
Сводную таблицу основных статистических характеристик для одного или нескольких массивов данных можно получить с помощью инструмента Описательная статистика. Для этого необходимо выполнить следующие шаги: введите исходные данные, в главном меню выберите последовательно пункты Сервис/Анализ данных/Описательная статистика, после чего щелкните по кнопке Ок. Заполните диалоговое окно ввода данных и параметров вывода.
Пусть имеются следующие данные о ставках месячных доходов по трем акциям за шестимесячный период:
Акция |
|
|
Доходы по месяцам, % |
|
|
|||
А |
5,4 |
5,3 |
|
4,9 |
4,9 |
|
5,4 |
6,0 |
В |
6,3 |
6,2 |
|
6,1 |
5,8 |
|
5,7 |
5,7 |
С |
9,2 |
9,2 |
|
9,1 |
9,0 |
|
8,7 |
8,6 |
Есть основания предполагать, что доходы по акции С зависят от доходов по акциям А и В (линейные зависимости).
Матрицу парных коэффициентов корреляции переменных можно рассчитать, используя инструмент анализа данных Корреляция. Для этого в главном меню последовательно выберите пункты Сервис/Анализ данных/Корреляция, после чего щелкните по кнопке Ок. Заполните диалоговое окно ввода данных и параметров вывода. Матрица парных коэффициентов для данной задачи будет иметь вид:
А В С
А1
В |
-0,30807 |
1 |
|
С |
-0,62167 0,913009 |
1 |
|
