
Задача №8
По данным первых 15 наблюдений таблицы 1:
Определить линейное уравнение регрессии (капитал – факторный признак, прибыль – результативный);
Оценить адекватность модели с помощью средней ошибки аппроксимации.
Оценить тесноту связи между признаками с помощью коэффициента Фихнера, линейного коэффициента корреляции, корреляционного отношения, коэффициента детерминации, коэффициентов Спирмена и Кендалла.
Решение:
|
у |
х |
у*х |
х2 |
у2 |
|
|
1 |
481 |
895 |
430495 |
801025 |
231361 |
305,61175 |
0,5738924 |
2 |
146 |
893 |
130378 |
797449 |
21316 |
304,80353 |
0,5210029 |
3 |
365 |
866 |
316090 |
749956 |
133225 |
293,89256 |
0,2419505 |
4 |
239 |
772 |
184508 |
595984 |
57121 |
255,90622 |
0,0660641 |
5 |
306 |
771 |
235926 |
594441 |
93636 |
255,50211 |
0,1976418 |
6 |
57 |
743 |
42351 |
552049 |
3249 |
244,18703 |
0,7665724 |
7 |
265 |
711 |
188415 |
505521 |
70225 |
231,25551 |
0,1459186 |
8 |
158 |
648 |
102384 |
419904 |
24964 |
205,79658 |
0,2322516 |
9 |
129 |
608 |
78432 |
369664 |
16641 |
189,63218 |
0,3197357 |
10 |
340 |
600 |
204000 |
360000 |
115600 |
186,3993 |
0,8240412 |
11 |
167 |
565 |
94355 |
319225 |
27889 |
172,25545 |
0,0305096 |
12 |
41 |
556 |
22796 |
309136 |
1681 |
168,61846 |
0,7568475 |
13 |
258 |
536 |
138288 |
287296 |
66564 |
160,53626 |
0,6071136 |
14 |
35 |
530 |
18550 |
280900 |
1225 |
158,1116 |
0,7786374 |
15 |
298 |
516 |
153768 |
266256 |
88804 |
152,45406 |
0,9546872 |
Итого: |
3285 |
9694 |
2340736 |
7208806 |
953501 |
3284,9626 |
7,0168664 |
Среднее: |
219 |
646,27 |
156049,07 |
480587,07 |
63566,73 |
- |
0,4677911 |
|
15605,733 |
62926,462 |
- |
- |
- |
- |
- |
|
124,923 |
250,851 |
- |
- |
- |
- |
- |
а0 = -56,0667
а1 = 0,40411
Получим
следующее уравнение регрессии:
,
Следовательно,
с увеличением капитала на 1 млрд. руб.
сумма прибыли возрастает в среднем на
0,40411 млрд.руб.
2.
Адекватность полученной модели оценим
с помощью средней ошибки аппроксимации:
.
Ее значение не должно превышать 12 –
15%, в нашем случае модель считается
неадекватной.
3. Оценить тесноту связи между признаками с помощью коэффициента Фихнера, линейного коэффициента корреляции, корреляционного отношения, коэффициента детерминации, коэффициентов Спирмена и Кендалла.
Тесноту связи для парной регрессии оцените с помощью линейного Коэффициента корреляции:
0,425
(42,5%)
Связь слабая, зависимость прямая.
Корреляционного отношения:
0,425
где:
- общее среднее значение результативного
признака;
-
значения результативного признака,
рассчитанные по уравнению регрессии.
Коэффициент детерминации :
Вариация результата на 18% зависит от вариации фактора х.
Коэффициента Фихнера, основанного на количестве совпадений и несовпадений знаков отклонений индивидуальных значений факторного и результативного признаков от их средних значений:
у |
х |
|
|
с/н |
481 |
895 |
262 |
248,73 |
с |
146 |
893 |
-73 |
246,73 |
н |
365 |
866 |
146 |
219,73 |
с |
239 |
772 |
20 |
125,73 |
с |
306 |
771 |
87 |
124,73 |
с |
57 |
743 |
-162 |
96,73 |
н |
265 |
711 |
46 |
64,73 |
с |
158 |
648 |
-61 |
1,73 |
н |
129 |
608 |
-90 |
-38,27 |
с |
340 |
600 |
121 |
-46,27 |
н |
167 |
565 |
-52 |
-81,27 |
с |
41 |
556 |
-178 |
-90,27 |
с |
258 |
536 |
39 |
-110,27 |
н |
35 |
530 |
-184 |
-116,27 |
с |
298 |
516 |
79 |
-130,27 |
н |
481 |
895 |
262 |
248,73 |
с |
146 |
893 |
-73 |
246,73 |
н |
где: С – количество совпадений; Н – количество несовпадений.
Связь между факторным и результативным признаком слабая.
Ранговые коэффициенты Спирмена и Кендалла.
х |
у |
№ х |
№ у |
|
P |
Q |
895 |
481 |
15 |
11 |
16 |
4 |
10 |
893 |
146 |
14 |
1 |
169 |
13 |
0 |
866 |
365 |
13 |
9 |
16 |
5 |
7 |
772 |
239 |
12 |
2 |
100 |
11 |
0 |
771 |
306 |
11 |
7 |
16 |
6 |
4 |
743 |
57 |
10 |
13 |
9 |
2 |
7 |
711 |
265 |
9 |
4 |
25 |
7 |
1 |
648 |
158 |
8 |
6 |
4 |
5 |
2 |
608 |
129 |
7 |
10 |
9 |
3 |
3 |
600 |
340 |
6 |
3 |
9 |
5 |
0 |
565 |
167 |
5 |
12 |
49 |
2 |
2 |
556 |
41 |
4 |
8 |
16 |
2 |
1 |
536 |
258 |
3 |
14 |
121 |
1 |
1 |
530 |
35 |
2 |
5 |
9 |
0 |
0 |
516 |
298 |
1 |
15 |
196 |
0 |
0 |
Итого |
|
|
|
764 |
66 |
38 |
Связь между признаками можно признать статистически значимой, если значения коэффициентов ранговой корреляции Спирмена и Кендалла больше 0,5.
Коэффициент Спирмена рассчитывается по формуле:
=
-0,364
где
- квадраты разности рангов; n
– число наблюдений (число пар рангов).
Так как значение коэффициента Спирмена
< 0.5, связь между признаками отсутствует.
Ранговый коэффициент корреляции Кендалла (τ) рассчитывается по формуле:
где: n – число наблюдений; S – сумма разностей между числом последовательностей и числом инверсий по второму признаку.
Так как значение коэффициента Спирмена < 0.5, связь между признаками незначима.