Задание 7.
Определить тесноту парной связи и форму связи с использованием корреляционно-регрессивного анализа между признаками среднегодовая стоимость основных фондов и среднесписочная численность рабочих.
7.1. В качестве исходной информации использовать индивидуальные значения признаков по предприятиям.
Линейная зависимость:
Данный вид зависимости описывается уравнением:
Для
определения параметров
и
на основе требований метода наименьших
квадратов составляется система нормальных
уравнений:
Где:
-
индивидуальное значение соответственно
факторного и результативного признаков;
-
параметры уравнения регрессии.
Из решения системы уравнений получаются следующие параметры уравнения регрессии.
Для нахождения параметров уравнения составим вспомогательную таблицу (Таблица 8).
Таблица 8
Номер предприятия |
Среднегодовая стоимость основных фондов |
Среднесписочная численность рабочих |
|
|
|
1 |
180,1 |
165 |
32436,01 |
29716,5 |
27225 |
2 |
294,5 |
223 |
86730,25 |
65673,5 |
49729 |
3 |
420,8 |
545 |
177072,6 |
229336 |
297025 |
4 |
469,7 |
604 |
220618,1 |
283698,8 |
364816 |
5 |
426,9 |
454 |
182243,6 |
193812,6 |
206116 |
6 |
552,4 |
504 |
305145,8 |
278409,6 |
254016 |
7 |
664,6 |
563 |
441693,2 |
374169,8 |
316969 |
8 |
784,2 |
606 |
614969,6 |
475225,2 |
367236 |
9 |
341,8 |
442 |
116827,2 |
151075,6 |
195364 |
10 |
438 |
214 |
191844 |
93732 |
45796 |
11 |
825,4 |
704 |
681285,2 |
581081,6 |
495616 |
12 |
179,8 |
184 |
32328,04 |
33083,2 |
33856 |
13 |
551,5 |
575 |
304152,3 |
317112,5 |
330625 |
14 |
323,4 |
222 |
104587,6 |
71794,8 |
49284 |
15 |
354,2 |
332 |
125457,6 |
117594,4 |
110224 |
16 |
551,9 |
582 |
304593,6 |
321205,8 |
338724 |
17 |
228,3 |
304 |
52120,89 |
69403,2 |
92416 |
18 |
367,4 |
501 |
134982,8 |
184067,4 |
251001 |
19 |
930,3 |
752 |
865458,1 |
699585,6 |
565504 |
20 |
179,6 |
275 |
32256,16 |
49390 |
75625 |
21 |
404,8 |
211 |
163863 |
85412,8 |
44521 |
22 |
473,3 |
466 |
224012,9 |
220557,8 |
217156 |
23 |
180,4 |
187 |
32544,16 |
33734,8 |
34969 |
24 |
828,3 |
711 |
686080,9 |
588921,3 |
505521 |
25 |
862,8 |
665 |
744423,8 |
573762 |
442225 |
∑ |
11814,4 |
10991 |
6857727 |
6121557 |
5711559 |
y=
+
*x
Т.
к.
,
то связь между исследуемыми признаками
является прямой, т. е. увеличение
факторного признака влечёт за собой
увеличение и результативного признака.
Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции, который определяется по формуле:
=
Величина линейного коэффициента корреляции 0,876 говорит о наличии тесной прямой связи между среднегодовой стоимостью основных фондов и среднесписочной численностью рабочих.
Так же наличие этой связи можно рассмотреть на графике:
При подборе адекватной математической функции важное значение имеет остаточная дисперсия результативного признака.
Где:
-
соответственно эмпирическое (фактическое)
и выровненные значения результативного
признака.
Чем меньше остаточная дисперсия, тем лучше подбор линии регрессии, т. к. эта линия должна проходить в максимальной близости от эмпирических данных. Таким образом, сравнив остаточную дисперсию двух видов зависимостей, мы сможем сделать вывод о том, какая из них подходит больше.
Рассчитаем остаточные дисперсии результативного признака для степенной зависимости.
Расчётная таблица для определения дисперсии результативного признака (Таблица 9).
Таблица 9.
-
Номер предприятия
Среднесписочная численность рабочих
у(х)
1
165
226,80
3819,82
2
223
310,05
7578,35
3
545
401,96
20459,77
4
604
437,55
27706,62
5
454
406,40
2265,63
6
504
497,73
39,34
7
563
579,38
268,17
8
606
666,41
3649,24
9
442
344,47
9511,32
10
214
414,48
40191,76
11
704
696,39
57,91
12
184
226,59
1813,60
13
575
497,07
6072,64
14
222
331,08
11899,38
15
332
353,50
462,14
16
582
497,36
7163,26
17
304
261,88
1774,10
18
501
363,10
19015,55
19
752
772,73
429,57
20
275
226,44
2357,99
21
211
390,32
32155,36
22
466
440,17
667,36
23
187
227,02
1601,84
24
711
698,50
156,24
25
665
723,61
3434,69
Итого
10991
204551,64
Степенная зависимость:
Данный вид зависимости описывается уравнением:
Для определения параметров производится логарифмирование степенной функции:
Для определения параметров логарифмической функции строится система нормальных уравнений по способу наименьших квадратов:
Для нахождения параметров уравнения составим вспомогательную таблицу (Таблица 10).
Таблица 10.
Номер предприятия |
Среднегодовая стоимость основных фондов |
Среднесписочная численность рабочих |
lgx |
|
lgy |
lgy*lgx |
1 |
180,1 |
165 |
2,26 |
5,09 |
2,22 |
5 |
2 |
294,5 |
223 |
2,47 |
6,10 |
2,35 |
5,80 |
3 |
420,8 |
545 |
2,62 |
6,89 |
2,74 |
7,18 |
4 |
469,7 |
604 |
2,67 |
7,14 |
2,78 |
7,43 |
5 |
426,9 |
454 |
2,63 |
6,92 |
2,66 |
6,99 |
6 |
552,4 |
504 |
2,74 |
7,52 |
2,70 |
7,41 |
7 |
664,6 |
563 |
2,82 |
7,97 |
2,75 |
7,76 |
8 |
784,2 |
606 |
2,89 |
8,38 |
2,78 |
8,05 |
9 |
341,8 |
442 |
2,53 |
6,42 |
2,65 |
6,70 |
10 |
438 |
214 |
2,64 |
6,98 |
2,33 |
6,16 |
11 |
825,4 |
704 |
2,92 |
8,51 |
2,85 |
8,31 |
12 |
179,8 |
184 |
2,25 |
5,08 |
2,26 |
5,11 |
13 |
551,5 |
575 |
2,74 |
7,52 |
2,76 |
7,57 |
14 |
323,4 |
222 |
2,51 |
6,30 |
2,35 |
5,89 |
15 |
354,2 |
332 |
2,55 |
6,50 |
2,52 |
6,43 |
16 |
551,9 |
582 |
2,74 |
7,52 |
2,76 |
7,58 |
17 |
228,3 |
304 |
2,36 |
5,56 |
2,48 |
5,86 |
18 |
367,4 |
501 |
2,57 |
6,58 |
2,70 |
6,93 |
19 |
930,3 |
752 |
2,97 |
8,81 |
2,88 |
8,54 |
20 |
179,6 |
275 |
2,25 |
5,08 |
2,44 |
5,50 |
21 |
404,8 |
211 |
2,61 |
6,80 |
2,32 |
6,06 |
22 |
473,3 |
466 |
2,68 |
7,16 |
2,67 |
7,14 |
23 |
180,4 |
187 |
2,26 |
5,09 |
2,27 |
5,13 |
24 |
828,3 |
711 |
2,92 |
8,52 |
2,85 |
8,32 |
25 |
862,8 |
665 |
2,94 |
8,62 |
2,82 |
8,29 |
Итого |
11814,4 |
10991 |
65,54 |
173,03 |
64,89 |
171,11 |
lgy
=
-
*lgx
При парных нелинейных зависимостях для определения тесноты связи между результативным и факторным признаками и оценки степени влияния факторного признака на результативный используются индексы корреляции и детерминации.
Индекс корреляции:
Где:
-
факторная дисперсия результативного
признака у;
-
общая дисперсия результативного
признака.
Величина индекса корреляции находится в пределах от -1 до +1. Чем ближе по абсолютной величине индекс корреляции к 1, тем теснее связь.
Факторная дисперсия рассчитывается следующим образом:
Где:
-
теоретическое значение результативного
признака (значение линии регрессии) при
значении факторного признака
;
-
среднее значение результативного
признака.
Общая дисперсия результативного признака:
Где:
-
эмпирическое значение результативного
признака.
Индекс детерминации
Показывает долю факторной дисперсии в общей дисперсии, т. е. характеризует, какая часть общей вариации результативного признака у объясняется изучаемым фактором х.
Таблица 11.
Номер предприятия |
Среднегодовая стоимость основных фондов |
Среднесписочная численность рабочих |
|
|
|
|
1 |
180,1 |
165 |
408,23 |
986,81 |
75427,13 |
59159,08 |
2 |
294,5 |
223 |
408,22 |
987,19 |
46932,89 |
34306,58 |
3 |
420,8 |
545 |
408,22 |
987,47 |
11100,73 |
18709,86 |
4 |
469,7 |
604 |
408,21 |
987,55 |
27014,21 |
38331,90 |
5 |
426,9 |
454 |
408,22 |
987,48 |
206,21 |
2096,19 |
6 |
552,4 |
504 |
408,21 |
987,68 |
4142,21 |
9175,21 |
7 |
664,6 |
563 |
408,21 |
987,82 |
15217,69 |
23959,82 |
8 |
784,2 |
606 |
408,21 |
987,95 |
27675,65 |
39121,53 |
9 |
341,8 |
442 |
408,22 |
987,31 |
5,57 |
1141,19 |
10 |
438 |
214 |
408,22 |
987,50 |
50913,41 |
37719,66 |
11 |
825,4 |
704 |
408,21 |
987,99 |
69886,21 |
87493,06 |
12 |
179,8 |
184 |
408,23 |
986,81 |
65351,81 |
50277,48 |
13 |
551,5 |
575 |
408,21 |
987,68 |
18322,33 |
27818,01 |
14 |
323,4 |
222 |
408,22 |
987,27 |
47367,17 |
34677,60 |
15 |
354,2 |
332 |
408,22 |
987,34 |
11586,37 |
5809,20 |
16 |
551,9 |
582 |
408,21 |
987,68 |
20266,37 |
30202,03 |
17 |
228,3 |
304 |
408,22 |
987,00 |
18398,21 |
10862,54 |
18 |
367,4 |
501 |
408,22 |
987,36 |
3765,05 |
8608,56 |
19 |
930,3 |
752 |
408,21 |
988,08 |
97568,77 |
118194,1 |
20 |
179,6 |
275 |
408,23 |
986,81 |
27106,33 |
17749,28 |
21 |
404,8 |
211 |
408,22 |
987,44 |
52276,25 |
38894,34 |
22 |
473,3 |
466 |
408,21 |
987,56 |
694,85 |
3339,16 |
23 |
180,4 |
187 |
408,23 |
986,82 |
63826,97 |
48941,11 |
24 |
828,3 |
711 |
408,21 |
987,99 |
73636,25 |
91683,17 |
25 |
862,8 |
665 |
408,21 |
988,02 |
50787,13 |
65942,54 |
Итого |
11814,4 |
10991 |
10205 |
24686,59 |
879475,8 |
904213,2 |
Вывод: данный полученный индекс корреляции свидетельствует о том, что связь между среднегодовой стоимостью основных фондов и среднесписочной численностью рабочих отсутствует.
Рассчитаем остаточную дисперсию результативного признака:
Сравним индекс корреляции результативного признака у линейной и степенной зависимости. У линейной зависимости он равен , а у степенной 0,168. Чем больше индекс корреляции, тем лучше подбор линии регрессии. Таким образом, надо выбрать линейный вид зависимости. Эта линия должна проходить в максимальной близости от эмпирических данных.
Так же это можно рассмотреть на графике, где изображены исследуемые виды зависимостей.
7.2. Исследовать линейный вид зависимости
Модель регрессии может быть построена по сгруппированным данным (Таблица 12). Для выявления связи между признаками по достаточно большому количеству наблюдений используется корреляционная таблица. В корреляционной таблице можно отобразить только парную связь, т. е. связь результативного признака только с одним фактором, и на её основе построить уравнение регрессии и определить показатель тесноты связи.
Для составления корреляционной таблицы парной связи статистические данные необходимо сгруппировать по обоим признакам, затем построить таблицу, по строкам отложить группы результативного, а по столбцам - группы факторного признака.
Таблица 12
Среднесписочная численность рабочих |
x
y |
Среднегодовая стоимость основных фондов |
|
|
|
||||
179,6-429,83 |
429,83-680,06 |
680,06-930,3 |
|||||||
298,62 |
528,77 |
846,2 |
|||||||
165-360,67 |
231,7 |
9 |
1 |
- |
10 |
2317 |
691902,5 |
||
360,67-556,33 |
485,3 |
4 |
2 |
- |
6 |
2911,8 |
1539673 |
||
556,33-752 |
640,2 |
- |
4 |
5 |
9 |
5761,8 |
4875635,2 |
||
|
13 |
7 |
5 |
25 |
|
|
|||
|
3882,06 |
3701,39 |
4231 |
|
|
|
|||
|
1159260,76 |
1957183,99 |
3580272,2 |
|
|
|
|||
Корреляционная таблица даёт общее представление о направлении связи. В нашем случае связь прямая.
Для определения коэффициентов уравнения воспользуемся системой нормальных уравнений вида:
Уравнение регрессии имеет вид:
