- •Исходные данные
- •1.1 Доля заработной платы в объеме продукции
- •1.2 Фондовооруженность рабочих
- •1.3 Производительность труда одного рабочего, р/чел.
- •Задание 2. Рассчитать средние показатели по всей совокупности предприятий Средняя величина - обобщенная количественная характеристика признака в статистической совокупности.
- •2. 1. Средний фонд заработной платы, тыс.Р
- •2.2 Средняя доля заработной платы работников предприятия в объеме продукции, %
- •3. 2. Комбинационная группировка
- •Задание 4. Осуществить проверку статистической совокупности на однородность с использованием коэффициента вариации по признаку среднегодовая стоимость основных фондов
- •Задание 5. По результатам простой группировки определить взаимосвязь (с использованием дисперсий) между двумя показателями:
- •7.1. В качестве исходной информации использовать индивидуальные значения признаков по предприятиям
- •8. Сравнить и проанализировать результаты расчетов в п. 5, 6, 7
- •9.1 Коэффициент конкордации
- •9.2 Множественный коэффициент корреляции
- •9. 3. Парные коэффициенты корреляции
- •9. 4. Частные коэффициенты корреляции
- •Список используемой литературы
7.1. В качестве исходной информации использовать индивидуальные значения признаков по предприятиям
Линейная зависимость
Данный вид зависимости описывается уравнением:
Для определения параметров а0 и а1 на основе требований метода наименьших квадратов составляется система нормальных уравнений:
,
,
где:
xi – индивидуальное значение факторного признакf,
yi – индивидуальное значение результативного признакf,
– параметры
уравнения регрессии.
Из решения системы уравнений получаются следующие параметры уравнения регрессии:
;
;
Для нахождения параметров уравнения составим вспомогательную таблицу (Таблица 8).
Таблица 8
№ предприятия |
Объем товарной продукции |
Фондовооруженность рабочих |
|
|
|
1 |
163,8 |
1,09151 |
26830,44 |
178,7893
|
1,191394
|
2 |
236,5 |
1,32062 |
55932,25 |
312,3266
|
1,744037
|
3 |
843,3 |
0,77211 |
711154,9 |
651,1204
|
0,596154
|
4 |
1005,9 |
0,77764 |
1011835 |
782,2281
|
0,604724
|
5 |
696,3 |
0,9403 |
484833,7 |
654,7309
|
0,884164
|
6 |
1031,3 |
1,09603 |
1063580 |
1130,336
|
1,201282
|
7 |
1361,2 |
1,19317 |
1852865 |
1624,143
|
1,423655
|
8 |
1712,9 |
1,29405 |
2934026 |
2216,578
|
1,674565
|
9 |
538,9 |
0,7733 |
290413,2 |
416,7314
|
0,597993
|
10 |
350,4 |
2,04672 |
122780,2 |
717,1707
|
4,189063
|
11 |
2149,9 |
1,17244 |
4622070 |
2520,629
|
1,374616
|
12 |
352,8 |
0,97717 |
124467,8 |
344,7456
|
0,954861
|
13 |
1187,1 |
0,95913 |
1409206 |
1138,583
|
0,91993
|
14 |
262,4 |
1,45675 |
68853,76 |
382,2512
|
2,122121
|
15 |
438,8 |
1,06686 |
192545,4 |
468,1382
|
1,13819
|
16 |
1150,5 |
0,94828 |
1323650 |
1090,9961
|
0,899235
|
17 |
249,4 |
0,75098 |
62200,36 |
187,29441
|
0,563971
|
18 |
655,3 |
0,73333 |
429418,1 |
480,55115
|
0,537773
|
19 |
2549,5 |
1,2371 |
6499950 |
3153,9865
|
1,530416
|
20 |
536,8 |
0,98142 |
288154,2 |
526,82626
|
0,963185
|
21 |
311,2 |
1,91848 |
96845,44 |
597,03098
|
3,680566
|
22 |
809,7 |
1,01566 |
655614,1 |
822,3799
|
1,031565
|
23 |
166,7 |
0,9647 |
27788,89 |
160,81549
|
0,930646
|
24 |
2185,1 |
1,16497 |
4774662 |
2545,5759
|
1,357155
|
25 |
2066,2 |
1,29405 |
4269182 |
2673,7661
|
1,674565
|
|
|||||
∑ |
23011,9 |
27,94677 |
33398861 |
25777,724
|
33,78583
|
а0 =1,113848
а1 =4,37034
y =1,113848+4,37034*х
Т.к. ai>0, то связь между исследуемыми признаками является прямой, т.е. увеличение факторного признака влечет за собой увеличение и результативного признака.
Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции, который определяется по формуле:
rxy
=
=4,6134
Величина линейного коэффициента корреляции 4,6134 говорит о наличии тесной прямой связи между объемом товарной продукции и фондовооруженности рабочих.
Так же наличие этой связи можно рассмотреть на графике:
При подборе адекватной математической функции важное значение имеет остаточная дисперсия результативного признака.
,
где
– эмпирическое
(фактическое) значение результативного
признака.
–
выровненное
значение результативного признака.
Чем меньше остаточная дисперсия, тем лучше подбор линии регрессии, т.к эта линия должна проходить в максимальной близости от эмпирических данных. Таким образом, сравнив остаточную дисперсию двух видов зависимостей, мы сможем сделать вывод о том, какая из них подходит больше.
Рассчитаем остаточные дисперсии результативного признака для степенной зависимости.
Расчетная таблица для определения дисперсии результативного признака (Таблица 9).
Таблица 9
№ предприятия |
Фондовооруженность рабочих |
Y(x) |
(y-y(x))2 |
|
1 |
1,09151 |
5,8841178 |
22,96909 |
|
2 |
1,32062 |
6,8854064 |
30,96685 |
|
3 |
0,77211 |
4,4882312 |
13,80956 |
|
4 |
0,77764 |
4,5123991 |
13,94843 |
|
5 |
0,9403 |
5,2232787 |
18,34391 |
|
6 |
1,09603 |
5,9038717 |
23,11534 |
|
7 |
1,19317 |
6,3284065 |
26,37065 |
|
8 |
1,29405 |
6,769286 |
29,97821 |
|
9 |
0,7733 |
4,4934319 |
13,83938 |
|
10 |
2,04672 |
10,05871 |
64,19198 |
|
11 |
1,17244 |
6,2378094 |
25,65797 |
|
12 |
0,97717 |
5,3844131 |
19,42379 |
|
13 |
0,95913 |
5,3055722 |
18,89156 |
|
14 |
1,45675 |
7,4803407 |
36,28364 |
|
15 |
1,06686 |
5,7763889 |
22,17966 |
|
16 |
0,94828 |
5,258154 |
18,57501 |
|
17 |
0,75098 |
4,3958859 |
13,28534 |
|
18 |
0,73333 |
4,3187494 |
12,85523 |
|
19 |
1,2371 |
6,5203956 |
27,91321 |
|
20 |
0,98142 |
5,402987 |
19,55025 |
|
21 |
1,91848 |
9,4982578 |
57,45303 |
|
22 |
1,01566 |
5,5526275 |
20,58407 |
|
23 |
0,9647 |
5,3299149 |
19,0551 |
|
24 |
1,16497 |
6,2051629 |
25,40354 |
|
25 |
1,29405 |
6,7692864 |
29,97821 |
|
|
||||
Итого |
27,94677 |
149,983085 |
624,623 |
|
=
=24,98492
Степенная зависимость
Данный вид зависимости описывается уравнением:
Для определения параметров производится логарифмирование степенной функции:
Для определения параметров логарифмической функции строится система нормальных уравнений по способу наименьших квадратов:
Для нахождения параметров уравнения составим вспомогательную таблицу (Таблица 10).
Таблица 10
№ предприятия |
Объем товарной продукции |
Фондовооруженность рабочих |
lg x |
( lg x)2 |
lg y |
lg y * lg x |
1 |
163,8 |
1,09151 |
2,214314 |
4,903186 |
0,038027 |
0,084204 |
2 |
236,5 |
1,32062 |
2,373831 |
5,635074 |
0,120778 |
0,286707 |
3 |
843,3 |
0,77211 |
2,925982 |
8,561371 |
-0,11232 |
-0,32865 |
4 |
1005,9 |
0,77764 |
3,002555 |
9,015335 |
-0,10922 |
-0,32794 |
5 |
696,3 |
0,9403 |
2,842796 |
8,081491 |
-0,02673 |
-0,07599 |
6 |
1031,3 |
1,09603 |
3,013385 |
9,080489 |
0,039822 |
0,119999 |
7 |
1361,2 |
1,19317 |
3,133922 |
9,821467 |
0,076702 |
0,240378 |
8 |
1712,9 |
1,29405 |
3,233732 |
10,45702 |
0,11195 |
0,362016 |
9 |
538,9 |
0,7733 |
2,731508 |
7,461137 |
-0,11165 |
-0,30497 |
10 |
350,4 |
2,04672 |
2,544564 |
6,474806 |
0,311058 |
0,791507 |
11 |
2149,9 |
1,17244 |
3,332418 |
11,10501 |
0,06909 |
0,230237 |
12 |
352,8 |
0,97717 |
2,547529 |
6,489902 |
-0,01003 |
-0,02555 |
13 |
1187,1 |
0,95913 |
3,074487 |
9,452472 |
-0,01812 |
-0,05571 |
14 |
262,4 |
1,45675 |
2,418964 |
5,851386 |
0,163385 |
0,395222 |
15 |
438,8 |
1,06686 |
2,642267 |
6,981573 |
0,028107 |
0,074266 |
16 |
1150,5 |
0,94828 |
3,060887 |
9,369027 |
-0,02306 |
-0,07058 |
17 |
249,4 |
0,75098 |
2,396896 |
5,745113 |
-0,12437 |
-0,2981 |
18 |
655,3 |
0,73333 |
2,81644 |
7,932335 |
-0,1347 |
-0,37937 |
19 |
2549,5 |
1,2371 |
3,406455 |
11,60394 |
0,0924 |
0,314756 |
20 |
536,8 |
0,98142 |
2,729813 |
7,451876 |
-0,0081 |
-0,02211 |
21 |
311,2 |
1,91848 |
2,49304 |
6,215246 |
0,8296 |
2,068226 |
22 |
809,7 |
1,01566 |
2,908324 |
8,458349 |
0,00675 |
0,019631 |
23 |
166,7 |
0,9647 |
2,221936 |
4,936998 |
-0,0156 |
-0,03466 |
24 |
2185,1 |
1,16497 |
3,339471 |
11,15207 |
0,0663 |
0,221407 |
25 |
2066,2 |
1,29405 |
3,315172 |
10,99037 |
0,11195 |
0,371134 |
|
||||||
Итого |
23011,9 |
27,94677 |
70,72069 |
203,227 |
1,372019 |
3,656048 |
a0 =0,003
a1 =0,315
y = 0,003*х0,315
При парных нелинейных зависимостях для определения тесноты связи между результативным и факторным признаками и оценки степени влияния факторного признака на результативный используются индексы корреляции и детерминации.
Индекс корреляции:
,
где
-
факторная дисперсия результативного
признака y;
- общая дисперсия
результативного признака.
Величина индекса корреляции находится в пределах от -1 до +1. Чем ближе по абсолютной величине индекс корреляции к 1, тем теснее связь.
Факторная дисперсия рассчитывается по следующей формуле:
,
где
-
теоретическое значение результативного
признака (значение линии регрессии) при
значении факторного признака xi;
- среднее значение
результативного признака.
Общая дисперсия результативного признака:
,
где
yi – эмпирическое значение результативного признака.
Индекс детерминации
Показывает долю факторной дисперсии в общей дисперсии, т.е. характеризует, какая часть общей вариации результативного признака y объясняется изучаемым фактором x.
Таблица 11
№ предприятия |
Объем товарной продукции |
Фондовооруженность Рабочих |
|
(
-
|
|
( |
1 |
163,8 |
1,09151 |
0,0149496 |
-1,089554 |
1,187128 |
-0,0129885 |
2 |
236,5 |
1,32062 |
0,0167833 |
-1,08772 |
1,1831355 |
0,2161242 |
3 |
843,3 |
0,77211 |
0,0250499 |
-1,079454 |
1,1652204 |
-0,3323935 |
4 |
1005,9 |
0,77764 |
0,0264805 |
-1,078023 |
1,1621339 |
-0,3268546 |
5 |
696,3 |
0,9403 |
0,0235832 |
-1,08092 |
1,1683891 |
-0,1641953 |
6 |
1031,3 |
1,09603 |
0,0266893 |
-1,077814 |
1,1616837 |
-0,0084719 |
7 |
1361,2 |
1,19317 |
0,0291277 |
-1,075376 |
1,1564333 |
0,0886741 |
8 |
1712,9 |
1,29405 |
0,0313146 |
-1,073189 |
1,1517347 |
0,1895558 |
9 |
538,9 |
0,7733 |
0,0217544 |
-1,082749 |
1,172346 |
-0,3312005 |
10 |
350,4 |
2,04672 |
0,0189959 |
-1,085508 |
1,1783271 |
0,9422253 |
11 |
2149,9 |
1,17244 |
0,0336382 |
-1,070865 |
1,1467527 |
0,0679395 |
12 |
352,8 |
0,97717 |
0,0190367 |
-1,085467 |
1,1782384 |
-0,1273297 |
13 |
1187,1 |
0,95913 |
0,0278988 |
-1,076605 |
1,1590781 |
-0,1453732 |
14 |
262,4 |
1,45675 |
0,0173418 |
-1,087162 |
1,1819208 |
0,3522531 |
15 |
438,8 |
1,06686 |
0,0203908 |
-1,084113 |
1,1753005 |
-0,0376362 |
16 |
1150,5 |
0,94828 |
0,0276249 |
-1,076879 |
1,1596678 |
-0,1562218 |
17 |
249,4 |
0,75098 |
0,0170665 |
-1,087437 |
1,1825196 |
-0,3535168 |
18 |
655,3 |
0,73333 |
0,0231366 |
-1,081367 |
1,1693546 |
-0,3711703 |
19 |
2549,5 |
1,2371 |
0,035494 |
-1,06901 |
1,1427817 |
0,1325974 |
20 |
536,8 |
0,98142 |
0,0217276 |
-1,082776 |
1,1724039 |
-0,460776 |
21 |
311,2 |
1,91848 |
0,0182991 |
-1,086205 |
1,1798404 |
0,8139798 |
22 |
809,7 |
1,01566 |
0,0247311 |
-1,079773 |
1,1659087 |
-0,0888384 |
23 |
166,7 |
0,9647 |
0,0150325 |
-1,089471 |
1,1869474 |
-0,1397978 |
24 |
2185,1 |
1,16497 |
0,0338107 |
-1,070693 |
1,1463833 |
0,0604753 |
25 |
2066,2 |
1,29405 |
0,0332201 |
-1,071284 |
1,1476485 |
0,19294 |
|
||||||
Итого |
23011,9 |
27,94677 |
0,6031778 |
-27,00941 |
29,181278 |
-9,659E-15 |
Rxy
=
=
0,9727504
By
= r2xy
=
=
0,03422835991
Вывод: Данный полученный индекс корреляции свидетельствует о том, что связь между объемом товарной продукции и фондовооруженностью рабочих тесная.
Рассчитаем остаточную дисперсию результативного признака:
Сравним индекс корреляции результативного признака у линейной и степенной зависимости. У линейной зависимости он равен 0,00366176, а у степенной 0,0486132. Чем больше индекс корреляции, тем лучше подбор линии регрессии. Таким образом, надо выбрать степенной вид зависимости. Эта линия должна проходить в максимальной близости от эмпирических данных.
Так же это можно рассмотреть на графике, где изображены исследуемые виды зависимостей.
7.2. В качестве исходной информации использовать сгруппированные данные, представить в виде корреляционной таблицы, исследовать линейный вид зависимости. Сравнить результаты расчетов, полученные в п. 7.1. и в п. 7.2
Модель регрессии может быть построена по сгруппированным данным (таблица 12). Для выявления связи между признаками по достаточно большому количеству наблюдений используется корреляционная таблица. В корреляционной таблице можно отобразить только парную связь, т.е. связь результативного признака только с одним фактором, и на её основе построить уравнение регрессии и определить показатель тесноты связи.
Для составления корреляционной таблицы парной связи статистические данные необходимо сгруппировать по обоим признакам, затем построить таблицу, по строкам отложить группы результативного, а по столбцам – группы факторного признака.
В таблице 12 данные сгруппированы по признакам:
Объем товарной продукции
Фондовооруженность рабочих
Таблица 12
Фондовооруженность рабочих |
х y |
Объем товарной продукции. |
fy |
yfy |
xyfy |
|||
163,8-959,033 |
959,033-1724,266 |
1724,266-2549,5 |
||||||
447,391667 |
1241,4833 |
2300,04 |
||||||
0,01366 -0,02281 |
0,01734667 |
9 |
3 |
0 |
12 |
0,208160004 |
93,1290511 |
|
0,02281-0,03196 |
0,02804167 |
6 |
0 |
0 |
6 |
0,168250002 |
75,2736488 |
|
0,03196- 0,04111 |
0,03612 |
0 |
3 |
4 |
7 |
0,25284 |
113,11851 |
|
fx |
15 |
6 |
4 |
25 |
|
|||
xfx |
6710,875 |
7448,53999 |
9200,16 |
|
||||
х2fx |
3002389,5515 |
9247238,24 |
2116736 |
|
||||
Корреляционная таблица дает общее представление о направлении связи. В нашем случае связь прямая.
Для определения коэффициентов уравнения воспользуемся системой нормальных уравнений вида:
Уравнение регрессии имеет вид:
a0 = -0,0132100912
a1 = 0,00004107534
y = 0,00004107534*х-0,0132100912
