Массив первичных данных
№ |
Среднегодовая численность занятых в экономике за 2001 г., тыс. чел., Х |
ВРП, млн. руб., У |
19 |
329,9 |
23649,7 |
20 |
330,4 |
15484,0 |
21 |
339,8 |
34041,4 |
22 |
339,8 |
20583,1 |
23 |
394,3 |
30750,4 |
24 |
401,2 |
24318,1 |
25 |
404,9 |
31327,3 |
26 |
416,3 |
30667,0 |
27 |
426,7 |
36521,1 |
28 |
428,5 |
38820,2 |
29 |
433,5 |
58936,8 |
30 |
450,8 |
25190,6 |
31 |
459,8 |
36495,9 |
32 |
464,7 |
64006,8 |
33 |
473,7 |
99984,8 |
34 |
484,1 |
33958,5 |
35 |
487,9 |
38559,4 |
36 |
490,6 |
22078,8 |
37 |
504,7 |
88508,5 |
38 |
514 |
33367,2 |
39 |
534,7 |
44011,4 |
40 |
569,5 |
51162,1 |
41 |
596,1 |
32004,7 |
42 |
606,4 |
38258,7 |
43 |
609,3 |
68040 |
44 |
609,3 |
40734,5 |
45 |
609,5 |
33645,7 |
46 |
624,1 |
69862 |
47 |
663,2 |
71025,1 |
48 |
664,9 |
51113 |
Задание№2
Проверить первичные данные на однородность по факторному признаку. Исключить резко выделяющиеся (аномальные) единицы из массива первичных данных (при наличии таковых).
Решение:
Для начала составим вспомогательную таблицу для расчёта среднего и дисперсии по несгруппированным данным:
Таблица 3
Вспомогательная таблица
№ |
Среднегодовая численность занятых в экономике за 2001 г., тыс. чел., Х |
|Xi - Xср| |
(Xi - Xср) 2 |
19 |
329,9 |
158,87 |
25238,09 |
20 |
330,4 |
15837 |
25077,89 |
21 |
339,8 |
148,97 |
22189,09 |
22 |
339,8 |
148,97 |
22189,09 |
23 |
394,3 |
94,46 |
8922,69 |
24 |
401,2 |
87,56 |
7666,76 |
25 |
404,9 |
83.86 |
7032,5 |
26 |
416,3 |
72,46 |
5250,4516 |
27 |
426,7 |
62,06 |
3851,4436 |
28 |
428,5 |
60,24 |
3630,0624 |
29 |
433,5 |
55,26 |
3053,6676 |
30 |
450,8 |
37,96 |
1440,9616 |
31 |
459,8 |
28,96 |
838,6816 |
32 |
464,7 |
24,06 |
578,8836 |
33 |
473,7 |
15,06 |
226,8036 |
34 |
484,1 |
4,66 |
21,7156 |
35 |
487,9 |
0,86 |
0,7396 |
36 |
490,6 |
1,84 |
3,3856 |
37 |
504,7 |
15,94 |
254,0836 |
38 |
514 |
25,24 |
637,0576 |
39 |
534,7 |
45,94 |
2110,4836 |
40 |
569,5 |
80,74 |
651894,76 |
41 |
596,1 |
107,34 |
11521,875 |
42 |
606,4 |
117,64 |
13839,169 |
43 |
609,3 |
120,54 |
14529,891 |
44 |
609,3 |
120,54 |
14529,891 |
45 |
609,5 |
120,74 |
14578,147 |
46 |
624,1 |
135,34 |
18316,915 |
47 |
663,2 |
174,44 |
30429,313 |
48 |
664,9 |
176,14 |
31025,299 |
итого |
14662,6 |
18079,83 |
940879,8 |
Проведём проверку на однородность:
Среднее арифметическое: хср = (Σxi)/n = 14662,6/30 = 488,76
СКО: σ = √(∑(хi - хcp)2 / n) = √(940879,8/30) = √31362,66= 177,09505≈ 177,01
Проведём проверку нормальности распределения факторных признаков по правилу трёх сигм.
Проведём исключения из первичной информации резко-выделяющихся единиц, которые не попадают в интервал,
хср - 3 σ ≤ xi ≤ хср + 3 σ
т.е. по имеющимся данным, где х – средняя для выборочной совокупности.
488,76-3* 177,01≤ xi ≤488,76+3* 177,01
488,76-531,03≤ xi ≤ 488,76+531,03
-42,27 ≤ xi ≤ 1019,79
Среднегодовая численность населения не может быть отрицательной, следовательно интевал примет следующий вид
0 ≤ xi ≤ 1019,79
Резко выделяющихся единиц в первичной информации нет, т.к. все значения факторного признака попадают в полученный интервал.
Коэффициент вариации: V = (σ/хср) * 100% = (177,01/488,76)*100% = 0,36%
Так как V < 33% ,следовательно, значение коэффициента вариации свидетельствует о том, что совокупность достаточно однородна и не нужно исключать резко выделяющиеся по факторному признаку регионы.
Задание№3
По оставшемуся массиву данных построить ряд распределения регионов РФ по численности занятых в экономике. Величину интервала определить по формуле Стэрджесса. По построенному ряду рассчитать показатели центра распределения, вариации и дифференциации.
Решение:
Величина интервала i определяется по формуле Стерджэсса, т.к. нет больших перепадов в значении признака:
i= R/m
где R – размах вариации (колебаний) признака (R = x max – x min) , x max – максимальное значение признака, x min - минимальное значение признака;
m –число групп (m =1+3,322 lg N), N – число единиц в совокупности.
m =1+3,322 lg 30
m =1+3,322 *1,477
m =5,907=6
полученную величину m округляют до целого большего числа, поскольку количество групп не может быть дробным.
Подсчитаем величину интервала:
i = (664,9 – 329,9) /6
i =335/6
i =112,82
Следовательно, в ряду распределения будет 6 групп (интервалов), вычислим верхние и нижние их границы:
Число регионов, входящих в интервал
1-ый: [x min ; x min + i) [329,9 ; 385,9) 4
2-ой: [x min + i ; x min + 2i) [385,9;441,9) 7
3-ий: [x min + 2i ; x min + 3i) [441,9; 497,9) 7
4-ый: [x min + 3i ; x min + 4i) [497,9; 553,9) 3
5-ый: [x min + 4i ; x min + 5i) [553,9; 609,9) 6
6-ой: [x min + 5i ; x min + 6i) [609,9; 665,9) 3
Таким образом, ряд распределения (со всеми вспомогательными данными для последующих расчётов) выглядит следующим образом:
Таблица 4
Ряд распределения по факторному признаку
№ |
Интервал |
Частота fi |
хi |
хi*fi |
Накопл частота Si |
|хi - хср| |
|хi- хср|*fi |
(хi - хср)2 |
(хi- хср)2*fi |
1 |
[329,9 ; 385,9) |
4 |
357,9 |
1431,6 |
4 |
128,1 |
512,4 |
16409,61 |
65638,44 |
2 |
[385,9;441,9) |
7 |
413,9 |
2897,3 |
11 |
72,1 |
504,7 |
5198,41 |
36388,87 |
3 |
[441,9; 497,9) |
7 |
469,9 |
3289,3 |
18 |
16,1 |
112,7 |
259,21 |
1814,47 |
4 |
[497,9; 553,9) |
3 |
525,9 |
1577,7 |
21 |
39,9 |
119,7 |
1592,01 |
4776,03 |
5 |
[553,9; 609,9) |
6 |
581,9 |
3491,4 |
27 |
95,9 |
575,4 |
9196,81 |
55180,86 |
6 |
[609,9; 665,9) |
3 |
637,9 |
1913,7 |
30 |
151,9 |
911,4 |
23073,61 |
69220,83 |
Итого: |
30 |
|
14601 |
|
504 |
2736,3 |
55729,66 |
233019,5 |
Рассчитаем показатели центра распределения: