
СРС статистика
.docДля определения медианного интервала необходимо рассчитать накопленную частоту каждого последующего интервала, пока она не превысит ½ суммы накопленных частот.
Интервал |
Накопленная частота, % |
21 – 22,43 |
6 |
22,43 – 23,86 |
2+6=8 |
23,86 – 25,29 |
7+8=15 |
25,29 – 26,72 |
15+15=30>(35:2) |
Таким образом, медианным является интервал с границами 25,29 – 26,72.
(кв.
м.).
Т. е. более половины субъектов имеют общую площадь жилого помещения на душу населения свыше 25,53 кв. м..
Для расчета показателей вариации используем вспомогательную таблицу 3.
Размах
вариации:
(кв.
м.), т. е. разница между наибольшей и
наименьшей площадью составляет 8,6 кв.
м.
Среднее линейное отклонение:
Дисперсия
()
и среднее
квадратическое отклонение (
):
(кв.
м.);
=
(кв.
м.)
Квартильное
отклонение ():
,
где
и
– соответственно третья и первая
квартили распределения.
Квартиль – это значения признака, которые делят ранжированный ряд на четыре равные части. Первая квартиль – значение соответствует величине признака, который совпадает с 25-тым процентом, вторая квартиль – медиана – 50-тый процент, третья квартиль – 75%, четвертая – 100%. Вычисление квартилей аналогично вычислению медианы. Сначала определяем положение и место квартили:
Затем по накопленным частотам в дискретном ряду определяют численное значение. Для расчета квартилей по интервальному вариационному ряду используют следующие формулы:
,
,
где
– нижняя граница интервала, содержащая
нижний квартиль;
– нижняя граница интервала, содержащая
верхний квартиль;
– величина интервала;
– накопленная
частота интервала, предшествующего
интервалу, содержащему нижний квартиль;
– накопленная
частота интервала, предшествующего
интервалу, содержащему верхний квартиль;
– частота интервала, содержащего нижний
квартиль;
– частота интервала, содержащего верхний
квартиль.
В нашем случае:
первая квартиль находится в интервале (23,86 – 25,29)
(кв.
м.);
третья квартиль находится в интервале (25,29 – 26,72)
(кв.
м.);
квартильное отклонение:
(кв.
м.).
Коэффициент
вариации: V=
.
Коэффициент вариации меньше 33%. Таким образом, данная совокупность однородна по общей площади жилого помещения на душу населения.
Относительный показатель асимметрии:
.
Имеем незначительную (т. к. <1) левостороннюю (т. к. значение отрицательное) асимметрию.
Рис. 2. Гистограмма распределения регионов РФ
по площади жилого помещения на душу населения
Рис. 3. Кумулята распределения регионов РФ
по площади жилого помещения на душу населения
Выводы:
1. В результате исследования выявлено, что данная совокупность может рассматриваться как однородная, так как значение коэффициента вариации больше 33% и составляет 8,07%.
2. Медианное значение площади жилого помещения в отчетном году составляет 25,53 кв. м., то есть половина регионов России имеет площади жилого помещения на душу населения меньше 25,53 кв. м., а другая половина – больше. Наиболее часто встречающее значение площади жилого помещения (модальное) –25,83 кв. м..
3. Среднее линейное и среднее квадратическое отклонения соответственно равны 1,634 кв. м. и 2,03 кв. м. Эти величины показывают, насколько индивидуальные значения признака отличаются от среднего его значения. Стандартное отклонение по своей величине всегда превышает значение среднего линейного отклонения в соответствии со свойством мажорантности средних.
4. Четверть регионов России (25%) имеют площадь жилого помещения на душу населения менее 24,01кв. м., 25% регионов – свыше 26,36 кв. м., остальные в пределах 24,01 – 26,36 кв. м. Квартильное отклонение, которое определяют вместо размаха вариации, чтобы избежать недостатков, связанных с использование крайних значении, составляет 1,175 кв. м.
5. Асимметрия левосторонняя, незначительная.
Задание 5
Предполагается, что исходные данные по 35 регионам РФ являются 5%-й выборкой из некоторой генеральной совокупности. В связи с этим возникают следующие задачи:
1.
определение характеристик выборочной
совокупности: средней величины (),
дисперсии количественного признака
(
),
доли единиц, обладающих значением
изучаемого признака (W),
дисперсии доли (
);
2.
расчет ошибок выборки (,
,
,
);
3. распространение результатов выборки на генеральную совокупность путем определения доверительных интервалов, в которых с определенной вероятностью можно гарантировать нахождение характеристик генеральной совокупности.
Для проведения расчетов используем результаты расчетов, как сделанных ранее, так и новые (данные взяты из табл. 1 и табл. 2):
руб.
Для
расчета ошибок выборки следует
воспользоваться формулами для
бесповторного отбора, так как по условию
можно определить численность генеральной
совокупности (N).
Среднюю ошибку выборки (
)
найдем по следующей формуле:
,
где
– дисперсия
выборочной совокупности;
– численность единиц выборочной
совокупности;
– численность генеральной совокупности.
Так
как
=35,
что составляет 5% от численности
генеральной, то
=700.
.
Предельная ошибка для средней находится по формуле:
,
где
– коэффициент
доверия, принимаемый в зависимости от
уровня доверительной вероятности
и
числа степеней свободы
(
).
Коэффициент
доверия
определяем по
таблице распределения Стьюдента
(Приложение
А). В нашем
случае при вероятности
=
0,95 и
=
34 (35 – 1) значение
=
2,0322445. Тогда:
.
Доверительные интервалы генеральной средней:
.
С вероятностью 0,95 можно гарантировать, что среднедушевой доход населения на один регион по генеральной совокупности будет находиться в пределах от 15819,09 руб. до 18578,11 руб.
Число регионов, у которых доход на душу населения меньше средней величины по выборочной совокупности, определим по первичным данным (табл. 1). Таких регионов 25, их доля (W) в выборочной совокупности:
Средняя ошибка доли для бесповторного отбора:
,
.
Предельная
ошибка доли:
.
При
вероятности
=
0,99 и
=
34 значение
=
2,7283944.
Тогда:
.
Доверительные пределы генеральной доли:
Таким образом, с вероятностью 0,99 можно гарантировать, что доля регионов, у которых доход на душу населения меньше среднего значения, будет находиться в пределах от 51,1% до 91,7%.
Задание 6
В
случае прямолинейной связи зависимость
между двумя факторами описывается
следующим уравнением:
где
и
–
коэффициенты регрессии.
Параметры
уравнения прямой могут быть найдены
путем решения системы нормальных
уравнений:
Расчёты произведем за последний год, используя вспомогательную табл. 4.
В нашем примере система уравнений выглядит следующим образом:
Из
первого уравнения выразим:
,
подставим во второе
,
,
.
Решив данную систему уравнений, получим следующие значения параметров уравнения: а0 = 25,147; а1 = - 0,0000069.
Таблица 4
Расчётная таблица для определения параметров уравнения регрессии
зависимости среднедушевых доходов населения от общей площади жилых помещений среднем на одного жителя за 2011 год
№ п/п |
|
|
|
|
|
|
|
|
А |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1 |
18800 |
26,3 |
353440000 |
494440 |
25,02 |
1601,40 |
1,27 |
2036,98 |
2 |
15348 |
25,6 |
235561104 |
392908,8 |
25,04 |
-1850,60 |
0,57 |
-1058,54 |
3 |
14312 |
25,5 |
204833344 |
364956 |
25,05 |
-2886,60 |
0,47 |
-1362,48 |
4 |
15871 |
26,2 |
251888641 |
415820,2 |
25,04 |
-1327,60 |
1,17 |
-1555,95 |
5 |
13006 |
24,2 |
169156036 |
314745,2 |
25,06 |
-4192,60 |
-0,83 |
3471,47 |
6 |
17557 |
25,8 |
308248249 |
452970,6 |
25,03 |
358,40 |
0,77 |
276,68 |
7 |
14823 |
25,4 |
219721329 |
376504,2 |
25,04 |
-2375,60 |
0,37 |
-883,72 |
8 |
16387 |
27,0 |
268533769 |
442449 |
25,03 |
-811,60 |
1,97 |
-1600,48 |
9 |
16811 |
26,2 |
282609721 |
440448,2 |
25,03 |
-387,60 |
1,17 |
-454,27 |
10 |
25605 |
29,6 |
655616025 |
757908 |
24,97 |
8406,40 |
4,57 |
38434,06 |
11 |
14824 |
25,3 |
219750976 |
375047,2 |
25,04 |
-2374,60 |
0,27 |
-645,89 |
12 |
14788 |
26,3 |
218684944 |
388924,4 |
25,04 |
-2410,60 |
1,27 |
-3066,28 |
13 |
15969 |
25,8 |
255008961 |
412000,2 |
25,04 |
-1229,60 |
0,77 |
-949,25 |
14 |
15151 |
24,6 |
229552801 |
372714,6 |
25,04 |
-2047,60 |
-0,43 |
876,37 |
15 |
14943 |
28,2 |
223293249 |
421392,6 |
25,04 |
-2255,60 |
3,17 |
-7154,76 |
16 |
16975 |
25,6 |
288150625 |
434560 |
25,03 |
-223,60 |
0,57 |
-127,90 |
17 |
15509 |
24,6 |
240529081 |
381521,4 |
25,04 |
-1689,60 |
-0,43 |
723,15 |
18 |
17543 |
25,4 |
307756849 |
445592,2 |
25,03 |
344,40 |
0,37 |
128,12 |
19 |
23897 |
25,0 |
571066609 |
597425 |
24,98 |
6698,40 |
-0,03 |
-187,56 |
20 |
21455 |
25,4 |
460317025 |
544957 |
25,00 |
4256,40 |
0,37 |
1583,38 |
21 |
15638 |
26,7 |
244547044 |
417534,6 |
25,04 |
-1560,60 |
1,67 |
-2609,32 |
22 |
16880 |
24,0 |
284934400 |
405120 |
25,03 |
-318,60 |
-1,03 |
327,52 |
23 |
15932 |
26,2 |
253828624 |
417418,4 |
25,04 |
-1266,60 |
1,17 |
-1484,46 |
24 |
25303 |
24,5 |
640241809 |
619923,5 |
24,97 |
8104,40 |
-0,53 |
-4279,12 |
25 |
16981 |
28,0 |
288354361 |
475468 |
25,03 |
-217,60 |
2,97 |
-646,71 |
26 |
14185 |
28,2 |
201214225 |
400017 |
25,05 |
-3013,60 |
3,17 |
-9559,14 |
27 |
14272 |
24,4 |
203689984 |
348236,8 |
25,05 |
-2926,60 |
-0,63 |
1837,90 |
28 |
8829 |
22,0 |
77951241 |
194238 |
25,09 |
-8369,60 |
-3,03 |
25343,15 |
29 |
18796 |
22,6 |
353289616 |
424789,6 |
25,02 |
1597,40 |
-2,43 |
-3878,49 |
30 |
16032 |
21,4 |
257025024 |
343084,8 |
25,04 |
-1166,60 |
-3,63 |
4232,42 |
31 |
14519 |
21,6 |
210801361 |
313610,4 |
25,05 |
-2679,60 |
-3,43 |
9185,67 |
32 |
16010 |
21,9 |
256320100 |
350619 |
25,04 |
-1188,60 |
-3,13 |
3717,94 |
33 |
14353 |
22,1 |
206008609 |
317201,3 |
25,05 |
-2845,60 |
-2,93 |
8331,92 |
34 |
24893 |
23,4 |
619661449 |
582496,2 |
24,98 |
7694,40 |
-1,63 |
-12526,48 |
35 |
29754 |
21,0 |
885300516 |
624834 |
24,94 |
12555,40 |
-4,03 |
-50573,15 |
Итого |
601951 |
876 |
10946887701 |
15061876 |
|
|
|
-4097,20 |