- •Часть 1. Статистика правонарушений в России. Основные проблемы. 3
- •Цели работы.
- •Часть 1. Статистика правонарушений в России. Основные проблемы.
- •Часть 2. Корреляционный анализ. Линейная двумерная модель.
- •Часть 3. Построение двумерных регрессионных моделей матричным способом.
- •Линейная двумерная модель.
- •Полиномиальная модель 2-го порядка.
- •Полиномиальная модель 3-го порядка.
- •Гиперболическая модель.
- •Степенная модель.
- •Показательная модель.
- •Часть 4. Сравнение регрессионных моделей.
- •Часть 5. Построение моделей по формулам
- •Гиперболическая модель
- •Степенная модель
- •Показательная модель
- •Часть 6. Анализ временных данных.
- •Часть 6. Элементы кластерного анализа.
Часть 2. Корреляционный анализ. Линейная двумерная модель.
Путешествуя по сайту федеральной службы государственной статистики, можно найти множество показателей, характеризующих уровень преступности в современной России. Но абсолютные числа, размещённые в базах данных, вряд ли помогут проследить логические связи, осознать, почему такая ситуация имеет место, и что нужно делать для обеспечения безопасности граждан. Чтобы понять, насколько связаны друг с другом некоторые показатели, мы выбрали 3 пары характеристик и провели их корреляционный анализ. Первая пара – это число преступлений, совершенных несовершеннолетними (х), и число преступлений, связанных с незаконным оборотом наркотиков (у), совершённых в 1998 г. Рассмотрим двумерные пространственные данные по 26 областям: (здесь и далее используются данные из источника http://www.gks.ru, если не оговаривается иное).
|
Число преступлений, совершенных несовершеннолетними и при их соучастии |
Число преступлений, связанных с незаконным оборотом наркотиков |
|
|
|
|
1998 |
1998 |
x*y |
x2 |
y2 |
Белгородская область |
1331 |
1067 |
1420177 |
1771561 |
1138489 |
Брянская область |
2051 |
1013 |
2077663 |
4206601 |
1026169 |
Владимирская область |
2375 |
575 |
1365625 |
5640625 |
330625 |
Воронежская область |
1747 |
2051 |
3583097 |
3052009 |
4206601 |
Ивановская область |
2127 |
334 |
710418 |
4524129 |
111556 |
Курская область |
1455 |
1381 |
2009355 |
2117025 |
1907161 |
Липецкая область |
1118 |
832 |
930176 |
1249924 |
692224 |
Рязанская область |
1082 |
324 |
350568 |
1170724 |
104976 |
Смоленская область |
1530 |
979 |
1497870 |
2340900 |
958441 |
Тверская область |
2185 |
731 |
1597235 |
4774225 |
534361 |
Тульская область |
2153 |
1047 |
2254191 |
4635409 |
1096209 |
Ярославская область |
2373 |
583 |
1383459 |
5631129 |
339889 |
Республика Карелия |
1791 |
1092 |
1955772 |
3207681 |
1192464 |
Республика Коми |
2074 |
1030 |
2136220 |
4301476 |
1060900 |
Архангельская область |
3302 |
797 |
2631694 |
10903204 |
635209 |
Вологодская область |
3063 |
642 |
1966446 |
9381969 |
412164 |
Калининградская область |
1928 |
1186 |
2286608 |
3717184 |
1406596 |
Ленинградская область |
3713 |
1197 |
4444461 |
13786369 |
1432809 |
Мурманская область |
1715 |
330 |
565950 |
2941225 |
108900 |
Астраханская область |
713 |
1214 |
865582 |
508369 |
1473796 |
Республика Дагестан |
691 |
2357 |
1628687 |
477481 |
5555449 |
Республика Северная Осетия - Алания |
263 |
950 |
249850 |
69169 |
902500 |
Удмуртская Республика |
1952 |
920 |
1795840 |
3810304 |
846400 |
Кировская область |
2347 |
928 |
2178016 |
5508409 |
861184 |
Забайкальский край |
2166 |
1585 |
3433110 |
4691556 |
2512225 |
Амурская область |
1846 |
1887 |
3483402 |
3407716 |
3560769 |
Среднее |
1888,115385 |
1039,692308 |
1876979,6 |
4147168,1 |
1323387,1 |
Определим тесноту связи двух признаков.
Коэффициент корреляции можно подсчитать
двумя способами: по формуле
(S – среднее квадратическое
отклонение), либо с помощью встроенной
статистической функции Excel КОРРЕЛ(). Для
нахождения коэффициента корреляции и
построения линейной модели, необходимы
дополнительные подсчёты:
Sx= |
763,0128 |
Sy= |
492,3688 |
R по функции |
-0,22913 |
R вручную |
-0,22913 |
Оба способа дают идентичные результаты: r = - 0,229. Это означает, что связь обратная и к тому же очень слабая, так как чем больше коэффициент корреляции, тем более тесная связь между величинами x и y. Можно сделать вывод, что между преступлениями, связанными с наркотиками и преступлениями несовершеннолетних нет никакой зависимости. Это отчётливо видно на графике. Как мы видим, корреляционное облако расплывчато и по очертаниям напоминает круг.
Следующая пара – число преступлений с насильственными действиями в отношении потерпевших (х) и число женщин, совершивших преступление (у) в 2005 году. На сайте Росстата представлены следующие данные по 30 областям:
|
Число преступлений с насильственными действиями в отношении потерпевших |
Число женщин, совеpшивших пpеступление |
|
|
|
|
2005 |
2005 |
x*y |
x2 |
y2 |
Калужская область |
4482 |
1020 |
4571640 |
20088324 |
1040400 |
Костромская область |
3407 |
677 |
2306539 |
11607649 |
458329 |
Курская область |
3973 |
1496 |
5943608 |
15784729 |
2238016 |
Липецкая область |
3539 |
1152 |
4076928 |
12524521 |
1327104 |
Московская область |
19771 |
5497 |
108681187 |
390892441 |
30217009 |
Орловская область |
2905 |
941 |
2733605 |
8439025 |
885481 |
Рязанская область |
2966 |
1128 |
3345648 |
8797156 |
1272384 |
Смоленская область |
5611 |
1144 |
6418984 |
31483321 |
1308736 |
Тамбовская область |
3986 |
1875 |
7473750 |
15888196 |
3515625 |
Тверская область |
7687 |
1490 |
11453630 |
59089969 |
2220100 |
Тульская область |
4145 |
1689 |
7000905 |
17181025 |
2852721 |
Ярославская область |
9747 |
1364 |
13294908 |
95004009 |
1860496 |
Республика Карелия |
3557 |
917 |
3261769 |
12652249 |
840889 |
Вологодская область |
9364 |
1606 |
15038584 |
87684496 |
2579236 |
Ленинградская область |
6920 |
1125 |
7785000 |
47886400 |
1265625 |
Краснодарский край |
7445 |
4613 |
34343785 |
55428025 |
21279769 |
Ставропольский край |
7117 |
3358 |
23898886 |
50651689 |
11276164 |
Республика Башкортостан |
5862 |
5107 |
29937234 |
34363044 |
26081449 |
Республика Марий Эл |
5889 |
704 |
4145856 |
34680321 |
495616 |
Удмуртская Республика |
12107 |
1770 |
21429390 |
146579449 |
3132900 |
Чувашская Республика |
10075 |
1527 |
15384525 |
101505625 |
2331729 |
Оренбургская область |
10262 |
2174 |
22309588 |
105308644 |
4726276 |
Ульяновская область |
8500 |
1763 |
14985500 |
72250000 |
3108169 |
Курганская область |
7643 |
1880 |
14368840 |
58415449 |
3534400 |
Ханты-Мансийский авт.округ-Югра |
9332 |
2922 |
27268104 |
87086224 |
8538084 |
Республика Бурятия |
7028 |
2058 |
14463624 |
49392784 |
4235364 |
Забайкальский край |
6986 |
2687 |
18771382 |
48804196 |
7219969 |
Красноярский край |
14272 |
5768 |
82320896 |
203689984 |
33269824 |
Усть-Ордынский Бурятский авт.округ |
637 |
262 |
166894 |
405769 |
68644 |
Кемеровская область |
15460 |
5067 |
78335820 |
239011600 |
25674489 |
Среднее |
7355,833333 |
2159,366667 |
20183900 |
70752544 |
6961833 |
Для нахождения коэффициента нам понадобятся промежуточные рассчёты
Sx= |
4079,738 |
Sу= |
1516,235 |
R по функции |
0,695129 |
R вручную |
0,695129 |
Двумя способами был получен один и тот же ответ r = 0,695. Это означает, что связь между этими показателями средняя по силе и прямо пропорциональная, то есть увеличение числа насильственных убийств происходит частично за счёт возрастания числа женщин-преступниц, но также и за счёт некоторых других факторов. На графике мы видим подтверждение наших выводов: облако рассеивания напоминает «овал», оно вытянуто, и можно даже проследить, в каком направлении.
Построим уравнение регрессии,
описывающее зависимость
между выбранными переменными. Для этого
нужно найти
и
.
Используя данные формулы, получим ŷ =
259,02 + 0,2583 * x, что полностью совпадает с
уравнением линии тренда.
Третья и последняя пара характеристик – число преступлений, совершенных лицами, находящимися в состоянии алкогольного опьянения (х), и число преступлений совершенных лицами, ранее совершавшими преступления (у), в 1999 году. Нами были найдены данные из 28 областей:
|
Число преступлений, совершенных лицами, находящимися в состоянии алкогольного опьянения |
Число преступлений совеpшенных лицами, pанее совеpшавшими пpеступления |
|
|
|
|
1999 |
1999 |
x*y |
x2 |
y2 |
Республика Дагестан |
1135 |
2447 |
2777345 |
1288225 |
5987809 |
Республика Ингушетия |
75 |
87 |
6525 |
5625 |
7569 |
Кабардино-Балкарская Республика |
180 |
573 |
103140 |
32400 |
328329 |
Карачаево-Черкесская Республика |
321 |
439 |
140919 |
103041 |
192721 |
Республика Северная Осетия - Алания |
548 |
1814 |
994072 |
300304 |
3290596 |
Республика Мордовия |
2813 |
4150 |
11673950 |
7912969 |
17222500 |
Республика Татарстан |
8991 |
12627 |
113529357 |
80838081 |
159441129 |
Удмуртская Республика |
6628 |
9077 |
60162356 |
43930384 |
82391929 |
Коми-Пермяцкий авт.округ |
946 |
1268 |
1199528 |
894916 |
1607824 |
Самарская область |
9991 |
14427 |
144140157 |
99820081 |
208138329 |
Свердловская область |
19945 |
28298 |
564403610 |
397803025 |
800776804 |
Тюменская область |
14238 |
19739 |
281043882 |
202720644 |
389628121 |
Ямало-Ненецкий авт.округ |
1681 |
1645 |
2765245 |
2825761 |
2706025 |
Республика Алтай |
964 |
1402 |
1351528 |
929296 |
1965604 |
Республика Тыва |
1737 |
1581 |
2746197 |
3017169 |
2499561 |
Алтайский край |
12245 |
17526 |
214605870 |
149940025 |
307160676 |
Агинский Бурятский авт.округ |
305 |
276 |
84180 |
93025 |
76176 |
Красноярский край |
13462 |
18924 |
254754888 |
181225444 |
358117776 |
Таймырский (Долгано-Ненецкий) авт.округ |
182 |
188 |
34216 |
33124 |
35344 |
Эвенкийский авт.окpуг |
180 |
136 |
24480 |
32400 |
18496 |
Иркутская область |
13896 |
19575 |
272014200 |
193098816 |
383180625 |
Усть-Ордынский Бурятский авт.округ |
858 |
946 |
811668 |
736164 |
894916 |
Камчатский край |
1775 |
2431 |
4315025 |
3150625 |
5909761 |
Корякский авт.округ |
172 |
125 |
21500 |
29584 |
15625 |
Магаданская область |
1410 |
1696 |
2391360 |
1988100 |
2876416 |
Сахалинская область |
3025 |
3512 |
10623800 |
9150625 |
12334144 |
Еврейская автономная область |
1075 |
1448 |
1556600 |
1155625 |
2096704 |
Чукотский авт.округ |
281 |
147 |
41307 |
78961 |
21609 |
Среднее |
4252,107143 |
5946,571429 |
69582747 |
49397659 |
98175826 |
Значения промежуточных величин следующее:
Sx= |
5596,1811 |
Sy= |
7925,5356 |
R по функции |
0,9987 |
R вручную |
0,9987 |
Подсчитывая коэффициент корреляции, получаем r = 0,999. Это значит, что связь между двумя переменными прямо пропорциональна и необычайно сильна, зависимость близка к функциональной.
Другими словами, при увеличении числа рецидивов непременно будет расти число людей, совершивших преступление в состоянии алкогольного опьянения. График подтверждает полученные результаты: видно, что наблюдения практически выстроились в прямую линию, осталось только соединить точки линией тренда.
