Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Отчёт по статистике № 3 (1).docx
Скачиваний:
1
Добавлен:
01.04.2025
Размер:
638.1 Кб
Скачать

Часть 2. Корреляционный анализ. Линейная двумерная модель.

Путешествуя по сайту федеральной службы государственной статистики, можно найти множество показателей, характеризующих уровень преступности в современной России. Но абсолютные числа, размещённые в базах данных, вряд ли помогут проследить логические связи, осознать, почему такая ситуация имеет место, и что нужно делать для обеспечения безопасности граждан. Чтобы понять, насколько связаны друг с другом некоторые показатели, мы выбрали 3 пары характеристик и провели их корреляционный анализ. Первая пара – это число преступлений, совершенных несовершеннолетними (х), и число преступлений, связанных с незаконным оборотом наркотиков (у), совершённых в 1998 г. Рассмотрим двумерные пространственные данные по 26 областям: (здесь и далее используются данные из источника http://www.gks.ru, если не оговаривается иное).

Число преступлений, совершенных несовершеннолетними и при их соучастии

Число преступлений, связанных с незаконным оборотом наркотиков

 

1998

1998

x*y

x2

y2

Белгородская область

1331

1067

1420177

1771561

1138489

Брянская область

2051

1013

2077663

4206601

1026169

Владимирская область

2375

575

1365625

5640625

330625

Воронежская область

1747

2051

3583097

3052009

4206601

Ивановская область

2127

334

710418

4524129

111556

Курская область

1455

1381

2009355

2117025

1907161

Липецкая область

1118

832

930176

1249924

692224

Рязанская область

1082

324

350568

1170724

104976

Смоленская область

1530

979

1497870

2340900

958441

Тверская область

2185

731

1597235

4774225

534361

Тульская область

2153

1047

2254191

4635409

1096209

Ярославская область

2373

583

1383459

5631129

339889

Республика Карелия

1791

1092

1955772

3207681

1192464

Республика Коми

2074

1030

2136220

4301476

1060900

Архангельская область

3302

797

2631694

10903204

635209

Вологодская область

3063

642

1966446

9381969

412164

Калининградская область

1928

1186

2286608

3717184

1406596

Ленинградская область

3713

1197

4444461

13786369

1432809

Мурманская область

1715

330

565950

2941225

108900

Астраханская область

713

1214

865582

508369

1473796

Республика Дагестан

691

2357

1628687

477481

5555449

Республика Северная Осетия - Алания

263

950

249850

69169

902500

Удмуртская Республика

1952

920

1795840

3810304

846400

Кировская область

2347

928

2178016

5508409

861184

Забайкальский край

2166

1585

3433110

4691556

2512225

Амурская область

1846

1887

3483402

3407716

3560769

Среднее

1888,115385

1039,692308

1876979,6

4147168,1

1323387,1

Определим тесноту связи двух признаков. Коэффициент корреляции можно подсчитать двумя способами: по формуле (S – среднее квадратическое отклонение), либо с помощью встроенной статистической функции Excel КОРРЕЛ(). Для нахождения коэффициента корреляции и построения линейной модели, необходимы дополнительные подсчёты:

Sx=

763,0128

Sy=

492,3688

R по функции

-0,22913

R вручную

-0,22913

Оба способа дают идентичные результаты: r = - 0,229. Это означает, что связь обратная и к тому же очень слабая, так как чем больше коэффициент корреляции, тем более тесная связь между величинами x и y. Можно сделать вывод, что между преступлениями, связанными с наркотиками и преступлениями несовершеннолетних нет никакой зависимости. Это отчётливо видно на графике. Как мы видим, корреляционное облако расплывчато и по очертаниям напоминает круг.

Следующая пара – число преступлений с насильственными действиями в отношении потерпевших (х) и число женщин, совершивших преступление (у) в 2005 году. На сайте Росстата представлены следующие данные по 30 областям:

 

Число преступлений с насильственными действиями в отношении потерпевших

Число женщин, совеpшивших пpеступление

 

2005

2005

x*y

x2

y2

Калужская область

4482

1020

4571640

20088324

1040400

Костромская область

3407

677

2306539

11607649

458329

Курская область

3973

1496

5943608

15784729

2238016

Липецкая область

3539

1152

4076928

12524521

1327104

Московская область

19771

5497

108681187

390892441

30217009

Орловская область

2905

941

2733605

8439025

885481

Рязанская область

2966

1128

3345648

8797156

1272384

Смоленская область

5611

1144

6418984

31483321

1308736

Тамбовская область

3986

1875

7473750

15888196

3515625

Тверская область

7687

1490

11453630

59089969

2220100

Тульская область

4145

1689

7000905

17181025

2852721

Ярославская область

9747

1364

13294908

95004009

1860496

Республика Карелия

3557

917

3261769

12652249

840889

Вологодская область

9364

1606

15038584

87684496

2579236

Ленинградская область

6920

1125

7785000

47886400

1265625

Краснодарский край

7445

4613

34343785

55428025

21279769

Ставропольский край

7117

3358

23898886

50651689

11276164

Республика Башкортостан

5862

5107

29937234

34363044

26081449

Республика Марий Эл

5889

704

4145856

34680321

495616

Удмуртская Республика

12107

1770

21429390

146579449

3132900

Чувашская Республика

10075

1527

15384525

101505625

2331729

Оренбургская область

10262

2174

22309588

105308644

4726276

Ульяновская область

8500

1763

14985500

72250000

3108169

Курганская область

7643

1880

14368840

58415449

3534400

Ханты-Мансийский авт.округ-Югра

9332

2922

27268104

87086224

8538084

Республика Бурятия

7028

2058

14463624

49392784

4235364

Забайкальский край

6986

2687

18771382

48804196

7219969

Красноярский край

14272

5768

82320896

203689984

33269824

Усть-Ордынский Бурятский авт.округ

637

262

166894

405769

68644

Кемеровская область

15460

5067

78335820

239011600

25674489

Среднее

7355,833333

2159,366667

20183900

70752544

6961833

Для нахождения коэффициента нам понадобятся промежуточные рассчёты

Sx=

4079,738

Sу=

1516,235

R по функции

0,695129

R вручную

0,695129

Двумя способами был получен один и тот же ответ r = 0,695. Это означает, что связь между этими показателями средняя по силе и прямо пропорциональная, то есть увеличение числа насильственных убийств происходит частично за счёт возрастания числа женщин-преступниц, но также и за счёт некоторых других факторов. На графике мы видим подтверждение наших выводов: облако рассеивания напоминает «овал», оно вытянуто, и можно даже проследить, в каком направлении.

Построим уравнение регрессии, описывающее зависимость между выбранными переменными. Для этого нужно найти и . Используя данные формулы, получим ŷ = 259,02 + 0,2583 * x, что полностью совпадает с уравнением линии тренда.

Третья и последняя пара характеристик – число преступлений, совершенных лицами, находящимися в состоянии алкогольного опьянения (х), и число преступлений совершенных лицами, ранее совершавшими преступления (у), в 1999 году. Нами были найдены данные из 28 областей:

Число преступлений, совершенных лицами, находящимися в состоянии алкогольного опьянения

Число преступлений совеpшенных лицами, pанее совеpшавшими пpеступления

 

1999

1999

x*y

x2

y2

Республика Дагестан

1135

2447

2777345

1288225

5987809

Республика Ингушетия

75

87

6525

5625

7569

Кабардино-Балкарская Республика

180

573

103140

32400

328329

Карачаево-Черкесская Республика

321

439

140919

103041

192721

Республика Северная Осетия - Алания

548

1814

994072

300304

3290596

Республика Мордовия

2813

4150

11673950

7912969

17222500

Республика Татарстан

8991

12627

113529357

80838081

159441129

Удмуртская Республика

6628

9077

60162356

43930384

82391929

Коми-Пермяцкий авт.округ

946

1268

1199528

894916

1607824

Самарская область

9991

14427

144140157

99820081

208138329

Свердловская область

19945

28298

564403610

397803025

800776804

Тюменская область

14238

19739

281043882

202720644

389628121

Ямало-Ненецкий авт.округ

1681

1645

2765245

2825761

2706025

Республика Алтай

964

1402

1351528

929296

1965604

Республика Тыва

1737

1581

2746197

3017169

2499561

Алтайский край

12245

17526

214605870

149940025

307160676

Агинский Бурятский авт.округ

305

276

84180

93025

76176

Красноярский край

13462

18924

254754888

181225444

358117776

Таймырский (Долгано-Ненецкий) авт.округ

182

188

34216

33124

35344

Эвенкийский авт.окpуг

180

136

24480

32400

18496

Иркутская область

13896

19575

272014200

193098816

383180625

Усть-Ордынский Бурятский авт.округ

858

946

811668

736164

894916

Камчатский край

1775

2431

4315025

3150625

5909761

Корякский авт.округ

172

125

21500

29584

15625

Магаданская область

1410

1696

2391360

1988100

2876416

Сахалинская область

3025

3512

10623800

9150625

12334144

Еврейская автономная область

1075

1448

1556600

1155625

2096704

Чукотский авт.округ

281

147

41307

78961

21609

Среднее

4252,107143

5946,571429

69582747

49397659

98175826

Значения промежуточных величин следующее:

Sx=

5596,1811

Sy=

7925,5356

R по функции

0,9987

R вручную

0,9987

Подсчитывая коэффициент корреляции, получаем r = 0,999. Это значит, что связь между двумя переменными прямо пропорциональна и необычайно сильна, зависимость близка к функциональной.

Другими словами, при увеличении числа рецидивов непременно будет расти число людей, совершивших преступление в состоянии алкогольного опьянения. График подтверждает полученные результаты: видно, что наблюдения практически выстроились в прямую линию, осталось только соединить точки линией тренда.