Ольков_С_Г_Аналитическая юриспруденция
.pdfm¢ |
|
= 365 × 0,752 ×0,4724 |
2 |
|
2! |
|
|
|
m¢ |
= 365 × 0,753 ×0,4724 |
|
3 |
|
3! |
|
|
|
m¢ |
= 365 × 0,754 ×0,4724 |
|
4 |
4! |
|
|
|
|
m¢ |
|
= 365 × 0,755 ×0,4724 |
5 |
|
5! |
|
|
=48,495
=12,124
=2,273
=0,341.
|
|
Проверим согласованность теоретического и эмпирического |
||||||
распределений с помощью |
критерия согласия Пирсона χ2= |
|||||||
k |
′ |
2 |
|
|
|
|
|
|
å |
(mi − mi ) |
|
|
. Получаем χрасч |
2 =0,95 и сравниваем его с табличным при |
|||
|
|
|
||||||
i=1 |
mi′ |
|
|
|
|
|
|
|
df=k-2=6-2=4 при уровне значимости α=0,05. χтабл |
2 =9,49. Поскольку |
|||||||
χрасч |
2 ≤ χтабл |
2 , то принимается |
гипотеза H0 о |
несущественности |
расхождений, то есть эмпирическое и теоретическое распределения хорошо согласуются между собой.
Если m¢ = N × λy ×e−λ |
= N × p( y) , то р(у)= m′ |
. Откуда: |
|
|
||||||||
|
y! |
|
|
|
|
|
N |
|
|
|
|
|
p( y0 ) = |
172 |
=0,471; |
p( y1 ) = |
129 |
=0,353; p( y2 ) = |
48 |
=0,132; |
|||||
365 |
365 |
365 |
||||||||||
|
|
|
|
|
|
|
|
|||||
p( y3 ) = |
12 |
=0,033; |
p( y4 ) = |
|
2 |
=0,005; p( y5 ) = |
|
1 |
=0,003. |
|||
365 |
365 |
|
365 |
|||||||||
|
|
|
|
|
|
|
|
|||||
Примерно |
те |
же |
результаты |
мы получили бы, |
воспользовавшись основной формулой: |
|
p( y) = λy ×e−λ . Так, для у=0 |
|||
|
|
|
|
|
y! |
имеем: |
|
|
|
|
|
p( y0 ) = 0,750 ×0,4724 −0,75 |
= 0,472 и т.д. |
||||
|
|
0! |
|
|
|
Таблица №2. Вероятность поступления заявлений в дежурную |
|||||
|
часть УВД. |
|
|
||
|
Y, шт. |
|
P(y) |
|
|
|
|
|
|
|
|
|
0 |
|
0,471 |
|
|
|
|
|
|
|
|
|
1 |
|
0,353 |
|
|
|
|
|
|
|
|
|
2 |
|
0,132 |
|
|
|
|
|
|
|
|
|
3 |
|
0,033 |
|
|
|
|
|
|
|
|
|
4 |
|
0,005 |
|
|
|
|
|
|
|
|
|
5 |
|
0,003 |
|
|
|
|
|
|
|
|
83
Рис. №1. Вероятности поступления соответствующего количества заявлений об особо тяжких преступлениях в дежурную часть УВД.
Ответ: 1) распределение числа заявлений об особо тяжких преступлениях, поступающих в дежурную часть УВД, подчиняется закону Пуассона, поскольку χрасч 2 ≤ χтабл 2 , λ = y ≈σ2 ; 2) λ=0,75; 3) теоретические частоты распределения Пуассона для числа заявлений об особо тяжких преступлениях, поступающих в дежурную часть УВД, представлены в графе №5 таблицы №1; 4) вероятности поступления в УВД 0, 1, 2, 3, 4 и 5 заявлений представлены в таблице к графику на рисунке №1.
§3. Закон нормального распределения, правило трех сигм и правило Бьенамэ-Чебышева в исследовании криминологических и других юридических процессов.
Закон нормального распределения, который также называют законом Гасса-Лапласа, законом Гаусса, описывает широкий спектр физических, химических, биологических, социальных, в том числе и правовых явлений. В частности, деяния субъектов правовых отношений в пространстве юридической ответственности распределяются по данному закону. По этому же закону распределяется рост, вес, интеллект и многие другие показатели,
84
характеризующие различные изучаемые совокупности. В учебной литературе отмечается, что первооткрывателем данного закона является Абрахам де Муавр, который установил его в 1727 году. Дальнейшее развитие и уточнение данного закона связано с такими именами, как Пьер Лаплас, Карл Гаусс, А.М. Ляпунов.
Ниже представлен простой график, иллюстрирующий сущность закона нормального распределения на примере распределения деяний в двумерном пространстве юридической ответственности.
(f(x)) |
|
|
|
|
|
0,14 |
|
|
|
|
|
|
|
|
|
|
|
0,12 |
|
|
|
|
|
||
вероятности |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
0,1 |
|
|
|
|
|
||
|
|
|
|
|
0,08 |
|
|
|
|
|
||
|
|
|
|
|
0,06 |
|
|
|
|
|
||
Плотность |
|
|
|
|
|
0,04 |
|
|
|
|
|
|
|
|
|
|
|
0,02 |
|
|
|
|
|
||
|
|
|
|
|
0 |
|
|
|
|
|
||
-11 |
-9 |
-7 |
-5 |
-3 |
-1 |
1 |
3 |
5 |
7 |
9 |
||
|
||||||||||||
|
|
|
|
|
Деяния (х), баллы |
|
|
|
Рис. 2. Распределение деяний в пространстве юридической ответственности (положительной и отрицательной).
Плотность вероятности распределения – площадь под графиком
Из графика видно, что нейтральное поведение (за которое нельзя ни поощрить, ни наказать субъекта правовых отношений) является наиболее вероятным, то есть обладающим максимальной частотой встречаемости, в то время как поведение особо негативное и особо позитивное встречаются все реже и реже, на что указывают ниспадающие, асимптотически приближающиеся к оси абсцисс «хвосты» распределения (левый и правый). Закон нормального распределения на плоскости описывается формулой
|
1 |
|
|
− |
(х−m)2 |
|
f (x) = |
|
e |
2σ 2 , где f(x) – плотность распределения, например, |
|||
σ |
|
|
|
|||
2π |
|
|
|
85
преступности, m – математическое ожидание (можно заменить средним значением вариационного ряда), σ – стандартное отклонение частотного ряда. То есть, чтобы построить конкретное нормальное распределение нужно знать всего два параметра – математическое ожидание и среднее квадратическое отклонение. При изучении юридической ответственности математическое ожидание нами принимается равным 0, а среднее квадратическое отклонение равным 3. То есть строится график функции (или
1 -( х-0)2
соответствующая таблица) f (x) = 3 2π e 2×32 .
Свойства закона нормального распределения
1.Математическое ожидание, мода и медиана совпадают (равны одному и тому же числу).
2.Отклонения от математического ожидания расположены симметрично относительно него.
3.Правило трех сигм: если случайная величина X имеет
нормальный закон распределения с параметрами m и σ2, то практически достоверно, что её значения заключены в интервале (m – 3σ, m+3σ). Отсюда следует важный практический вывод, что отклонение нормально распределенной величины Х свыше трех сигм имеет вероятность, равную 0,0027 (0,27%), то есть ничтожно малую вероятность. При этом основная масса событий (68,27%) будет сгруппирована в пределах первых двух сигм, примыкающих к математическому ожиданию слева (34,13%) и справа (34,13%), далее в пределах вторых сигм по 13,59% (в сумме 27,18%) и в пределах третьих по 2,14% (4,28%).
4.Коэффициенты асимметрии и эксцесса равны нулю.
5.Кривая имеет две точки перегиба на расстоянии плюсминус одно стандартное отклонение.
Аппроксимируя эмпирический вариационный ряд теоретическим распределением, следует выяснить, значимо ли различаются между собой теоретическая и эмпирическая кривые.
86
Для этого используют различные критерии – Пирсона, Романовского, Колмогорова16.
Правило трех сигм ведет речь о вероятности попадания нормально распределенной случайной величины в заданный отрезок области определения функции: a < X < b , например, мы отвечаем на вопрос о том, сколько деяний субъектов правовых отношений находится в пределах двух первых сигм (стандартных отклонений от математического ожидания), второй или третьей сигмы, какова вероятность того, что деяние выйдет за рамки трех сигм, или какова вероятность деяния со значением минус четыре и т.п.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x -μ |
=t |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
b |
|
|
|
|
|
|
|
|
|
b |
( x- ) |
2 |
|
σ |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
- |
μ |
|
|
||||||||
P(a <X <b) =ò f (x)dx = |
|
|
|
|
|
×òe |
|
2×σ2 |
|
dx = |
x =μ+tσ, отсюда имеем: |
|||||||||||||||||
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
a |
|
|
σ× 2π |
a |
|
|
|
|
dx =σdt |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
t |
|
|
|
|
|
|
|
|
a |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(a-μ)/σ |
|
|
|
|
|
|||
|
b |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(b-μ)/σ |
|
|
|
|
|
|||
|
1 |
|
|
(b−μ) /σ |
|
−t2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
= |
|
|
|
× |
ò |
|
e |
2 dt . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
2π |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
(a−μ) /σ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
1 |
|
|
x |
|
−t2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Поскольку |
|
|
|
|
|
× òe |
2 dt = Ф(х) , в итоге получаем: |
|||||||||||||||||||||
|
|
|
|
|
||||||||||||||||||||||||
|
|
2π |
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P(a < X |
|
|
|
æ b - μ ö |
|
æ a - μ |
ö |
|
|
|
|
|
|
|
|
|
|
|||||||||||
< b) = Фç |
÷ |
-Фç |
σ |
÷ , где Ф(х) – функция Лапласа. Отсюда |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
è σ |
ø |
|
è |
ø |
|
|
|
|
|
|
|
|
|
|
при необходимости найти вероятность попадания случайной величины в интервал, симметричный относительно математического ожидания имеем:
æ a + δ - μ ö |
æ a - δ - μ |
|||
P(μ -δ < X < μ + δ ) = Фç |
σ |
÷ |
-Фç |
σ |
è |
ø |
è |
μ −δ < X < μ +δ ~ Х -μ <δ , то
ö |
æ |
δ ö |
Поскольку |
÷ |
× 2Фç |
÷ . |
|
ø |
è |
σ ø |
|
P( |
|
X - μ |
|
æ |
δ ö |
|
|
||||
|
|
< δ ) = 2Фç ÷ . |
|||
|
|
|
|
è |
σ ø |
Правило трех сигм:
16 Громыко Г.Л. Теория статистики: практикум / Г.Л. Громыко. – 3-е изд., доп. и перераб. – М.: ИНФРА-М, 2006. – С. 63-67.
87
P( |
|
X - μ |
|
æ |
σ ö |
= 2Ф(1) |
= 0,6826 |
(1). То есть в пределах первой |
|
|
|||||||
|
|
<σ )2Фç |
÷ |
|||||
|
|
|
|
è |
σ ø |
|
|
|
|
|
|
|
|
сигмы (левой и правой относительно математического ожидания – 2 первые сигмы) под кривой нормального распределения находится 68,26% всех событий.
P( |
|
|
|
X - μ |
|
|
æ |
2σ ö |
= 2Ф(2) |
= 0,9545 |
(2). |
||
|
|
|
|
||||||||||
|
|
|
|
|
|
< 2σ )2Фç |
σ |
÷ |
|||||
|
|
|
|
|
|
|
è |
ø |
|
|
|
||
P( |
|
X - μ |
|
æ |
3σ ö |
= 2Ф(3) |
= 0,9973 |
(3). |
|||||
|
|
||||||||||||
|
|
< 3σ )2Фç |
σ |
÷ |
|||||||||
|
|
|
|
è |
ø |
|
|
|
Словесный смысл правила трех сигм таков: практически достоверно, что при однократном испытании отклонение нормально распределенной случайной величины от её математического ожидания не превышает утроенного стандартного отклонения.
Правило Бьенамэ-Чебышева (Bienayme-Chebyshev) гласит, что для любого набора эмпирических данных вне зависимости от закона их распределения доля (или процент) наблюдений, лежащих на расстоянии, не превышающем k среднеквадратических
отклонений от математического ожидания, не меньше |
æ |
- |
1 |
ö |
×100% . |
||||||||
ç1 |
|
|
÷ |
||||||||||
k |
2 |
||||||||||||
|
|
|
|
|
|
|
|
è |
|
|
ø |
|
|
Например, для двух стандартных отклонений имеем: |
|
|
|
|
|
|
|||||||
æ |
1 |
ö |
æ |
1 |
ö |
|
|
|
|
|
|
||
ç1- |
|
|
÷ ×100% |
= ç1- |
|
|
÷ ×100= 75% . |
|
|
|
|
|
|
k |
2 |
2 |
2 |
|
|
|
|
|
|
||||
è |
|
ø |
è |
|
ø |
|
|
|
|
|
|
По сути, это правило близко к правилу трех сигм, но подходит не только для закона нормального распределения. Из правила Бьенамэ-Чебышева следует, что 3/4 (75%) данных любого набора попадает в интервал μ ±2σ (под кривой нормального распределения, согласно правилу трех сигм, в данном диапазоне умещается 95,45% данных); по меньшей мере, 8/9 (88,89%) попадает в интервал μ±3σ ; минимум 15/16 (93,75%) содержится в интервале μ ±4σ . Данное правило показывает минимальное количество эмпирических наблюдений, которое должно попасть в диапазон соответствующего числа средних квадратических отклонений от математического ожидания.
88
Сравнительная таблица. Количество наблюдений,
находящихся на конкретном расстоянии от математического ожидания (правило Бьенамэ-Чебышева и правило трех сигм)
Диапазон |
Количество |
Правило трех |
|
попаданий по |
сигм |
|
правилу Бьенамэ- |
|
(μ-σ; μ+σ) |
Чебышева |
|
0% |
68,27% |
|
(μ-2σ; μ+2σ) |
Минимально |
95,45% |
(μ-3σ; μ+3σ) |
75% |
|
Минимально |
99,73% |
88,89% Видно, что правило Бьенамэ-Чебышева оставляет открытым
вопрос о распределении наблюдений в пределах первых сигм. Эмпирическое правило Бьенамэ-Чебышева применяется для оценки величины разброса вокруг среднего для распределений заметно отличающихся от нормального. В частности, для распределений, имеющих асимметрию или иную, отличную от нормальной форму.
В соответствии с правилом трех сигм, наблюдения, лежащие за пределами (μ-3σ; μ+3σ), практически, невероятны.
Пример №1. Применение правила Бьенамэ-Чебышева.
Дано: таблица первичных статистических данных о числе зарегистрированных в субъектах Украины тяжких и особо тяжких преступлений (тяжких та особливо тяжких злочинів) за 2010 год:
|
Зарегистрировано |
|
|
|
ТиОТ |
Численность |
Коэффициент |
|
преступлений, |
народонаселения, |
на 100 тыс. |
Регион |
шт. |
чел. |
чел. |
|
|
|
|
|
|
|
|
АР Крим |
13063 |
1963489 |
665,3 |
|
|
|
|
Вінницька |
4499 |
1642216 |
274,0 |
|
|
|
|
Волинська |
2814 |
1037345 |
271,3 |
|
|
|
|
Дніпропетровська |
18043 |
3338207 |
540,5 |
|
|
|
|
Донецька |
21477 |
4435584 |
484,2 |
|
|
|
|
89
Житомирська |
3986 |
1279816 |
311,5 |
|
|
|
|
Закарпатська |
2518 |
1247281 |
201,9 |
|
|
|
|
Запорізька |
10716 |
1801971 |
594,7 |
|
|
|
|
Івано- |
|
1380057 |
|
Франківська |
1784 |
|
129,3 |
|
|
|
|
Київська |
7130 |
1718092 |
415,0 |
|
|
|
|
місто Київ |
10494 |
2797553 |
375,1 |
|
|
|
|
Кіровоградська |
4873 |
1010997 |
482,0 |
|
|
|
|
Луганська |
11433 |
2292890 |
498,6 |
|
|
|
|
Львівська |
5755 |
2545480 |
226,1 |
|
|
|
|
Миколаївська |
4389 |
1183821 |
370,7 |
|
|
|
|
Одеська |
10483 |
2388946 |
438,8 |
|
|
|
|
Полтавська |
6152 |
1488657 |
413,3 |
|
|
|
|
Рівненська |
2623 |
1152675 |
227,6 |
|
|
|
|
Севастополь |
2023 |
380796 |
531,3 |
|
|
|
|
Сумська |
4254 |
1162523 |
365,9 |
|
|
|
|
Тернопільська |
2056 |
1084759 |
189,5 |
|
|
|
|
Харківська |
8590 |
2756371 |
311,6 |
|
|
|
|
Херсонська |
4073 |
1088811 |
374,1 |
|
|
|
|
Хмельницька |
4238 |
1327722 |
319,2 |
|
|
|
|
Черкаська |
3599 |
1286196 |
279,8 |
|
|
|
|
Чернігівська |
3626 |
1099223 |
329,9 |
|
|
|
|
Чернівецька |
2229 |
904433 |
246,5 |
|
|
|
|
Поскольку мы не знаем, по какому закону распределены тяжкие и особо тяжкие преступления на территории Украины в 2010 году, используем правило Бьенамэ-Чебышева для вычисления числа регионов, попадающих в диапазон второй и третьей сигм.
С помощью программы Excel рассчитаем описательную статистику («Данные» - «Анализ данных» - «Описательная статистика»), поскольку нам нужно знать среднее (им заменим математическое ожидание) и стандартное отклонение.
Описательная статистика
Среднее 365,4621
Стандартная ошибка 25,49224
Медиана 365,9282
Мода #Н/Д
90
Стандартное |
|
отклонение |
132,4616 |
|
|
Дисперсия |
|
выборки |
17546,07 |
|
|
Эксцесс |
-0,35356 |
|
|
Асимметричность |
0,401447 |
|
|
Интервал |
536,0253 |
|
|
Минимум |
129,27 |
|
|
Максимум |
665,2953 |
|
|
Сумма |
9867,476 |
|
|
Счет |
27 |
|
|
Двухсигмовый диапазон (μ-2σ; μ+2σ): нижняя граница: 365-2∙132=101; верхняя граница: 365+2∙132=629.
Вдиапазоне с числом зарегистрированных тяжких и особо тяжких преступлений от 101 до 629, приведенных на 100 тысяч народонаселения, находится не менее 20 субъектов Украины (27∙0,75=20).
Трехсигмовый диапазон (μ-3σ; μ+3σ): нижняя граница: 365-3∙132=31; верхняя граница: 365+3∙132=761.
Вдиапазоне с числом зарегистрированных тяжких и особо тяжких преступлений от 31 до 761, приведенных на 100 тысяч народонаселения, находится как минимум 24 субъекта Украины (27∙0,8889=24).
Глядя на реальные статистические данные, видим, что для нашего случая в диапазон трех сигм укладываются все исходные данные, а в диапазон двух сигм не укладывалось только максимальное значение 665, что находится в полном соответствии с правилом Бьенамэ-Чебышева.
§4. Формула Бернулли и упрощающие формулы, построенные на локальной и интегральной теоремах МуавраЛапласа, в исследовании криминологических явлений.
91
На практике довольно интересно знать, какова вероятность наступления определенных событий, например, вероятность возвращения в места лишения свободы, освобожденных по амнистии заключенных. Скажем, по амнистии освободили 20 тысяч заключенных. Какова вероятность того, что 15 из них вернется обратно в колонии, если условно считать, что вероятность возврата («благоприятное» событие) составляет 0,6 (p=0,6)?
Для решения подобных задач и применяются формула Бернулли, а так же следствия (формулы) из локальной и интегральной теорем Муавра-Лапласа.
Формула Бернулли: |
P |
= |
n! |
× pk qn−k |
, где n – число |
k!(n -k )! |
|||||
|
|
|
|||
|
k ,n |
|
|
|
|
наблюдений (испытаний, исходов); k – число «благоприятных» исходов, р – вероятность появления благоприятного исхода; q – вероятность не появления благоприятного исхода; Pk,n – вероятность того, что при n испытаниях благоприятное событие наступило ровно k раз.
Решим исходную задачу по формуле Бернулли:
P |
,20000 |
= |
20000 ! |
×0,615000 0,420000 −15000 |
, |
||
|
|
|
|||||
15000 |
|
15000 !(20000 |
-15000 )! |
|
|||
|
|
|
|
Учитывая, что расчеты по формуле Бернулли при возрастании n становятся довольно сложными используют упрощенный вариант, построенный на теореме Муавра-Лапласа.
Локальная теорема Муавра-Лапласа
Теорема. Если вероятность наступления события из n независимых испытаний постоянна и равна p
справедлива формула: lim (P ) - |
1 |
|
|
|
×e− |
2npq |
) = 0 , |
|||
|
|
|
|
|
|
|
|
(k −np )2 |
|
|
n→∞ |
k ,n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|||
2π × |
npq |
|
|
|||||||
|
|
|
|
А в каждом (0<p<1), то
где Pk,n –
вероятность того, что в n испытаниях событие А проявится k раз; q
– обратная вероятность, то есть вероятность того, что данное событие не произойдет.
Упрощая приведенное выражение, для решения конкретных задач, используют приближенное следствие локальной теоремы
Муавра-Лапласа: |
Pk ,n » |
|
1 |
|
×ϕ(x) |
, где |
ϕ(x) = |
|
1 |
|
× e |
− |
x2 |
, |
|
|
|
|
2 |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||
|
npq |
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
2π |
|
|
|
92