Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Правовая статистика Кулев.doc
Скачиваний:
3
Добавлен:
01.03.2025
Размер:
14.91 Mб
Скачать

Мода и медиана

Мода и медиана определяются лишь структурой распределе­ния. Поэтому их именуют структурными позиционными средними. Медиану и моду используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или не­целесообразен. Для этого в качестве средней берется наиболее ча­сто встречающаяся величина, называемая модой (Мо). Например, 100 уголовных дел по определенному виду преступлений распре­делились за год по срокам расследования таким образом:

Срок расследования, месяцы

Число дел

1

2

3

30

60

10

всего 100

Наибольшее число дел данной категории (наибольший вес — 60) расследуется в течение двух месяцев. Это и будет мода — ва­риант, которому соответствует наибольшая частота в совокупно­сти или в вариационном ряду.

К моде прибегают для выявления величины признака, име­ющей наибольшее распространение (цена на рынке, по которой было совершено наибольшее число продаж данного товара, но­мер обуви, который пользуется наибольшим спросом у покупате­лей, и т.д.). Мода чаще всего используется в совокупностях боль­шой численности.

Медиана (Me) — это средняя вариантов ранжированного (упоря­доченного) ряда, расположенного в определенном порядке — по воз­растанию или убыванию вариантов. Она делит такой ряд пополам.

Например, выборочное обследование в одном из округов Москвы 12 коммерческих пунктов обмена валюты позволило за­фиксировать различные цены за доллар США при его продаже (дан­ные на 17 июля 2000 г. при установленном ЦБ РФ курсе доллара США 27,85руб.)'

Первая строка- № пункта обмена валюты, вторая - Цена за 1 долл. США, руб.

1

2

3

4

5

6

7

8

9

10

11

12

27,95

28,05

28,00

28,15

28,10

27,90

28,25

28,10

28,05

28,20

28,00

28,10

Ввиду отсутствия в нашем распоряжении данных об объеме про­даж в каждом обменном пункте расчет средней арифметической с целью определения средней цены за доллар нецелесообразен, да и невозможен. Однако можно определить то значение призна­ка, которое делит единицы ранжированного ряда на две части. Та­кое значение и носит название медианы. Ее расчет по несгруппированным данным производится следующим образом.

а) расположим индивидуальные значения признака в возра­стающем порядке:

x1

x2

x3

x4

x5

x6

x7

x8

x9

x10

x11

x12

27,90

27,95

28,00

28,00

28,05

28,05

28,10

28,10

28,10

28,15

28,20

28,25

б) определим порядковый номер медианы по формуле

В нашем случае Me = 6,5. Это означает, что медиана рас­положена между шестым и седьмым значениями признака в ран­жированном ряду, так как ряд имеет четное число индивидуаль­ных значений. Таким образом, Me равна средней арифметической , соседних значений 28,05 и 28,10:

Me = (28,05+28,10)/2 =28,075 руб.

Иной порядок вычисления медианы в случае нечетного чис­ла индивидуальных значений.

Предположим, мы наблюдали не 12, а 11 пунктов обмена ва­люты, тогда ранжированный ряд будет выглядеть следующим об­разом (отбрасываем 12 пункт)

x1

x2

x3

x4

x5

x6

x7

x8

x9

x10

x11

27,90

27,95

28,00

28,00

28,05

28,05

28,10

28,10

28,10

28,15

28,20

Определяем номер медианы Me = (11+1)/2 = 6; на шестом месте находится Х6 =28,05 Это и есть медиана (Me =28,05 руб )

Модальной ценой за доллар США можно назвать 28,10 руб это значение повторяется 3 раза, чаще, чем все другие

Рассмотрим расчет медианы в интервальном вариационном ряду (табл.5.3.2)

Она определяется по формуле: ,

где - начальное значение интервала, медиану;

- величина медианного интервала;

- сумма частот ряда;

- сумма накопленных частот, предшествующая медианному интервалу;

- частота медианного интервала.

Таблица 5.3.3.

Группировка предприятий по числу рабочих, чел.

Группировка предприятий

по числу рабочих, чел.

Число предприятий

Сумма накопления частот

100-200

1

1

200-300

3

4(1+3)

300-400

7

11 (4 + 7)

400-500

30

41 (11 +30)

500-600

19

-

600-700

15

-

700-800

5

-

Итого

80

-

Определим медианный интервал. Он соответствует интервалу 400 - 500, так как сумма накопленных частот (41) превышает половину всех значений (80).

Значит: ХMe = 400; iме = 100; Σf= 80; SMe-1 = 11; fMe = 30,

Отсюда

Средние величины не являются безукоризненной характеристикой изучаемых совокупностей. За ними скрывается колеблемость, вариация индивидуальных значений вокруг средней. Вариацией признаков называется различие численных значений у отдельных единиц совокупности.

В одних случаях отдельные значения признака могут незначительно отличаться друг от друга и от средней; в других, наоборот, - эти различия значительны.Для характеристики размера вариации используются специальные показатели колеблемости: I) размах вариации (R); 2) среднее линейное отклонение (d); 3) средний квадрат отклонения (дисперсия ); 4) среднее квадратическое отклонение ( ); 5) коэффициент вариации (V).

Показатели d, , , как и средние величины, могут быть простыми и взвешенными, чем меньше d и , тем однороднее совокупность.

Размах вариации (R) - величина разности между максимальным и минимальным значениями признака (R = Хmах - Хmin).

Если, например, изучаются лица, совершившие хулиганство, а в их совокупности самому старшему правонарушителю 36 лет и са­мому младшему 16 лет, то размах вариации возрастного призна­ка в этом случае составит 20 лет. Если при изучении лиц, совер­шивших убийство, аналогичные показатели будут 65 и 15 лет, то размах вариации составит 50 лет. Естественно, что в первом слу­чае изучаемая совокупность более однородна по возрасту, хотя во­все не исключено, что и в том и в другом случае средний возраст преступников будет одинаков. Однако этот показатель (средний возраст) в первом случае более точно характеризует изучаемую со­вокупность преступников.

Среднее линейное отклонение (d)- средняя арифметическая из абсолютных отклонений индивидуальных значений признака от среднего значения.

Формула среднего линейного отклонения такова:

Для первичного ряда для ряда распределения - (прямые скобки означают, что разности в числителе берутся по модулю, то есть суммирование ведется без учета знаков). Среднее линейное отклонение показывает, насколько в среднем отличаются индивидуальные значения признака от среднего их значения.

Из данных уголовно-правовой статистики известна колеблемость, например, убийств, причинении вреда здоровью, хулиганств и других преступлений, совершенных в разных регионах в состо­янии опьянения или с применением оружия. Аналогичные коле­бания отмечаются в показателях мотивов совершения этих преступлений и т.д. Такие различия должны учитываться при выяснении причин и условий, способствующих совершению этих преступле­ний. Особенно важно выявить колеблемость, изменяемость отдель­ных величин, из которых вычислены средние, при одинаковости или близости этих средних для нескольких совокупностей.

В известной мере помощь в этом деле может оказать специаль­ный показатель — среднее квадратическое отклонение. Он служит наилучшей мерой колеблемости вариантов, из которых выводит­ся средняя, наилучшим способом проверки однородности сово­купности.

Среднее квадратическое отклонение ( - сигма) равно квадратному корню из среднего квадрата отклонений индивидуальных значений признака от средней арифметической, т. е. его формула следующая:

для первичного ряда ; для ряда распределения-

Среднее квадратическое отклонение также как и среднее линейное показывает насколько в среднем отличаются индивидуальные значения признака от среднего значения. По величине среднее квадратическое отклонение превышает среднее линейное. В статистике для измерения вариации используют среднее квадратическое отклонение. Размах колебаний, среднее линейное отклонение и среднее квадратическое отклонение выражают в именованных числах, в которых выражены значения признака, то есть характеризуют абсолютную меру вариации.

Возьмем следующие два ряда цифр о сроках лишения свобо­ды в годах: 1, 4, 6, 9, 15 и 4, 6, 7, 8, 10.

I ряд (годы): 1, 4, 6, 9, 15. Средняя арифметическая = 7 лет.

Отклонения от средней (х - ) равны соответственно - 6; - 3; -1;+2;+8.

Квадраты отклонений (х - )2 равны соответственно 9;1;0;1;9 тогда

II ряд (годы): 4, 6, 7, 8, 10. Средняя арифметическая = 7 лет. Отклонения от средней (х - ) равны соответственно - 3; - 1;0;+1;+3.

Квадраты отклонений (х - )2 равны соответственно 9; 1; 0; 1; 9. тогда

Из этого видно, что среднеквадратическое отклонение в пер­вом ряду в 2,5 раза больше, чем во втором, т.е. колеблемость (пе­строта, дисперсия) второго ряда в 2,25 раза меньше, чем первого.

Квадрат среднего квадратического отклонения дает величину дисперсии, на которой основаны практически все методы матема­тической статистики. В ее арсенале есть и другие меры вариации, которые, однако, выходят за пределы курса правовой статистики. В ней они не находят широкого практического применения.

Возводим в квадрат и получаем сумму квадратов от­клонений: 4+1+1+4=10.

Результат делим на число членов ряда 10:5=2. Из полученного среднего квадрата извлекаем корень

Формула среднеквадратического отклонения выража­ется:

где: — среднеквадратическое отклонение; —величина варианта ряда; x—среднеарифметическая ряда; — знак, обозначающий сумму; n—число вариантов ряда.

Среднеквадратическое отклонение выражается в тех же единицах, что и среднеарифметическая ряда. Для сравне­ния меры однородности разных совокупностей используют коэффициент вариации, представляющий собой процентное отношение среднего квадратического отклонения к средней арифметической:

где: V—коэффициент вариации; —среднеквадратическое отклонение; —среднеарифметическая ряда.

В нашем примере

Чем больше коэффициент вариации, тем разнообразнее совокупность. Он показывает на сколько процентов в среднем индивидуальные значения отличаются от средней арифметической. В известной степени коэффициент является критерием надежности средней: если он велик (превышает 40%), то это свидетельствует о большой колеблемости в величине признака у отдельных единиц данной группы, а следовательно, средняя недостаточно надежна.

Таблица 5.3.4