Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие Пр Ст030901.65.doc
Скачиваний:
7
Добавлен:
01.07.2025
Размер:
3.26 Mб
Скачать

Тема 6 Приемы обработки показателей правовой статистики

Статистические оценки параметров распределения. Статистические оценки числовых характеристик случайных величин. Статистические оценки параметров распределения. Статистические оценки параметров распределения. Выборочное наблюдение. Числовые характеристики статистического распределения. Приложения математической статистики для решения правовых задач. Характеристики статистического наблюдения. Ошибки при статистическом наблюдении. Расчет отклонения эмпирического распределения от нормального. Статистическое изучение динамики правовых явлений. Понятие и классификация рядов динамики. Условия построения рядов динамики. Приемы исследования рядов динамики преступности. Индексы и их использование в социально-правовых исследованиях.

Необходимо дать определение абсолютных величин, определить их место в структуре статистических данных. Курсант или слушатель должен проанализировать соотношение между абсолютными и относительными величинами, на примерах раскрыть характер и определить их значение при проведении статистических исследований.

Охарактеризовать средние величины как один из основных видов представления статистической информации. На примерах рассмотреть их основные виды и особенности применения.

Обучающийся должен показать знания по предыдущей теме, так как статистическое исследование строится на трех этапах, третий – анализ показателей, полученных в результате сводки и обработки статистических материалов. На каждой из стадий применяются специфические способы (средства и методы) – методы массовых наблюдений, группировок, обобщающих показателей – средних и относительных величин, индексный метод, табличных и графических представлений, методы теории вероятностей и математической статистики (в частности, эти методы применяются для измерения ошибки выборки, анализа связи между факторами и оценки надежности результатов – корреляционный и дисперсионный анализ и др.), которые в совокупности и образуют статистическую методологию. В процессе статистического исследования эти и другие методы статистики обычно применяются комплексно. Например, в анализе рядов сочетается использование таких приемов, как выравнивание (сглаживание) рядов, исчисление средних и индексов, построение графиков и т.д.

Общая характеристика метода выборочного наблюдения

Выборочное наблюдение применяется, когда применение сплошного наблюдения физически невозможно из-за большого массива данных или экономически нецелесообразно. Физическая невозможность имеет место, например, при изучении пассажиропотоков, рыночных цен, семейных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением, например, дегустация, испытание кирпичей на прочность и т.п.

Статистические единицы, отобранные для наблюдения, составляют выборочную совокупность или выборку, а весь их массив - генеральную совокупность(ГС). При этом число единиц в выборке обозначают n, а во всей ГС -N. Отношение n/N называется относительный размер или доля выборки.

Качество результатов выборочного наблюдения зависит от репрезентативности выборки, то есть от того, насколько она представительна в ГС. Для обеспечения репрезентативности выборки необходимо соблюдать принцип случайности отбора единиц, который предполагает, что на включение единицы ГС в выборку не может повлиять какой-либо иной фактор кроме случая.

Существует 4 способа случайного отбора в выборку:

  1. Собственно случайный отбор или «метод лото», когда статистическим величинам присваиваются порядковые номера, заносимые на определенные предметы (например, бочонки), которые затем перемешиваются в некоторой емкости (например, в мешке) и выбираются наугад. На практике этот способ осуществляют с помощью генератора случайных чисел или математических таблиц случайных чисел.

  2. Механический отбор, согласно которому отбирается каждая (N/n)-я величина генеральной совокупности. Например, если она содержит 100 000 величин, а требуется выбрать 1 000, то в выборку попадет каждая 100 000 / 1000 = 100-я величина. Причем, если они не ранжированы, то первая выбирается наугад из первой сотни, а номера других будут на сотню больше. Например, если первой оказалась единица № 19, то следующей должна быть № 119, затем № 219, затем № 319 и т.д. Если единицы генеральной совокупности ранжированы, то первой выбирается № 50, затем № 150, затем № 250 и так далее.

  3. Отбор величин из неоднородного массива данных ведется стратифицированным (расслоенным) способом, когда генеральная совокупность предварительно разбивается на однородные группы, к которым применяется случайный или механический отбор.

  4. Особый способ составления выборки представляет собой серийный отбор, при котором случайно или механически выбирают не отдельные величины, а их серии (последовательности с какого-то номера по какой-то подряд), внутри которых ведут сплошное наблюдение.

Качество выборочных наблюдений зависит и от типа выборкиповторная или бесповторная.  При повторном отборе попавшие в выборку статистические величины или их серии после использования возвращаются в генеральную совокупность, имея шанс попасть в новую выборку. При этом у всех величин генеральной совокупности одинаковая вероятность включения в выборку. Бесповторный отбор означает, что попавшие в выборку статистические величины или их серии после использования не возвращаются в генеральную совокупность, а потому для остальных величин последней повышается вероятность попадания в следующую выборку.

Бесповторный отбор дает более точные результаты, поэтому применяется чаще. Но есть ситуации, когда его применить нельзя (изучение пассажиропотоков, потребительского спроса и т.п.) и тогда ведется повторный отбор.

Выборочное наблюдение является разновидностью несплошного статистического наблюдения и заключается в случайном или механическом отборе отдельных единиц статистической совокупности или их групп. При этом совокупность отобранных единиц называется выборочной, а совокупность, из которой производят отбор, – генеральной.

Задача выборочного наблюдения состоит в том, чтобы на основе статистических показателей, рассчитанных для выборочной совокупности, определить их значения для генеральной совокупности. Например, определить среднюю норму прибыли предприятий отрасли, зная ее среднее значение для части предприятий этой отрасли.

По виду формирования различают:

1) индивидуальное выборочное наблюдение, когда отбирают отдельные единицы;

2) групповое наблюдение, когда отбирают группы единиц;

3) комбинированное наблюдение, когда сочетают два предыдущих вида.

По методу отбора различают:

1) повторное выборочное наблюдение, когда выбранная единица остаётся в генеральной совокупности и может быть выбрана ещё сколько угодно раз;

2) бесповторное наблюдение, когда выбранная единица исключается из генеральной совокупности и в последующем отборе не участвует.

В зависимости от конкретного механизма отбора различают способы выборочного наблюдения:

1) собственно-случайный, когда случайным образом (с помощью таблицы случайных чисел или жеребьёвки) отбирают отдельные единицы совокупности;

2) механический, когда генеральную совокупность вначале упорядочивают по нейтральному признаку в порядке его возрастания ил убывания (например, по алфавиту), а затем отбирают заданное число через определённый интервал ( например, при двухпроцентном отборе – каждую 50-ую единицу);

3) типический, когда генеральную совокупность вначале разбивают на качественно однородные группы по признакам, от которых зависят изучаемые показатели (например, группировка предприятий по формам собственности). Затем из каждой группы отбирают отдельные единицы – случайно или механически;

4) серийный, когда вначале из генеральной совокупности выбирают случайно или механически равновеликие группы единиц – серии (например, ящики с товаром). Затем в каждой отобранной серии обследуют все без исключения единицы.

При проведение выборочного наблюдения всегда возникают ошибки репрезентативности. Они представляют собой расхождения между выборочными и генеральными показателями из-за того, что выборочная совокупность не в полной мере воспроизводит генеральную. Это сказывается на точности и достоверности результатов наблюдения.

Определение объема выборки

На практике часто возникает вопрос «Какой объем должна иметь выборка, чтобы получить результаты нужной точности?».

Конечно, чем большее количество первичного материала имеет исследователь, тем не хуже. Однако из практики социально-правовых исследований известно, что чем больше первичного материала, тем больше необходимо провести вычислений, и, соответственно увеличиваются затраты на получение и обработку этого материала.

Поэтому целесообразно ориентироваться на тот минимальный объем, который экономичен и дает возможность получить удовлетворительные результаты.

Объем выборки в существенной мере зависит от способа организации выборки.

Различают следующие способы отбора выборочных данных:

- собственно случайный отбор;

- механический отбор ;

- типический отбор;

- серийный (гнездовой) отбор ;

- комбинированный отбор .

Наиболее доступным и распространенным является собственно случайный отбор.

1. Собственно случайный отбор.

Этот способ означает выборку конкретных единиц из генеральной совокупности без дробления генеральной совокупности на группы. При этом существуют два варианта отбора:

- повторный (отобранная единица вновь участвует в последующей процедуре отбора);

- бесповторный (отобранная единица не участвует в последующей процедуре отбора).

Примеры:

  1. в архиве суда тома уголовных дел отбираются и откладываются в сторону – это бесповторная выборка;

  2. в архиве суда тома уголовных дел отбираются по их номеру несколькими независимыми экспертами – это повторная выборка.

Целями выборочного исследования могут быть:

а) изучение некоторых средних характеристик:

- средний срок осуждения;

- количество судимостей;

- средний возраст освобождающихся из мест лишения свободы и др.;

б) изучение долей определенных категорий в генеральной совокупности:

- доля рецидивистов среди содержащихся в исправительно-трудовой колонии строгого режима;

- доля осужденных за кражи;

- доля ложных сигналов в дежурную часть органа внутренних дел и др.

В зависимости от цели социально-правового исследования различаются и формальные соотношения для объема проектируемой выборки

Соотношения для определения объема выборки

Способ отбора

Повторный

Бесповторный

Изучение средних величин

Изучение долей

В таблице приняты следующие обозначения:

σ – среднее квадратическое отклонение;

δ – доля определенных элементов в генеральной совокупности;

N – объем генеральной совокупности;

Δ – требуемая точность оценки характеристик генеральной совокупности;

t - параметр, связанный с вероятностью, надежностью получения оценки.

В связи с тем, что величины σ и δ априори неизвестны, рекомендуется брать их приближенные оценки, полученные в других исследованиях или наблюдениях.

В частности, если даже приблизительно неизвестна доля изучаемых элементов в генеральной совокупности, то следует вместо произведения

δ(1- δ) подставить в формулы для объемов выборки его максимальное значение, равное 0,25. В этом случае соотношения во второй строке таблицы 5 примут вид:

- для повторной выборки;

- для бесповторной выборки

При очень больших (более 1000 единиц) объемах генеральной совокупности формулы для повторной и бесповторной выборок практически совпадают.

При вероятности (надежности) 0,95 обеспечения заданной точности выборочных оценок t = 2, а при вероятности 0,99 - t = 3.

В социально-правовых исследованиях, как правило, надежность в 95% является вполне приемлемой.

Пример 1 проектирования выборочного наблюдения.

Пусть необходимо определить средний срок расследования преступлений в N-ом управлении внутренних дел.

Требуемая точность Δ – одна неделя.

Общее число уголовных дел в последний год – 15000.

Требуемая надежность – 95% (то есть t = 2).

Произведенные пробные выборки дали приближенную оценку для дисперсии σ2 = 49.

По формуле для бесповторной выборки применительно к средним величинам получаем объем выборочной совокупности для указанных условий n = 194 (проверить самостоятельно).

Поскольку объем генеральной совокупности достаточно велик, то можно воспользоваться более простой формулой для повторной выборки. В этом случае n = 196 (проверить самостоятельно).

Пример 2 проектирования выборочного наблюдения.

Пусть необходимо провести выборочное наблюдение для оценки доли осужденных за кражи, содержащихся в колонии общего режима с фактической наполняемостью в 1200 человек.

Если никаких предварительных данных о размере этой доли не имеется то произведение δ(1- δ) в формуле таблицы 5 заменяем на 0,25.

Требуемая точность определения доли – 5% с надежностью 0,95.

Воспользовавшись выражением (19) для бесповторной выборки, оцениваем ее объем n = 303.

Основной принцип организации собственно-случайной выборки – это обеспечение равной возможности быть отобранным каждому элементу генеральной совокупности. Для этого используются таблицы случайных чисел или датчики случайных чисел для ЭВМ.

2. Механический отбор.

При механическом отборе генеральная совокупность «механически» делится на столько групп, сколько объектов должно войти в выборку, а из каждой группы отбирают один объект.

Например, если нужно отобрать для анализа личности правонарушителя 20% уголовных дел, связанных с совершением тяжких телесных повреждений, то отбирают каждое пятое дело; если требуется отобрать 5% уголовных дел, то отбирают каждое двадцатое.

Можно пронумеровать элементы генеральной совокупности, а затем в зависимости от объема выборки, установив шаг отбора, произвести их отбор.

Иногда механический отбор может не обеспечить репрезентативность выборки.

3. Типический отбор.

При типическом отборе генеральная совокупность по тому или иному признаку делится на типические группы таким образом, чтобы максимально уменьшить в каждой типической группе колеблемость признака.

Количество единиц из каждой типической группы выбирается пропорционально среднему квадратическому отклонению признака в этой группе.

При типическом отборе получаются более точные результаты, чем при механическом отборе.

4. Серийный (гнездовой) отбор.

При серийном отборе генеральную совокупность делят на ряд групп (серий), а затем случайным образом производят выборку из них. Серии, попавшие в выборку, обследуются сплошным образом.

Серийная выборка применяется в том случае, когда сложно организовать выборочное наблюдение путем собственно случайного отбора, механического отбора или типического отбора в силу ограниченности ресурсов (людских, материальных и др.) участников выборочного наблюдения.

Пользуются серийным отбором тогда, когда обследуемый признак колеблется в различных сериях незначительно.

5. Комбинированный отбор.

При комбинированном отборе отбор проводится следующим образом:

- на первом этапе проводится выборочный отбор серий одинакового объема;

- на втором этапе простым случайным отбором выбирают несколько серий;

- на третьем этапе из каждой серии простым случайным отбором извлекают отдельные объекты, то есть выборочный отбор единиц из этих серий.

Оценки вариационного ряда могут быть:

- точечными;

- интервальными.

Точечной называют оценку, определяемую одним числом.

При выборке малого объема точечная оценка может существенно отличаться от оцениваемого параметра, и, как следствие, приводит к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

Интервальной называют оценку, определяемую двумя числами – концами интервала.

Интервальная оценка, в отличие от точечной, позволяют установить:

- точность оценок;

- надежность (доверительную вероятность) оценок.

Точностью оценки называют некоторое положительное число δ, с помощью которого можно определить абсолютную величину разности между действительным значением неизвестного параметра R и найденной по данным выборки статистической характеристикой (R*), служащей оценкой этого неизвестного параметра R. То есть если δ > 0 и |RR*| < δ, то, чем меньше δ, тем оценка точнее.

Однако статистические методы не позволяют категорически утверждать, что оценка R* удовлетворяет неравенству |RR*| < δ. Можно говорить лишь о некоторой вероятности γ, с которой это неравенство выполняется.

Поэтому при интервальной оценке вводят понятие надежности (доверительной вероятности) оценки.

Надежностью (доверительной вероятностью) оценки R по R* называют вероятность γ, с которой осуществляется неравенство |RR*| < δ.

Обычно надежность оценки задается наперед, причем в качестве γ берут значение, близкое к 1 (обычно это: 0,95; 0,99; 0,999).

Пусть вероятность того, что |RR*| < δ, равна γ:

P[|RR*| < δ] = γ.

Если в этом соотношении заменить неравенство |RR*| < δ равносильным ему двойным неравенством:

- δ<RR* < δ, или R* - δ < R< R* + δ, то получаем:

P[R* - δ < R< R* + δ]= γ.

Полученное соотношение следует понимать так:

- вероятность того, что интервал (R* - δ , R* + δ) заключает в себе (покрывает) неизвестный параметр R, равна γ.

Интервал (R* - δ , R* + δ), покрывающий неизвестный параметр с заданной надежностью γ называют доверительным интервалом.

Интервал (R* - δ , R* + δ) имеет случайные концы (их называют доверительными границами). В разных выборках получаются различные значения R*, следовательно от выборки к выборке будут изменяться и концы доверительного интервала, то есть доверительные границы сами являются случайными величинами – функциями от x1, x2,…,xn.

А так как случайной величиной является не оцениваемый параметр R, а доверительный интервал, то правильнее будет говорить не о вероятности попадания R в доверительный интервал, а о вероятности того, что доверительный интервал покроет R.

2.1. Пример построения вариационного ряда при дискретной и непрерывной вариации.

Основные черты социальных и социально-правовых систем - это случай и время, то есть они развиваются во времени отчасти при непредсказуемом поведении их элементов.

Как мы уже знаем, изучение уголовно-правовых массовых явлений начинается со сбора статистических данных, то есть со статистического наблюдения.

Также нам известно, что полученный в результате наблюдения первичный материал подвергается в дальнейшем группировке, то есть равносоставную массу элементов разделяют по тому или иному признаку на однородные группы.

Пусть в качестве изучаемого признака (X) совокупности лиц, осужденных за тяжкие телесные повреждения, взят возраст.

Анализ возрастных способностей названной группы применительно к 55 осужденным дал следующие результаты:

16, 22, 20, 19, 18, 24, 21, 17, 23, 18,

19, 16, 22, 18, 23, 20, 19, 22, 20, 19,

20, 18, 21, 18, 19, 24, 17, 16, 23, 19,

25, 21, 20, 18, 19, 22, 20, 18, 17, 21,

19, 20, 23, 25, 22, 20, 17, 24, 19, 17,

21, 18, 19, 21, 26

На основе полученного статистического наблюдения может быть составлен следующий вариационный ряд (таблица 1):

Таблица 1.

Возраст в годах , xi

16

17

18

19

20

21

22

23

24

25

26

Число осужденных,

ni

3

5

8

10

8

6

5

4

3

2

1

Объем выборки n = 55.

Изменение (вариация) признака может быть:

- дискретной;

- непрерывной.

При дискретной вариации значения признака отличаются друг от друга на некоторое (обычно целое) число, например:

- число судимостей;

- число сообщений о происшествиях, поступивших в дежурную часть;

- число эпизодов в уголовном деле и др.

При непрерывной вариации значения признака могут отличаться на сколь угодно малую величину, например:

- время достижения патрульной группой места происшествия;

- процент выполнения нормы выработки на предприятиях исправительно-трудовых учреждений (ИТУ) и др.

При непрерывной (а часто и при дискретной) вариации разделение признака называется интервальным, то есть частоты относятся не к отдельному значению признака, а к некоторому интервалу, например, вариационный ряд распределения работающих в ИТУ по норме выработки (таблица 2):

Таблица 2.

Выполнение норм выработки в ИТУ (интервалы), %

65-70

70-75

75-80

80-85

85-90

90-95

95-100

100-105

105-110

110-115

Число работающих,

ni

68

81

95

120

88

77

64

45

33

25

Объем выборки n = 696.

Вариационные ряды могут быть и с одинаковыми и неодинаковыми интервалами.

От выбора интервала во многом зависят результата последующего анализа:

- при чрезмерно зауженном интервале начинает значительно сказываться случайность наблюдений, различные «шумовые» эффекты;

- при неоправданном расширении интервала нивелируются важные особенности наблюдаемого социально-правового явления.

От этих неприятных последствий уходят путем выбора интервала по формуле:

(1)

где: xmax - xmin – размах вариации, характеризующий разность между наибольшей и наименьшей вариантами;

n – объем выборки.

Для данных таблицы 1 получаем величину интервала k = 1,3; а для данных таблицы 2 k = 3,8.

Полученные значения близки к выбранным, то есть к интервалам 1 и 5 соответственно.

Относительный коэффициент вариации (V) – это коэффициент, представляющий собой отношение среднего квадратического отклонения от средней арифметической, выраженное в процентах:

(10)

Ошибки статистического наблюдения

Информация, полученная в ходе статистического наблюдения может не отвечать действительности, а расчетные значения показателей не соответствовать фактическим значениям.

Расхождение между расчетным значением и фактическим называется ошибкой наблюдения.

В зависимости от причин возникновения различают ошибки регистрации и ошибки репрезентативности. Ошибки регистрации характерны как для сплошного, так и для несплошного наблюдения, а ошибки репрезентативности — только для несплошного наблюдения. Ошибки регистрации, как и ошибки репрезентативности, могут быть случайными и систематическими.

Ошибки регистрации — представляют собой отклонения между значением показателя, полученного в ходе статистического наблюдения, и его фактическим значением. Ошибки регистрации бывают случайными (результат действий случайных факторов — перепутаны строки например) и систематическими (проявляются постоянно).

Ошибки репрезентативности — возникают, когда отобранная совокупность недостаточно точно воспроизводит исходную совокупность. Характерны для несплошного наблюдения и заключаются в отклонении величины показателя исследуемой части совокупности от его величины в генеральной совокупности.

Случайные ошибки — являются результатом действия случайных факторов.

Систематические ошибки — всегда имеют одинаковую направленность к увеличению или уменьшению показателя по каждой единице наблюдения, вследствие чего значение показателя по совокупности в целом будет включать накопленную ошибку.

Способы контроля:

  • Счетный (арифметический) — проверка правильности арифметического расчета.

  • Логический — основан на смысловой взаимосвязи между признаками.