- •Содержание дисциплины
- •Тема 1. Статистика как наука.
- •Тема 2. История правовой статистики.
- •Тема 3. Правовая статистика и её значение в обеспечении режима законности
- •1. Понятие предмет и объект правовой статистики
- •2. Отрасли правовой статистики и её место в системе юридических наук.
- •3. Научно-практическое значение материалов правовой статистики
- •Тема 4 Статистическое наблюдение.
- •Тема 5 Сводка и группировка материалов статистического наблюдения
- •1 Понятие и содержание статистической сводки
- •2. Техника и способы сводки
- •3.Разработка статистических показателей.
- •Статистическая группировка.
- •Виды группировок и основания их классификации
- •Тема 6 Приемы обработки показателей правовой статистики
- •Общая характеристика метода выборочного наблюдения
- •Оценка точности и достоверности результатов выборочного наблюдения
- •Статистические оценки числовых характеристик случайных величин
- •Генеральная средняя
- •Выборочная средняя
- •Оценка генеральной средней по выборочной средней. Устойчивость выборочных средних
- •Групповая и общая средние
- •Генеральная дисперсия
- •Выборочная дисперсия
- •Формула для вычисления дисперсии
- •Групповая, внутригрупповая, межгрупповая и общая дисперсия
- •2 Анализ рядов динамики
- •3 Анализ сезонных колебаний
- •4 Методы выравнивания рядов динамики
- •Тема 7 Статистический анализ оценки параметров распределения.
- •Тема 7.1. Понятие о статистическом анализе и его основные задачи
- •2. Статистические возможности анализа преступности
- •3. Статическое изучение деятельности правоохранительных органов
- •Тема 7.2. Методы статистического анализа в задачах моделирования и прогнозирования социально-правовых процессов
- •1. Этапы исследования с использованием статистических методов
- •2. Корреляционный анализ
- •4. Факторный анализ
- •5. Кластерный анализ
- •6. Анализ динамики и прогнозирование социально-правовых процессов
- •Тема 7.4. «Статистические гипотезы.»
- •1.Статистические гипотезы.
- •2.Критерии проверки статистических гипотез.
- •3.Ошибки первого и второго рода при проверке статистических гипотез.
- •О смысле ошибок первого и второго рода
- •Вероятности ошибок (уровень значимости и мощность)
- •Примеры использования Компьютеры
- •Компьютерная безопасность
- •Фильтрация спама
- •Вредоносное программное обеспечение
- •Поиск в компьютерных базах данных
- •Оптическое распознавание текстов (ocr)
- •Досмотр пассажиров и багажа
- •Биометрия
- •4.Проверка гипотезы.
Оценка точности и достоверности результатов выборочного наблюдения
Порядок
оценки результатов выборочного наблюдения
рассмотрим на примере определения
генеральной средней (
)
для количественного признака и генеральной
доли (p)
для альтернативного атрибутивного
признака.
Обозначим ошибку выборки соответственно:
;
,
где
-
выборочная средняя;
w – выборочная доля.
Ошибка выборки является случайной величиной, так как заранее неизвестно, какие единицы попадут в выборочную совокупность. Поэтому, оценивая точность результатов наблюдения, рассчитывают среднее и предельное значение этой ошибки. Эти два параметра связаны между собой:
;
где
- предельные ошибки выборки для
количественного и альтернативного
атрибутивного признаков соответственно;
-
средние ошибки выборки соответственно;
t – коэффициент доверия. Он зависит от вероятности, с которой гарантируется предельная ошибка выборки (доверительной вероятности).
Предельная ошибка выборки определяет предельные значения генеральной средней (доли), образующие доверительный интервал:
Предельная ошибка выборки характеризует точность результатов наблюдения, а доверительная вероятность – их достоверность. Для выборок большого объёма (не менее 30 единиц) коэффициент доверия зависит от доверительной вероятности (Р) следующим образом:
P |
0,683 |
0,95 |
0,954 |
0,99 |
0,997 |
t |
1 |
1,96 |
2 |
2,58 |
3 |
Порядок расчёта средний ошибки выборки зависит от способа выборочного наблюдения и метода отбора. При собственно-случайном наблюдении среднюю ошибку выборки определяют по формулам:
при повторном отборе
;
;
при бесповторном отборе
;
,
где
-
выборочная дисперсия;
n – объём выборочной совокупности;
N – объём генеральной совокупности.
Средняя ошибка бесповторного наблюдения всегда меньше средней ошибки повторного наблюдения, так как всегда выполняется условие 0 < n/N < 1.
При большом объёме выборочной совокупности механическое наблюдение близко к бесповторному собственно-случайному отбору. В этом случае применяют формулы расчёта средней ошибки бесповторной собственно-случайной выборки.
При типическом наблюдение средняя ошибка выборки составляет:
при повторном отборе
;
;
при бесповторном отборе
где
-
средняя из внутригрупповых выборочных
дисперсий;
-
средняя из внутригрупповых выборочных
дисперсий доли.
Условием применения этих формул является отбор единиц в типические группы пропорционально их числу в генеральных группах, когда:
,
где ni, Ni – число единиц в i-ой выборочной и генеральной группах соответственно.
При серийном наблюдении для расчета средней ошибки выборки используют следующие формулы:
при повторном отборе
;
;
при бесповторном отборе
где
-
межсерийная выборочная дисперсия;
-
межсерийная выборочная дисперсия доли;
r - число отобранных серий;
R - число серий в генеральной совокупности.
Порядок расчёта всех видов выборочных дисперсий и взаимосвязь между ними аналогичны рассмотренным в разделе «Статистические показатели». При этом межсерийные дисперсии рассчитывают по формулам для расчета межгрупповых дисперсий. Отличие состоит в том, что все эти дисперсии рассчитывают не по генеральной совокупности, а по выборочной.
Определение необходимого объёма выборки
Перед проведением выборочного наблюдения необходимо определить объём будущей выборочной совокупности. Выбор объёма осуществляют, задаваясь точностью результатов наблюдения (предельной ошибкой выборки) и их достоверностью (доверительной вероятностью или коэффициентом доверия).
В таблице представлены формулы расчёта необходимого объёма выборки при различных способах наблюдения.
Способ выборочного наблюдения |
Повторный отбор |
Бесповторный отбор |
Собственно-случайный а) для среднего значения б) для доли
Механический
Типический а) для среднего значения б) для доли
Серийный а) для среднего значения б) для доли |
–
|
то же
|
Применение этих формул требует знания выборочных дисперсий - общей, внутригрупповых или межсерийной. Их значения можно взять из результатов аналогичного наблюдения, проведённого ранее. Если такой возможности нет, то необходимо провести предварительное выборочное наблюдение небольшого объёма и по его результатам рассчитать выборочные дисперсии.
Статистические оценки числовых характеристик случайных величин
При решении многих практических задач функция распределения случайной величины не может быть определена теоретическим путем.
В таких случаях используются полученные в опыте результаты наблюдений над случайными величинами, позволяющие при достаточном их числе и надлежащей обработке:
- определить с известной степенью уверенности вид функции распределения;
- оценить числовые характеристики функции распределения.
Множество, включающее все однородные объекты, например:
- возможные сроки совершения преступления;
- уголовные дела, находящиеся у следователя;
- жители района города и др.
образуют генеральную совокупность.
Наряду с генеральной совокупностью объектов, можно рассматривать генеральную совокупность их признаков.
В соответствии с числом объектов генеральные совокупности могут быть:
- конечными (количество жителей района города);
- бесконечными (сроки совершения преступления).
Часть генеральной совокупности, отобранная наугад для наблюдений, как мы уже знаем, называется случайной выборкой или выборкой (случайной совокупностью).
Результаты наблюдений образуют эмпирическое (статистическое, выборочное) распределение.
Обработка результатов измерений позволяет вычислить числовые характеристики эмпирического распределения (выборки), называемые статистическими оценками (иначе – эмпирическими или выборочными характеристиками).
Под оцениванием понимается процесс, а под оценкой – число, полученное в результате этого процесса.
В силу случайности выборки ее характеристики являются случайными величинами, отличаясь этим от достоверных числовых характеристик теоретического распределения, которому подчиняется генеральная совокупность.
Статистические оценки представляют собой функции результатов наблюдений.
В соответствии с законом больших чисел статистические оценки могут служить приближенными оценками соответствующих числовых характеристик теоретического распределения при весьма общих предположениях о его характере.
Наблюдения, на основе которых вычисляются статистические оценки, должны производиться над однородными объектами в одинаковых условиях.
Пропорции в выборке должны соответствовать пропорциям в генеральной совокупности. Такую выборку называют репрезентативной (представительной). Для обеспечения репрезентативности выборка должна производиться без невольной или сознательной предвзятости по отношению к отдельным частям генеральной совокупности.
Среди возможных статистических оценок более приемлемы оценки, удовлетворяющие требованиям:
- состоятельности;
- несмещенности;
- эффективности.
Состоятельность оценки.
Пусть x1, x2,…,xn – результаты n наблюдений. Статистическая оценка θ*( x1, x2,…,xn) называется состоятельной, если она сходится по вероятности к оцениваемой теоретической характеристике θ при неограниченном увеличении числа наблюдений.
Несмещенность оценки.
Статистическая оценка называется несмещенной, если ее математическое ожидание равно оцениваемой характеристике независимо от числа наблюдений, т.е. при любом n:
M[θ*( x1, x2,…,xn)]=θ
Если это равенство выполняется при n→∞, то оценку называют асимптотически несмещенной.
Эффективность оценки.
Несмещенная статистическая оценка называется эффективной, если она имеет наименьшую возможную дисперсию.
Если объект, отобранный для наблюдения, не возвращается в генеральную совокупность, то выборка называется бесповторной (или безвозвратной). В противном случае выборку называют повторной (с возвратом).
Различие повторных и бесповторных выборок необходимо только для конечных генеральных совокупностей.
Методы статистического оценивания распределения случайной величины полностью применимы к оцениванию вероятностей случайных событий.
Результаты n независимых наблюдений над объектами одной генеральной совокупности можно рассматривать как значения n независимых одинаково распределенных случайных величин или как n независимых значений одной случайной величины.
Упорядоченные по величине результаты наблюдений называют вариационным рядом или рядом распределения.
Условия наблюдения могут быть такими, что независимо от воли наблюдателя определяется не точный результат, а интервал округления (разряд), в который этот результат попадает.
Выбор величины интервала округления может производиться и по желанию исследователя (наблюдателя) для облегчения обработки результатов наблюдения.
Всем значениям случайной величины, попавшей в i-ый интервал округления (разряд), приписывается значение xi, соответствующее середине интервала округления (разряда).
Число разрядов m выбирают обычно в пределах 10-15. При малом объеме выборки число интервалов округления (разрядов) приходится уменьшать до 5-6.
При выборе интервала округления (числа разрядов) и его границ следует учитывать следующие рекомендации:
Характерные особенности эмпирического распределения не должны исчезнуть из-за слишком малого числа разрядов и не должны быть искажены случайными колебаниями частот при слишком большом числе разрядов.
Разряды, по возможности, должны быть равны по длине, если колебания плотности распределения не очень велики.
Области сгущения результатов наблюдений (если они существуют) должны быть по возможности ближе к середине разрядов.
Возможно меньшее число наблюдений должно совпадать с границами разрядов.
