- •Содержание дисциплины
- •Тема 1. Статистика как наука.
- •Тема 2. История правовой статистики.
- •Тема 3. Правовая статистика и её значение в обеспечении режима законности
- •1. Понятие предмет и объект правовой статистики
- •2. Отрасли правовой статистики и её место в системе юридических наук.
- •3. Научно-практическое значение материалов правовой статистики
- •Тема 4 Статистическое наблюдение.
- •Тема 5 Сводка и группировка материалов статистического наблюдения
- •1 Понятие и содержание статистической сводки
- •2. Техника и способы сводки
- •3.Разработка статистических показателей.
- •Статистическая группировка.
- •Виды группировок и основания их классификации
- •Тема 6 Приемы обработки показателей правовой статистики
- •Общая характеристика метода выборочного наблюдения
- •Оценка точности и достоверности результатов выборочного наблюдения
- •Статистические оценки числовых характеристик случайных величин
- •Генеральная средняя
- •Выборочная средняя
- •Оценка генеральной средней по выборочной средней. Устойчивость выборочных средних
- •Групповая и общая средние
- •Генеральная дисперсия
- •Выборочная дисперсия
- •Формула для вычисления дисперсии
- •Групповая, внутригрупповая, межгрупповая и общая дисперсия
- •2 Анализ рядов динамики
- •3 Анализ сезонных колебаний
- •4 Методы выравнивания рядов динамики
- •Тема 7 Статистический анализ оценки параметров распределения.
- •Тема 7.1. Понятие о статистическом анализе и его основные задачи
- •2. Статистические возможности анализа преступности
- •3. Статическое изучение деятельности правоохранительных органов
- •Тема 7.2. Методы статистического анализа в задачах моделирования и прогнозирования социально-правовых процессов
- •1. Этапы исследования с использованием статистических методов
- •2. Корреляционный анализ
- •4. Факторный анализ
- •5. Кластерный анализ
- •6. Анализ динамики и прогнозирование социально-правовых процессов
- •Тема 7.4. «Статистические гипотезы.»
- •1.Статистические гипотезы.
- •2.Критерии проверки статистических гипотез.
- •3.Ошибки первого и второго рода при проверке статистических гипотез.
- •О смысле ошибок первого и второго рода
- •Вероятности ошибок (уровень значимости и мощность)
- •Примеры использования Компьютеры
- •Компьютерная безопасность
- •Фильтрация спама
- •Вредоносное программное обеспечение
- •Поиск в компьютерных базах данных
- •Оптическое распознавание текстов (ocr)
- •Досмотр пассажиров и багажа
- •Биометрия
- •4.Проверка гипотезы.
3.Ошибки первого и второго рода при проверке статистических гипотез.
Выделяют три вида критических областей:
Двусторонняя критическая область определяется двумя интервалами
,
где
находят
из условий
.Левосторонняя критическая область определяется интервалом
,
где xα находят
из условия P(φ
< xα)
= α.Правосторонняя критическая область определяется интервалом
,
где x1
− α находят
из условия P(φ
< x1
− α) = 1 −
α.
Ошибки первого рода (англ. type I errors, α errors, false positives) и ошибки второго рода (англ. type II errors, β errors, false negatives) в математической статистике — это ключевые понятия задач проверки статистических гипотез. Тем не менее, данные понятия часто используются и в других областях, когда речь идёт о принятии «бинарного» решения (да/нет) на основе некоего критерия (теста, проверки, измерения), который с некоторой вероятностью может давать ложный результат.
Пусть
дана выборка
из
неизвестного совместного распределения
,
и поставлена бинарная задача проверки
статистических гипотез:
где H0 — нулевая гипотеза, а H1 — альтернативная гипотеза. Предположим, что задан статистический критерий
,
сопоставляющий
каждой реализации выборки
одну
из имеющихся гипотез. Тогда возможны
следующие четыре ситуации:
Распределение выборки соответствует гипотезе H0, и она точно определена статистическим критерием, то есть
.Распределение выборки соответствует гипотезе H0, но она неверно отвергнута статистическим критерием, то есть
.Распределение выборки соответствует гипотезе H1, и она точно определена статистическим критерием, то есть .
Распределение выборки соответствует гипотезе H1, но она неверно отвергнута статистическим критерием, то есть .
Во втором и четвертом случае говорят, что произошла статистическая ошибка, и её называют ошибкой первого и второго рода соответственно.
|
Верная гипотеза |
||
H0 |
H1 |
||
Результат применения критерия |
H0 |
H0 верно принята |
H0 неверно принята (Ошибка второго рода) |
H1 |
H0 неверно отвергнута (Ошибка первого рода) |
H0 верно отвергнута |
|
О смысле ошибок первого и второго рода
Как видно из вышеприведённого определения, ошибки первого и второго рода являются взаимно-симметричными, то есть если поменять местами гипотезы H0 и H1, тоошибки первого рода превратятся в ошибки второго рода и наоборот. Тем не менее, в большинстве практических ситуаций путаницы не происходит, поскольку принято считать, что нулевая гипотеза H0 соответствует состоянию «по умолчанию» (естественному, наиболее ожидаемому положению вещей) — например, что обследумый человек здоров, или что проходящий через рамку металлодетектора пассажир не имеет запрещённых металлических предметов. Соответственно, альтернативная гипотеза H1обозначает противоположную ситуацию, которая обычно трактуется как менее вероятная, неординарная, требующая какой-либо реакции.
С учётом этого ошибку первого рода часто называют ложной тревогой, ложным срабатыванием или ложноположительным срабатыванием — например, анализ крови показал наличие заболевания, хотя на самом деле человек здоров, или металлодетектор выдал сигнал тревоги, сработав на металлическую пряжку ремня. Из-за возможности ложных срабатываний не удаётся полностью автоматизировать борьбу со многими видами угроз. Как правило, вероятность ложного срабатывания коррелирует с вероятностью пропуска события (ошибки второго рода). То есть, чем более чувствительна система, тем больше опасных событий она детектирует и, следовательно, предотвращает. Но при повышении чувствительности неизбежно вырастает и вероятность ложных срабатываний. Поэтому чересчур чувствительно (параноидально) настроенная система защиты может выродиться в свою противоположность и привести к тому, что побочный вред от неё будет превышать пользу.
Соответственно, ошибку второго рода иногда называют пропуском события или ложноотрицательным срабатыванием — человек болен, но анализ крови этого не показал, или у пассажира имеется холодное оружие, но рамка металлодетектора его не обнаружила (например, из-за того, что чувствительность рамки отрегулирована на обнаружение только очень массивных металлических предметов).
Степень чувствительности системы защиты должна представлять собой компромисс между вероятностью ошибок первого и второго рода. Где именно находится точка баланса, зависит от оценки рисков обоих видов ошибок.
