- •Содержание дисциплины
- •Тема 1. Статистика как наука.
- •Тема 2. История правовой статистики.
- •Тема 3. Правовая статистика и её значение в обеспечении режима законности
- •1. Понятие предмет и объект правовой статистики
- •2. Отрасли правовой статистики и её место в системе юридических наук.
- •3. Научно-практическое значение материалов правовой статистики
- •Тема 4 Статистическое наблюдение.
- •Тема 5 Сводка и группировка материалов статистического наблюдения
- •1 Понятие и содержание статистической сводки
- •2. Техника и способы сводки
- •3.Разработка статистических показателей.
- •Статистическая группировка.
- •Виды группировок и основания их классификации
- •Тема 6 Приемы обработки показателей правовой статистики
- •Общая характеристика метода выборочного наблюдения
- •Оценка точности и достоверности результатов выборочного наблюдения
- •Статистические оценки числовых характеристик случайных величин
- •Генеральная средняя
- •Выборочная средняя
- •Оценка генеральной средней по выборочной средней. Устойчивость выборочных средних
- •Групповая и общая средние
- •Генеральная дисперсия
- •Выборочная дисперсия
- •Формула для вычисления дисперсии
- •Групповая, внутригрупповая, межгрупповая и общая дисперсия
- •2 Анализ рядов динамики
- •3 Анализ сезонных колебаний
- •4 Методы выравнивания рядов динамики
- •Тема 7 Статистический анализ оценки параметров распределения.
- •Тема 7.1. Понятие о статистическом анализе и его основные задачи
- •2. Статистические возможности анализа преступности
- •3. Статическое изучение деятельности правоохранительных органов
- •Тема 7.2. Методы статистического анализа в задачах моделирования и прогнозирования социально-правовых процессов
- •1. Этапы исследования с использованием статистических методов
- •2. Корреляционный анализ
- •4. Факторный анализ
- •5. Кластерный анализ
- •6. Анализ динамики и прогнозирование социально-правовых процессов
- •Тема 7.4. «Статистические гипотезы.»
- •1.Статистические гипотезы.
- •2.Критерии проверки статистических гипотез.
- •3.Ошибки первого и второго рода при проверке статистических гипотез.
- •О смысле ошибок первого и второго рода
- •Вероятности ошибок (уровень значимости и мощность)
- •Примеры использования Компьютеры
- •Компьютерная безопасность
- •Фильтрация спама
- •Вредоносное программное обеспечение
- •Поиск в компьютерных базах данных
- •Оптическое распознавание текстов (ocr)
- •Досмотр пассажиров и багажа
- •Биометрия
- •4.Проверка гипотезы.
Вероятности ошибок (уровень значимости и мощность)
Вероятность ошибки первого рода при проверке статистических гипотез называют уровнем значимости и обычно обозначают греческой буквой α (отсюда название α-errors).
Вероятность ошибки второго рода не имеет какого-то особого общепринятого названия, на письме обозначается греческой буквой β (отсюда β-errors). Однако с этой величиной тесно связана другая, имеющая большое статистическое значение — мощность критерия. Она вычисляется по формуле (1 − β). Таким образом, чем выше мощность, тем меньше вероятность совершить ошибку второго рода.
Обе эти характеристики обычно вычисляются с помощью так называемой функции мощности критерия. В частности, вероятность ошибки первого рода есть функция мощности, вычисленная при нулевой гипотезе. Для критериев, основанных на выборке фиксированного объема, вероятность ошибки второго рода есть единица минус функция мощности, вычисленная в предположении, что распределение наблюдений соответствует альтернативной гипотезе. Для последовательных критериев это также верно, если критерий останавливается с вероятностью единица (при данном распределении из альтернативы).
В статистических тестах обычно приходится идти на компромисс между приемлемым уровнем ошибок первого и второго рода. Зачастую для принятия решения используется пороговое значение, которое может варьироваться с целью сделать тест более строгим или, наоборот, более мягким. Этим пороговым значением является уровень значимости, которым задаются при проверке статистических гипотез. Например, в случае металлодетектора повышение чувствительности прибора приведёт к увеличению риска ошибки первого рода (ложная тревога), а понижение чувствительности — к увеличению риска ошибки второго рода (пропуск запрещённого предмета).
Примеры использования Компьютеры
Понятия ошибок первого и второго рода широко используются в области компьютеров и программного обеспечения.
Компьютерная безопасность
Наличие уязвимостей в вычислительных системах приводит к тому, что приходится, с одной стороны, решать задачу сохранения целостности компьютерных данных, а с другой стороны — обеспечивать нормальный доступ легальных пользователей к этим данным. Moulton (1983, с.125) отмечает, что в данном контексте возможны следующие нежелательные ситуации:
когда авторизованные пользователи классифицируются как нарушители (ошибки первого рода)
когда нарушители классифицируются как авторизованные пользователи (ошибки второго рода)
Фильтрация спама
Ошибка первого рода происходит, когда механизм блокировки/фильтрации спама ошибочно классифицирует легитимное email-сообщение как спам и препятствует его нормальной доставке. В то время как большинство «анти-спам» алгоритмов способны блокировать/фильтровать большой процент нежелательных email-сообщений, гораздо более важной задачей является минимизировать число «ложных тревог» (ошибочных блокировок нужных сообщений).
Ошибка второго рода происходит, когда анти-спам система ошибочно пропускает нежелательное сообщение, классифицируя его как «не спам». Низкий уровень таких ошибок является индикатором эффективности анти-спам алгоритма.
Пока не удалось создать антиспамовую систему без корреляции между вероятностью ошибок первого и второго рода. Вероятность пропустить спам у современных систем колеблется в пределах от 1 % до 30 %. Вероятность ошибочно отвергнуть валидное сообщение — от 0,001 % до 3 %. Выбор системы и её настроек зависит от условий конкретного получателя: для одних получателей риск потерять 1 % хорошей почты оценивается как незначительный, для других же потеря даже 0,1 % является недопустимой.
