- •Математическая статистика Введение в математическую статистику
- •Предмет математической статистики
- •Возникновение и развитие математической статистики
- •Приложения математической статистики
- •Общая статистическая модель
- •Параметрические и непараметрические задачи
- •Случайные величины и статистики
- •Достаточные статистики
- •Критерий факторизации.
- •Выборка и эмпирическая мера
- •Выбор статистической модели
- •Классическая статистическая модель.
- •Эмпирическая функция распределения
- •Выборочные характеристики
- •Свойства выборочных характеристик
- •Моделирование выборок на компьютере
- •Датчик случайных чисел
- •Моделирование дискретных распределений
- •Моделирование непрерывных распределений
- •Метод максимального правдоподобия
- •Байесовский подход
- •Допустимость байесовских оценок
- •Теорема об апостериорном риске
- •Вычисление байесовских оценок при квадратичной функции потерь
- •Минимаксный подход
- •Минимаксность байесовских решений
- •Проверка статистических гипотез
- •Основные понятия теории проверки статистических гипотез
- •Проверка двух простых гипотез
- •Байесовский подход
- •Наиболее мощный критерий. Лемма Неймана- Пирсона
- •Проверка непараметрических гипотез. Критерии согласия
- •Критерий знаков
- •Состоятельность критерия
- •Критерий Колмогорова
- •Критерий хи-квадрат
- •Асимптотические доверительные интервалы
- •Доверительные интервалы для параметров нормального распределения
Проверка двух простых гипотез
Если обе гипотезы
простые, т.е.
и
,
содержат по одной вероятностной мере,
соответственно,
и
,
то естественной функцией потерь является
следующая
![]()
т.е. потери равны нулю, если ошибки нет, и равны единице, если ошибка есть.
Ошибка
,
![]()
традиционно называется ошибка первого рода
Ошибка
,
![]()
называется ошибка второго рода
Функция риска
принимает для каждого критерия
два
значения
и
![]()
которые называются
вероятностями ошибки первого и второго
рода, соответственно. Величину
называют также объемом
или уровнем
значимости
критерия
,
величину
- мощностью
критерия
.
Наиболее просто получить решение задачи
различения двух простых гипотез в
байесовской постановке.
Байесовский подход
Пусть гипотезы
и
простые и имеют априорные вероятности
и
соответственно. Тогда байесовский риск
решения
![]()

Выбор
![]()
очевидно, минимизирует байесовский риск. Таким образом, решающее правило байесовского критерия имеет вид

Наиболее мощный критерий. Лемма Неймана- Пирсона
Любое множество
такое, что
определяет некоторый стастистический
критерий, имеющий вероятность ошибки
1-ого рода
.
Критерий
,
имеющий наименьшую вероятность ошибки
второго рода среди всех таких критериев,
называется наиболее мощным критерием
( у него наибольшая мощность
)
Определение.
Критерий
называется
наиболее мощным критерием объема
,
если
![]()
Следующая теорема содержит достаточные условия существования наиболее мощного критерия.
Теорема (Лемма Неймана-Пирсона)
Пусть для некоторого
существует
такое , что

Тогда критерий с критической областью

является наиболее
мощным критерием объема
![]()
Пример.
Пусть вектор данных
представляет собой
выборку из распределения
.
Рассмотрим две
простые гипотезы относительно
действительного параметра
![]()
![]()
![]()
Положим для
определенности, что
![]()
![]()
Тогда наиболее мощный критерий будет иметь критическую область

где
определяется из уравнения
![]()
Заметим, что
критическое множество в данном примере
одно и то же для всех альтернатив вида![]()
где
.
Проверка непараметрических гипотез. Критерии согласия
Если семейство
или
не
является параметрическим, то соответствующая
гипотеза называется непараметрической.
Рассмотрим следующую
постановку задачи. Пусть
вектор данных
представляет собой
выборку из распределения с функцией
распределения
и
необходимо проверить гипотезу
![]()
против альтернативы
![]()
В этом случае основная гипотеза простая, альтернатива непараметрическая.
Данная задача
является задачей проверки согласия
данных с гипотезой
,
а соответствующие критерии называются
критериями согласия.
Общая идея построения
критериев согласия следующая. Эмпирическая
функция распределения
представляет собой хорошую оценку для
,
следовательно значительные отклонения
от
свидетельствуют о справедливости
гипотезы
.
Поэтому, если
определить расстояние между функциями
распределения
и
-
,
то критическую область критерия согласия
разумно выбрать в виде
![]()
где константа
- выбирается из условия
![]()
В зависимости от выбора расстояния можно получить различные критерии согласия.
Критерий знаков
Положим
![]()
где
- некоторая фиксированная точка.
Для того, чтобы
рассчитать константу
необходимо вычислить распределение
расстояния
при гипотезе
.
Это легко можно сделать, если заметить,
что
![]()
