
- •Математическая статистика Введение в математическую статистику
- •Предмет математической статистики
- •Возникновение и развитие математической статистики
- •Приложения математической статистики
- •Общая статистическая модель
- •Параметрические и непараметрические задачи
- •Случайные величины и статистики
- •Достаточные статистики
- •Критерий факторизации.
- •Полная достаточная статистика
- •Выборка и эмпирическая мера
- •Выбор статистической модели
- •Классическая статистическая модель.
- •Эмпирическая функция распределения
- •Выборочные характеристики
- •Свойства выборочных характеристик
- •Моделирование выборок на компьютере
- •Датчик случайных чисел
- •Моделирование дискретных распределений
- •Моделирование непрерывных распределений
- •Теория оценивания
- •Определение оценки и критерии качества оценок
- •Общие методы построения оценок
- •Метод подстановки и метод моментов
- •Метод максимального правдоподобия
- •Улучшение оценок
- •Теорема Рао-Блэкуэлла-Колмогорова
- •Построение оптимальных оценок
- •Несмещенные оценки с минимальной дисперсией
- •Эффективные оценки
- •Состоятельность и асимптотическая нормальность оценок
- •Асимптотическая нормальность оценок, полученных методом подстановки
- •Состоятельность и асимптотическая нормальность оценок, полученных методом максимального правдоподобия
- •Теория статистических решений
- •Основные понятия теории статистических решений
- •Байесовский подход
- •Допустимость байесовских оценок
- •Проверка двух простых гипотез
- •Байесовский подход
- •Наиболее мощный критерий. Лемма Неймана- Пирсона
- •Проверка сложных гипотез
- •Равномерно наиболее мощный критерий.
- •Проверка непараметрических гипотез. Критерии согласия
- •Критерий знаков
- •Состоятельность критерия
- •Критерий Колмогорова
- •Критерий хи-квадрат
- •Построение доверительных множеств и интервалов Постановка задачи
- •Методы построения доверительных множеств и интервалов
- •Случайные величины, свободные от распределения
- •Асимптотические доверительные интервалы
- •Доверительные интервалы для параметров нормального распределения
- •Примеры решения статистических задач в общей статистической модели.
- •Линейная регрессионная модель
- •Оценка матрицы переходных вероятностей конечной цепи Маркова
- •Оценка параметра пуассоновского процесса
Проверка непараметрических гипотез. Критерии согласия
Если семейство
или
не
является параметрическим, то соответствующая
гипотеза называется непараметрической.
Рассмотрим следующую
постановку задачи. Пусть вектор данных
представляет собой выборку из
распределения с функцией распределения
и
необходимо проверить гипотезу
против альтернативы
В этом случае основная гипотеза простая, альтернатива непараметрическая.
Данная задача является
задачей проверки согласия данных с
гипотезой
,
а соответствующие критерии называются
критериями согласия.
Общая идея построения
критериев согласия следующая. Эмпирическая
функция распределения
представляет собой хорошую оценку для
,
следовательно значительные отклонения
от
свидетельствуют о справедливости
гипотезы
.
Поэтому, если определить
расстояние между функциями распределения
и
-
,
то критическую область критерия согласия
разумно выбрать в виде
где константа
- выбирается из условия
В зависимости от выбора расстояния можно получить различные критерии согласия.
Критерий знаков
Положим
где
- некоторая фиксированная точка.
Для того, чтобы
рассчитать константу
необходимо вычислить распределение
расстояния
при гипотезе
.
Это легко можно сделать, если заметить,
что
Состоятельность критерия
Разумным требованием к критерию согласия является его состоятельность.
Определение.
Критерий
объема
называется состоятельным , если
,
для любой фиксированной простой
альтернативы из
Очевидно, что критерий
знаков не является состоятельным, потому
что распределение расстояния
одно и тоже для любой простой гипотезы
с
и, следовательно, для всех таких
альтернатив
Критерий Колмогорова
Рассмотрим расстояние
Это расстояние
называется расстояние Колмогорова.
Основанный на нем критерий называетсякритерием Колмогороваи используется,
если функция распределения- непрерывна.
Состоятельность критерия Колмогорова и возможность рассчитать (асимптотически) распределение расстояния обеспечивается теоремой Колмогорова.
Действительно, если,
то для того чтобы
обеспечить фиксированный объем
расстояние
должно при гипотезе
стремиться
к нулю по вероятности и, следовательно,
стремится к нулю величина
Далее, расстояние
к нулю не стремится
и критерий является состоятельным.
Замечательным свойством
критерия Колмогорова является
независимость распределения расстояния
от вида (непрерывной) функции распределения
.
Это следует из того, что
и
Критерий хи-квадрат
Для проверки согласия
данных с гипотезой
в общей выборочной модели
используется критерий хи-квадрат. Для
этого множество элементарных исходов
необходимо разбить на
непересекающихся частей
и вычислить следующие величины
Критическое множество критерия хи-квадрат выглядит так
Для расчета величины
при больших
используется следующая теорема (без
доказательства)
Теорема.
Напомним , что
распределение
называется
распределением хи-квадрат с
степенью свободы.
Точное распределение
расстоянияможно получить используя тот факт, что
распределение вектора
является полиномиальным рапсределением.
Построение доверительных множеств и интервалов Постановка задачи
В ряде случаев необходимо указать множество, которому с заданной вероятностью принадлежит оцениваемый параметр.
Определение.
Пусть
- параметрическое семейство. Случайное
множество
называетсядоверительным множествомсуровнем доверия
,
если
Если множествопредставляет собой интервал на
действительной прямой, то оно называетсядоверительный интервал.