
- •Математическая статистика Введение в математическую статистику
- •Предмет математической статистики
- •Возникновение и развитие математической статистики
- •Приложения математической статистики
- •Общая статистическая модель
- •Параметрические и непараметрические задачи
- •Случайные величины и статистики
- •Достаточные статистики
- •Критерий факторизации.
- •Полная достаточная статистика
- •Выборка и эмпирическая мера
- •Выбор статистической модели
- •Классическая статистическая модель.
- •Эмпирическая функция распределения
- •Выборочные характеристики
- •Свойства выборочных характеристик
- •Моделирование выборок на компьютере
- •Датчик случайных чисел
- •Моделирование дискретных распределений
- •Моделирование непрерывных распределений
- •Теория оценивания
- •Определение оценки и критерии качества оценок
- •Общие методы построения оценок
- •Метод подстановки и метод моментов
- •Метод максимального правдоподобия
- •Улучшение оценок
- •Теорема Рао-Блэкуэлла-Колмогорова
- •Построение оптимальных оценок
- •Несмещенные оценки с минимальной дисперсией
- •Эффективные оценки
- •Состоятельность и асимптотическая нормальность оценок
- •Асимптотическая нормальность оценок, полученных методом подстановки
- •Состоятельность и асимптотическая нормальность оценок, полученных методом максимального правдоподобия
- •Теория статистических решений
- •Основные понятия теории статистических решений
- •Байесовский подход
- •Допустимость байесовских оценок
- •Проверка двух простых гипотез
- •Байесовский подход
- •Наиболее мощный критерий. Лемма Неймана- Пирсона
- •Проверка сложных гипотез
- •Равномерно наиболее мощный критерий.
- •Проверка непараметрических гипотез. Критерии согласия
- •Критерий знаков
- •Состоятельность критерия
- •Критерий Колмогорова
- •Критерий хи-квадрат
- •Построение доверительных множеств и интервалов Постановка задачи
- •Методы построения доверительных множеств и интервалов
- •Случайные величины, свободные от распределения
- •Асимптотические доверительные интервалы
- •Доверительные интервалы для параметров нормального распределения
- •Примеры решения статистических задач в общей статистической модели.
- •Линейная регрессионная модель
- •Оценка матрицы переходных вероятностей конечной цепи Маркова
- •Оценка параметра пуассоновского процесса
Методы построения доверительных множеств и интервалов
Для построения доверительных множеств используются случайные величины, свободные от распределения
Случайные величины, свободные от распределения
Определение.
Случайная величина
называетсяслучайнойвеличиной
свободной от распределения, если ее
распределение одинаково для всех мер
из семейства
,
т.е.
Если
свободна от распределения, то выбрав
множество
такое, что
,
получим, что множество
является доверительным множеством.
Таким образом, задача построения доверительных множеств сводится к задаче поиска случайных величин, свободных от распределения.
Примеры
Пусть
. Тогда случайная величина
свободна от распределения и, следовательно,
свободна от распределения.
Пусть
. Тогда случайная величина
свободна от распределения и, следовательно,
свободна от распределения.
Если функция распределения
случайной величины
непрерывна, то случайная величина
свободна от распределения и, следовательно,
свободна от распределения
В тех случаях, когда случайной величины, свободной от распределения не существует или ее трудно вычислить, используют случайные величины асимптотически свободные от распределения.
Асимптотические доверительные интервалы
Пусть
- состоятельная и асимптотически
нормальная оценка, например, оценка
максимального прадоподобия или оценка,
построенная по методу подстановки, т.е.
где функция
и непрерывна. Тогда из свойств слабой
сходимости и сходимости по вероятности
следует, что
, т.е. случайная величина
асимптотически свободна от распределения
и используя ее можно строить асимптотические
доверительные интервалы.
Доверительные интервалы для параметров нормального распределения
Рассмотрим практически важный случай доверительного оценивания параметров нормального распределения. Для решения этой задачи необходимо построить случайные величины, свободные от распределения.
Пусть вектор данных
представляет собой выборку из распределения
. Тогда
свободна от распределения.
Пусть вектор данных
представляет собой выборку из распределения
. Тогда
свободна от распределения.
Пусть вектор данных
представляет собой выборку из распределения
. Тогда
свободна от распределения и случайная величина
свободна от распределения. Последняя случайная величина имеет так называемое распределение Стьюдента с
степенью свободы c плотностью
Примеры решения статистических задач в общей статистической модели.
В данном разделе рассмотрены некоторые задачи, статистические данные в которых не являются выборкой. Во всех этих задачах явный вид оценок необходимо найти самостоятельно.
Линейная регрессионная модель
Пусть вектор данных
имеет следующую структуру
где случайные величины
- независимы, одинаково распределены и
Требуется оценить по
данным
значение
.
Для решения этой задачи применим метод
максимального правдоподобия. Плотность
данных имеет вид
Максимизируя данное
выражение по
получим
т.е. оценка максимального правдоподобия совпадает с оценкой метода наименьших квадратов.
Оценка матрицы переходных вероятностей конечной цепи Маркова
Пусть вектор данныхпредставляет собой реализацию простой
конечной цепи Маркова с матрицей
переходных вероятностей
.
Требуется построить оценки для элементов
матрицы
по данным
.Для решения этой задачи применим метод
максимального правдоподобия. Плотность
данных имеет вид
где
-
количество переходов цепи Маркова из
состояния
в
состояние
за
шагов. Теперь
Оценка параметра пуассоновского процесса
Пусть
- наблюдение пуассоновского процесса
с параметром
на интервале
Требуется
построить оценку параметра
.
Для решения этой задачи найдем достаточную
статистику. Заметим, что если
- последовательные точки скачков
пуассоновского процесса на интервале
,
то условное распределение вектора
при условии
совпадает с распределением вариационного
ряда построенного по независимым
равномерно распределенным на интервале
случайным величинам, т.е. не зависит от
.
Так как пуассоновский процесс однозначно
определяется моментами своих скачков
получаем, что случайная величина
равная числу точек процесса на интервале
является достаточной статистикой.
Распределение этой величины пуассоновское
с параметром
.
Следовательно она полная достаточная
статистика и оценка
- НОМД.