
- •Математическая статистика Введение в математическую статистику
- •Предмет математической статистики
- •Возникновение и развитие математической статистики
- •Приложения математической статистики
- •Общая статистическая модель
- •Параметрические и непараметрические задачи
- •Случайные величины и статистики
- •Достаточные статистики
- •Критерий факторизации.
- •Полная достаточная статистика
- •Выборка и эмпирическая мера
- •Выбор статистической модели
- •Классическая статистическая модель.
- •Эмпирическая функция распределения
- •Выборочные характеристики
- •Свойства выборочных характеристик
- •Моделирование выборок на компьютере
- •Датчик случайных чисел
- •Моделирование дискретных распределений
- •Моделирование непрерывных распределений
- •Теория оценивания
- •Определение оценки и критерии качества оценок
- •Общие методы построения оценок
- •Метод подстановки и метод моментов
- •Метод максимального правдоподобия
- •Улучшение оценок
- •Теорема Рао-Блэкуэлла-Колмогорова
- •Построение оптимальных оценок
- •Несмещенные оценки с минимальной дисперсией
- •Эффективные оценки
- •Состоятельность и асимптотическая нормальность оценок
- •Асимптотическая нормальность оценок, полученных методом подстановки
- •Состоятельность и асимптотическая нормальность оценок, полученных методом максимального правдоподобия
- •Теория статистических решений
- •Основные понятия теории статистических решений
- •Байесовский подход
- •Допустимость байесовских оценок
- •Проверка двух простых гипотез
- •Байесовский подход
- •Наиболее мощный критерий. Лемма Неймана- Пирсона
- •Проверка сложных гипотез
- •Равномерно наиболее мощный критерий.
- •Проверка непараметрических гипотез. Критерии согласия
- •Критерий знаков
- •Состоятельность критерия
- •Критерий Колмогорова
- •Критерий хи-квадрат
- •Построение доверительных множеств и интервалов Постановка задачи
- •Методы построения доверительных множеств и интервалов
- •Случайные величины, свободные от распределения
- •Асимптотические доверительные интервалы
- •Доверительные интервалы для параметров нормального распределения
- •Примеры решения статистических задач в общей статистической модели.
- •Линейная регрессионная модель
- •Оценка матрицы переходных вероятностей конечной цепи Маркова
- •Оценка параметра пуассоновского процесса
Несмещенные оценки с минимальной дисперсией
Определение.
Оценка одномерного
параметра
называется несмещенной оценкой с
минимальной дисперсией, если
Сокращенно такую оценку называют НОМД.
Теорема о единственности НОМД.
Если НОМД существует, то она единственна почти наверное.
Доказательство.
Пусть
и
- две НОМД, тогда
тоже несмещена и по неравенству Коши-Буняковского
ее дисперсия
Так как оценки исходные
оценки являются НОМД, то неравенство
на самом деле является равенством и
оценки
и
почти наверное линейно связаны (опять
неравенство Коши-Буняковского). Так как
они несмещены, то они совпадают почти
наверное.
Доказательство завершено.
Всегда ли существует НОМД?
Пусть
-семейство пуассоновских распределений
с параметром
,
и требуется оценить величину
.
Тогда, если бы несмещенная оценка
существовала, то она бы удовлетворяла
условию
что очевидно, невозможно,
так как справа стоит бесконечно
дифференцируемая, а слева разрывная в
нуле функция по
.
Построение НОМД с помощью полной достаточной статистики.
Если существует
несмещенная оценкапараметра
и полная достаточная статистика
,
то по теореме Рао-Блэкуэлла-Колмогорова
получаем, что оценка
является НОМД.
Пример.
Нетрудно показать,
что максимальное наблюдениеявляется полной достаточной статистикой
для параметра
в выборке из распределения
.
Действительно, если
то, очевидно,
почти всюду по мере Лебега.
Для проверки полноты достаточной статистики часто можно использовать следующую теорему.
Теорема о полноте для экспоненциального семейства распределений
Пусть плотность
распределения семейства
можно представить в следующем виде
где все функции измеримы и образ отображения
содержитs– мерный параллелепипед.
Тогда статистика
является полной достаточной статистикой
для семейства
Доказательство этой теоремы опускаем.
В частности из этой
теоремы следует, что среднее арифметическое
является НОМД математического ожидания
для нормального распределения
Эффективные оценки
В ряде случаев НОМД можно построить, исследуя отображение
,
с точки зрения его информативности, –
сколько информации о параметре содержит
наблюдение c распределением
?
Регулярные семейства распределений
Однопараметрическое
семейство распределений
назовем регулярным, если выполнены
условия
Плотность
дважды непрерывно дифференцируема по
Для любой несмещенной оценки
Свойства 2) и 3)
выполняются, например, если можно менять
местами интеграл по
и производную по
.
Действительно
Все ли семейства регулярны?
Семейство
нерегулярно – нарушено 2).
Теорема (Неравенство Рао-Крамера).
Пусть семейство
регулярно, тогда для любой несмещенной
оценки
выполнено неравенство
Доказательство.
Доказательство следует из неравенства Коши-Буняковского
Доказательство завершено.
Неравенство Рао-Крамера определяет нижнюю границу дисперсии для регулярных семейств
Определение.
Несмещенная оценка
называется эффективной, если
Если оценка эффективна, то она НОМД. Обратное, вообще говоря, неверно.
Неравенство
Коши-Буняковского превращается в
равенство только при наличии линейной
связи между функциями. Это позволяет
дать простой критерий эффективности
оценки: несмещенная оценка
эффективна тогда и только тогда, когда
Информация по Фишеру.
Величина
называется информацией по Фишеру,
содержащейся в наблюдении
относительно параметра
.
В классической статистической модели
(или более общо в любойвыборке)
информация по Фишеру (если она существует)
пропорциональна количеству наблюдений:
Величину
называют информацией по Фишеру,
содержащейся в одном наблюдении.
Заметим, что