
- •Математическая статистика Введение в математическую статистику
- •Предмет математической статистики
- •Возникновение и развитие математической статистики
- •Приложения математической статистики
- •Общая статистическая модель
- •Параметрические и непараметрические задачи
- •Случайные величины и статистики
- •Достаточные статистики
- •Критерий факторизации.
- •Выборка и эмпирическая мера
- •Выбор статистической модели
- •Классическая статистическая модель.
- •Эмпирическая функция распределения
- •Выборочные характеристики
- •Свойства выборочных характеристик
- •Моделирование выборок на компьютере
- •Датчик случайных чисел
- •Моделирование дискретных распределений
- •Моделирование непрерывных распределений
- •Метод максимального правдоподобия
- •Байесовский подход
- •Допустимость байесовских оценок
- •Теорема об апостериорном риске
- •Вычисление байесовских оценок при квадратичной функции потерь
- •Минимаксный подход
- •Минимаксность байесовских решений
- •Проверка статистических гипотез
- •Основные понятия теории проверки статистических гипотез
- •Проверка двух простых гипотез
- •Байесовский подход
- •Наиболее мощный критерий. Лемма Неймана- Пирсона
- •Проверка непараметрических гипотез. Критерии согласия
- •Критерий знаков
- •Состоятельность критерия
- •Критерий Колмогорова
- •Критерий хи-квадрат
- •Асимптотические доверительные интервалы
- •Доверительные интервалы для параметров нормального распределения
Общая статистическая модель
Определение.
Назовем общей статистической моделью следующий математический объект
где
- измеримое пространство,
- некоторое семейство вероятностных
мер на
.
В случае, когда
семейство
состоит из одной вероятностной меры
,
статистическая модель превращается в
вероятностное пространство
Одной из основных
задач математической статистики является
задача разумного выбора меры
из семейства
на основании наблюдения значения
,
произошедшего в опыте, произведенном
в соответствии с моделью
.
При этом результат опыта (наблюдение)
известен, относительно вероятностной
меры
известно лишь, что
В данной модели
представляет собой статистические
данные, семейство
- априорные сведения.
Пример.
Рассмотрим опыт, состоящий в бросании несимметричной монеты 1 раз.
Тогда
,
(единица интерпретируется как выпадение
монеты гербом вверх)
Обозначим
- вероятность выпадения монеты гербом
вверх,
-вероятность на
,
соответствующую вероятности выпадения
гербом вверх
.
Предположим, что
семейство
состоит из двух вероятностных мер
и
,
тогда следующий способ выбора вероятностной
меры в зависимости от значения
будет разумным:
Если
,
то выбираем
Если
,
то выбираем
Разумность данного способа выбора состоит в том, что при его применении мы никогда не ошибемся.
Предположим теперь,
что семейство
состоит из двух вероятностных мер
и
,
тогда следующий способ выбора вероятностной
меры в зависимости от значения
также будет разумным:
Если
,
то выбираем
Если
,
то выбираем
Разумность данного способа выбора состоит в том, что правильное решение принимается с вероятностью 0,9 (вероятность ошибки 0,1) независимо от того, какая в вероятностная мера реализуется в эксперименте. Три оставшихся способа выбора
2)Если
,
то выбираем
Если
,
то выбираем
3) Всегда выбираем
4) Всегда выбираем
имеют максимальную вероятность ошибки больше, либо равную 0,9
Если семейство
состоит из двух вероятностных мер
и
,
тогда разумность способа выбора:
если
,
то выбираем
если
,
то выбираем
представляется
сомнительной, потому что вероятность
ошибки не меньше 0,89. Более того, три
оставшихся способа выбора имеют еще
большие максимальные вероятности
ошибок. В этом случае содержательные
выводы о
по наблюдению
сделать невозможно, т.е. представленных
статистических данных для решения
задачи недостаточно.
Данный пример показывает, что, даже в простейшем случае, абсолютно достоверные выводы на основании статистических данных сделать, вообще говоря, невозможно.
Математическая статистика предлагает критерии качества выводов, позволяющие выбрать разумный или даже оптимальный, в некотором строго определенном смысле, способ обработки и интерпретации данных, установить точность и достоверность выводов, определить объемы статистических данных, необходимые для решения задачи с заданной точностью и достоверностью
Параметрические и непараметрические задачи
В зависимости от
того, каким образом задано семейство
,
принято различать параметрические и,
как дополнение к ним, непараметрические
модели статистики.
Для того чтобы корректно определить параметрическую модель, введем следующее расстояние между вероятностными мерами.
Определение.
Величина
называется расстоянием по вариации
между вероятностными мерами
.
Определение.
Семейство вероятностных
мер
называется (k -)
параметрическим, если существует взаимно
однозначное соответствие между некоторым
подмножеством
и семейством
Покажите,
что для параметрического семейства
верно и обратное: из сходимости
|
|
Статистическая
модель называется параметрической,
если семейство
параметрическое. В этом случае величину
называют параметром, а
- параметрическим множеством.
Если все меры
семейства
имеют плотность
относительно
некоторой меры
,
то из теоремы Шеффе следует, что
достаточным условием параметричности
семейства
является взаимно однозначность
соответствия
и непрерывность функции
по
для любого
.
Это условие не является ограничительным и обычно выполняется во всех практически важных задачах |
В
продолжение всего курса, будем
предполагать, что все меры семейства
|
В частности, семейства распределений
и т.п. являются параметрическими.
В дальнейшем
математическое ожидание по мере
будем
обозначать
или, для параметрических семейств
.