 
        
        - •Математическая статистика Введение в математическую статистику
- •Предмет математической статистики
- •Возникновение и развитие математической статистики
- •Приложения математической статистики
- •Общая статистическая модель
- •Параметрические и непараметрические задачи
- •Случайные величины и статистики
- •Достаточные статистики
- •Критерий факторизации.
- •Выборка и эмпирическая мера
- •Выбор статистической модели
- •Классическая статистическая модель.
- •Эмпирическая функция распределения
- •Выборочные характеристики
- •Свойства выборочных характеристик
- •Моделирование выборок на компьютере
- •Датчик случайных чисел
- •Моделирование дискретных распределений
- •Моделирование непрерывных распределений
- •Метод максимального правдоподобия
- •Байесовский подход
- •Допустимость байесовских оценок
- •Теорема об апостериорном риске
- •Вычисление байесовских оценок при квадратичной функции потерь
- •Минимаксный подход
- •Минимаксность байесовских решений
- •Проверка статистических гипотез
- •Основные понятия теории проверки статистических гипотез
- •Проверка двух простых гипотез
- •Байесовский подход
- •Наиболее мощный критерий. Лемма Неймана- Пирсона
- •Проверка непараметрических гипотез. Критерии согласия
- •Критерий знаков
- •Состоятельность критерия
- •Критерий Колмогорова
- •Критерий хи-квадрат
- •Асимптотические доверительные интервалы
- •Доверительные интервалы для параметров нормального распределения
Общая статистическая модель
Определение.
Назовем общей статистической моделью следующий математический объект

где 
 - измеримое пространство,
- измеримое пространство, 
 - некоторое семейство вероятностных
мер на
- некоторое семейство вероятностных
мер на 
 .
.
В случае, когда
семейство 
 состоит из одной вероятностной меры
состоит из одной вероятностной меры 
 ,
статистическая модель превращается в
вероятностное пространство
,
статистическая модель превращается в
вероятностное пространство 

Одной из основных
задач математической статистики является
задача разумного выбора  меры 
 из семейства
из семейства 
 на основании наблюдения значения
на основании наблюдения значения 
 ,
произошедшего в опыте, произведенном
в соответствии с моделью
,
произошедшего в опыте, произведенном
в соответствии с моделью  
 .
При этом результат опыта (наблюдение)
.
При этом результат опыта (наблюдение)
 известен, относительно вероятностной
меры
известен, относительно вероятностной
меры  
 известно лишь, что
известно лишь, что 

В данной модели 
 представляет собой  статистические
данные, семейство
представляет собой  статистические
данные, семейство 
 - априорные сведения.
- априорные сведения.
Пример.
Рассмотрим опыт, состоящий в бросании несимметричной монеты 1 раз.
Тогда 
 ,
,
 (единица интерпретируется как выпадение
монеты гербом вверх)
(единица интерпретируется как выпадение
монеты гербом вверх)
Обозначим 
 - вероятность выпадения монеты гербом
вверх,
 - вероятность выпадения монеты гербом
вверх,  
 -вероятность на
-вероятность на 
 ,
соответствующую вероятности выпадения
гербом вверх
,
соответствующую вероятности выпадения
гербом вверх 
 .
.
Предположим, что
семейство 
 состоит из двух вероятностных мер
состоит из двух вероятностных мер 
 и
и
 ,
тогда следующий способ выбора вероятностной
меры в  зависимости от значения
,
тогда следующий способ выбора вероятностной
меры в  зависимости от значения 
 будет разумным:
будет разумным:
Если 
 ,
то выбираем
,
то выбираем 

Если 
 ,
то выбираем
,
то выбираем 

Разумность данного способа выбора состоит в том, что при его применении мы никогда не ошибемся.
Предположим теперь,
что семейство 
 состоит из двух вероятностных мер
состоит из двух вероятностных мер 
 и
и
 ,
тогда следующий способ выбора вероятностной
меры в  зависимости от значения
,
тогда следующий способ выбора вероятностной
меры в  зависимости от значения 
 также будет разумным:
 также будет разумным:
Если 
 ,
то выбираем
,
то выбираем 

Если 
 ,
то выбираем
,
то выбираем 

Разумность данного способа выбора состоит в том, что правильное решение принимается с вероятностью 0,9 (вероятность ошибки 0,1) независимо от того, какая в вероятностная мера реализуется в эксперименте. Три оставшихся способа выбора
2)Если 
 ,
то выбираем
,
то выбираем 

    Если 
 ,
то выбираем
,
то выбираем 

3) Всегда выбираем

4) Всегда выбираем

имеют максимальную вероятность ошибки больше, либо равную 0,9
Если семейство 
 состоит из двух вероятностных мер
состоит из двух вероятностных мер 
 и
и
 ,
тогда  разумность способа выбора:
,
тогда  разумность способа выбора:
если 
 ,
то выбираем
,
то выбираем 

если 
 ,
то выбираем
,
то выбираем 

представляется
сомнительной, потому что вероятность
ошибки  не меньше 0,89. Более того, три
оставшихся способа выбора имеют еще
большие максимальные вероятности
ошибок. В этом случае содержательные
выводы о 
 по наблюдению
по наблюдению сделать невозможно, т.е. представленных
статистических данных для решения
задачи недостаточно.
сделать невозможно, т.е. представленных
статистических данных для решения
задачи недостаточно.
Данный пример показывает, что, даже в простейшем случае, абсолютно достоверные выводы на основании статистических данных сделать, вообще говоря, невозможно.
Математическая статистика предлагает критерии качества выводов, позволяющие выбрать разумный или даже оптимальный, в некотором строго определенном смысле, способ обработки и интерпретации данных, установить точность и достоверность выводов, определить объемы статистических данных, необходимые для решения задачи с заданной точностью и достоверностью
Параметрические и непараметрические задачи
В зависимости от
того, каким образом задано семейство
 ,
принято различать параметрические и,
как дополнение к ним,  непараметрические
модели статистики.
,
принято различать параметрические и,
как дополнение к ним,  непараметрические
модели статистики. 
Для того чтобы корректно определить параметрическую модель, введем следующее расстояние между вероятностными мерами.
Определение.
Величина  
 называется расстоянием по вариации
между вероятностными мерами
называется расстоянием по вариации
между вероятностными мерами 
 .
.
Определение.
Семейство вероятностных
мер 
 называется  (k -)
параметрическим, если существует взаимно
однозначное  соответствие между некоторым
подмножеством
называется  (k -)
параметрическим, если существует взаимно
однозначное  соответствие между некоторым
подмножеством 
 и семейством
и семейством 

| Покажите,
			что для параметрического семейства
			верно и обратное: из сходимости 
			 | 
 | 
Статистическая
модель называется параметрической,
если  семейство 
 параметрическое. В этом случае величину
параметрическое. В этом случае величину
 называют параметром, а
называют параметром, а 
 - параметрическим множеством.
- параметрическим множеством.
Если все меры
семейства 
 имеют плотность
имеют плотность 

относительно
некоторой меры 
 ,
то из теоремы Шеффе следует, что
достаточным условием параметричности
семейства
,
то из теоремы Шеффе следует, что
достаточным условием параметричности
семейства 
 является взаимно однозначность
соответствия
является взаимно однозначность
соответствия 
 и непрерывность функции
и непрерывность функции 
 по
по 
 для любого
для любого 
 .
.
| Это условие не является ограничительным и обычно выполняется во всех практически важных задачах | В
			продолжение всего курса, будем
			предполагать, что все меры семейства
						 | 
В частности, семейства распределений








и т.п. являются параметрическими.
В дальнейшем
математическое ожидание по мере 
 будем
обозначать
будем
обозначать 
 или, для параметрических семейств
или, для параметрических семейств 
 .
.

 следует сходимость
			следует сходимость .
. такое, что из сходимости
			такое, что из сходимости 
			 следует сходимость
			следует сходимость 
			 .
. имеют плотность относительно некоторой
			меры
			имеют плотность относительно некоторой
			меры 
			 ,
			которую будем  в общем случае обозначать
,
			которую будем  в общем случае обозначать
						 ,
			а в параметрическом
,
			а в параметрическом  
			