- •1. Основные понятия математической статистики. Статистический эксперимент. Способы накопления статистической информации. Понятие выборки.
- •2. Примеры параметрических семейств распределений.
- •3.Виды задач математической статистики. Задачи точечного оценивания, доверительного оценивания, проверки статистических гипотез.
- •5.Постановка задачи точечного оценивания параметра. Риск оценки (квадратичный). Понятие состоятельности, несмещенности, асимптотической нормальности оценки.
- •6. Несмещенные оценки с равномерно-минимальной дисперсией. Минимаксный и байесовский подходы. Метод построения Байесовсих оценок.
- •7.Методы построения статистических оценок. Метод максимального правдоподобия и метод моментов. Примеры.
- •8. Регулярный эксперимент. Информация Фишера. Неравенство Рао-Крамера. Эффективные по Фишеру оценки.
- •9. Выборка из нормального распределения. Представление Хи-квадрат распределения с помощью нормальных. Распределение Стьюдента. Распределение Фишера-Снедекора. Лемма Фишера.
3.Виды задач математической статистики. Задачи точечного оценивания, доверительного оценивания, проверки статистических гипотез.
Задача математической статистики – сделать выводы о характере распределения генеральной совокупности по выборке. Роль генеральной совокупности в нашей модели играет теоретическое распределение.
Рθ - теоретическое значение распределения, соответствует распределению генеральной совокупности.
Типы задач математической статистики:
Точное оценивание – по результатам наблюдений выбрать значение Рθє Ρ , которое оптимальным образом согласуется с данными.
Интервальное оценивание - по результатам наблюдений выбрать область
Θ0 (Х1
… Хn)
С Θ т.ч. при V
θєΘ Рθ(Θ0
(Х1
… Хn)
э θ)≥1-α , где α - определенное маленькое
число. Т.е. выбор такого множества,
которое накрывает теоретическое
значение параметра с вероятностью не
меньше (1-α).
Проверка статистических гипотез – по результатам наблюдений выбрать из
Н1… Нn наиболее подходящую, где Нi – взаимоисключающие гипотезы (предположения о значении параметров Нi: θєΘi ; Θi∩Θi=0 ; UΘi=Θ).
Постановка задачи точечного оценивания параметра. Пусть ( )- статистический эксперимент, результатом которого является набор наблюдений X1…Xn. Задача точечного оценивания заключается в том, чтобы используя результаты наблюдений, выбрать из множества параметров θ значение, наиболее подходящее в том или ином смысле.
Пусть в качестве оценки параметра θ (или функции от пар-ра g(θ)) выбрана оценка .
Постановка задачи доверительного оценивания.
До сих пор мы говорили о точечном оценивании параметров. Будем строить множество: пусть - статистический эксперимент. Доверительной оценкой параметра уровня значимости (или 1ровня доверия ) называется статистика Ĥ: , где С –некоторая совокупность подмножества Ĥ,
; мн-во, построенное по результатам наблюдений, кот. с вероятностью накрывает истинное значение параметра
Замечание: необходимо накладывать какое-либо ограничение на множество С. Пусть (одномерный параметр), С – совокупность интервалов
. В этом случае доверительная оценка - доверительный интервал.
Альтернативное определение: Доверительный интервал уровня значимости наз-ся пара статистик T1, T2 : ; .
Постановка задачи проверки статистических гипотез.
Гипотеза – утверждение
Опред: Стат. гипотеза – утверждение о значении пар-ра θ.
Стат. гипотеза м.б. записана в виде
Опред: стат. гипотеза простая, если - одноточечное.
В прот. случае стат. гип. – сложная
Задача: Выдвигается основная гип. и альтернативная (несколько)
По результатам наблюдений надо выбрать Н0 или Н1
Правило выбора – критерий.
Опред: Критерий
Значение вероятность отвергнуть осн. гипотезу по результатам наблюдений
Согласно критерию область разбивается на 3 части:
Доверит. |
Обл. сомнений |
Критическая область |
Опред: Критерий - нерандомизированный, если (Х)={0,1}(или Рθ((Х) (0,1))=0 θ)
В противном случае - рандомизированный.
4. Выборочный метод. Эмпирическая функция распределения. Теорема Гливенко – Кантелли (план док-ва). Преобразование Смирнова. Теорема Колмогорова. Оценивание теоретической функции распределения эмпирической. Гистограмма и полигон частот.
Пусть (Х1 … Хn) выборка из распределения Рθ . Истинное значение Рθ - теоретическое распределение.
Эмпирическая функция распределения – функция следующего вида:
Fn(x) = 1/n* , где
Т.е. ее значение в точке х равно отношению числа наблюдений меньше х к общему числу наблюдений.
Теорема (Гливенко – Кантелли)
Пусть(Х1 … Хn) выборка из распределения с ф.р. F,тогда sup|Fn(x)-F(x)| почти наверное->0
План док-ва:
доказывается сходимость на ограниченном интервале (т.к. F неубывает и ограничена). Показывается, что изменение между двумя соседними точками мало. Доказывается, что сходимость на концах следует из :
-> sup|Fn(x)-F(x)|->0
Преобразование Смирнова
Пусть Х случайная величина с ф.р. F (непрерывна),тогда F(x)=Y-новая с.в. имеющая равномерное распределение U(0,1), т.е.:
Если F строго возрастает, то :
Теорема Колмогорова
Пусть (Х1 … Хn) выборка из распределения F(непрер.),тогда , где К – распр-е Колмогорова, т.е.:
, где
С ростом n, эмпирическая ф.р. приближается к теоретической. У э.ф.р. имеется -окрестность, по т. Гливенко – Кантелли вероятность того, что истинная ф.р. лежит в этой эмпирической -окрестности ->1 при .
По т. Колмогорова, вероятность того, что истинная ф.р. лежит в - окрестности эмпирической стремится к пределу K( ), где К(х) – ф.р. Колмогорова.
Пусть >0 – маленькое число, F – истинная ф.р., тогда если F0=F , где F0 предполагаемая ф.р., то с вероятностью
, т.е.
- доверительный интервал для теоретической ф.р.
Гистограмма и полигон частот:
Один из способов наглядного представления статистических данных – Гистограмма частот. Область значений с.в. разбивается на равные интервалы, подсчитывается число значений с.в. попавших в интервал и на каждом интервале строится прямоугольник, с основанием на этот интервал и высотой V/(nh), где V – число выборочных точек попавших в этот интервал, n – объем выборки, h – длина интервала. Площадь каждого такого прямоугольника по т Бернулли будет сходится при n-> к вероятности попадания с.в. в интервал.
Для оценки гладких плотностей используют методику, основанную на полигоне частот – ломаной кривой, строящейся следующим образом: если построена гистограмма частот, то ординаты ее средних точек на каждом из интервалов последовательно соединяются отрезками прямых. Гистограмма и полигон – статистические аналоги теоретической плотности.