Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1-11.doc
Скачиваний:
8
Добавлен:
27.04.2019
Размер:
912.9 Кб
Скачать

3.Виды задач математической статистики. Задачи точечного оценивания, доверительного оценивания, проверки статистических гипотез.

Задача математической статистики – сделать выводы о характере распределения генеральной совокупности по выборке. Роль генеральной совокупности в нашей модели играет теоретическое распределение.

Рθ - теоретическое значение распределения, соответствует распределению генеральной совокупности.

Типы задач математической статистики:

Точное оценивание – по результатам наблюдений выбрать значение Рθє Ρ , которое оптимальным образом согласуется с данными.

Интервальное оценивание - по результатам наблюдений выбрать область

Θ0 (Х1 … Хn) С Θ т.ч. при V θєΘ Рθ(Θ0 (Х1 … Хn) э θ)≥1-α , где α - определенное маленькое число. Т.е. выбор такого множества, которое накрывает теоретическое значение параметра с вероятностью не меньше (1-α).

Проверка статистических гипотез – по результатам наблюдений выбрать из

Н1… Нn наиболее подходящую, где Нi – взаимоисключающие гипотезы (предположения о значении параметров Нi: θєΘi ; Θi∩Θi=0 ; UΘi=Θ).

Постановка задачи точечного оценивания параметра. Пусть ( )- статистический эксперимент, результатом которого является набор наблюдений X1…Xn. Задача точечного оценивания заключается в том, чтобы используя результаты наблюдений, выбрать из множества параметров θ значение, наиболее подходящее в том или ином смысле.

Пусть в качестве оценки параметра θ (или функции от пар-ра g(θ)) выбрана оценка .

Постановка задачи доверительного оценивания.

До сих пор мы говорили о точечном оценивании параметров. Будем строить множество: пусть - статистический эксперимент. Доверительной оценкой параметра уровня значимости (или 1ровня доверия ) называется статистика Ĥ: , где С –некоторая совокупность подмножества Ĥ,

; мн-во, построенное по результатам наблюдений, кот. с вероятностью накрывает истинное значение параметра

Замечание: необходимо накладывать какое-либо ограничение на множество С. Пусть (одномерный параметр), С – совокупность интервалов

. В этом случае доверительная оценка - доверительный интервал.

Альтернативное определение: Доверительный интервал уровня значимости наз-ся пара статистик T1, T2 : ; .

Постановка задачи проверки статистических гипотез.

Гипотеза – утверждение

Опред: Стат. гипотеза – утверждение о значении пар-ра θ.

Стат. гипотеза м.б. записана в виде

Опред: стат. гипотеза простая, если - одноточечное.

В прот. случае стат. гип. – сложная

Задача: Выдвигается основная гип. и альтернативная (несколько)

По результатам наблюдений надо выбрать Н0 или Н1

Правило выбора – критерий.

Опред: Критерий

Значение вероятность отвергнуть осн. гипотезу по результатам наблюдений

Согласно критерию область разбивается на 3 части:

Доверит.

Обл. сомнений

Критическая область

Опред: Критерий  - нерандомизированный, если (Х)={0,1}(или Рθ((Х) (0,1))=0 θ)

В противном случае  - рандомизированный.

4. Выборочный метод. Эмпирическая функция распределения. Теорема Гливенко – Кантелли (план док-ва). Преобразование Смирнова. Теорема Колмогорова. Оценивание теоретической функции распределения эмпирической. Гистограмма и полигон частот.

Пусть (Х1 … Хn) выборка из распределения Рθ . Истинное значение Рθ - теоретическое распределение.

Эмпирическая функция распределения – функция следующего вида:

Fn(x) = 1/n* , где

Т.е. ее значение в точке х равно отношению числа наблюдений меньше х к общему числу наблюдений.

Теорема (Гливенко – Кантелли)

Пусть(Х1 … Хn) выборка из распределения с ф.р. F,тогда sup|Fn(x)-F(x)| почти наверное->0

План док-ва:

доказывается сходимость на ограниченном интервале (т.к. F неубывает и ограничена). Показывается, что изменение между двумя соседними точками мало. Доказывается, что сходимость на концах следует из :

-> sup|Fn(x)-F(x)|->0

Преобразование Смирнова

Пусть Х случайная величина с ф.р. F (непрерывна),тогда F(x)=Y-новая с.в. имеющая равномерное распределение U(0,1), т.е.:

Если F строго возрастает, то :

Теорема Колмогорова

Пусть (Х1 … Хn) выборка из распределения F(непрер.),тогда , где К – распр-е Колмогорова, т.е.:

, где

С ростом n, эмпирическая ф.р. приближается к теоретической. У э.ф.р. имеется -окрестность, по т. Гливенко – Кантелли вероятность того, что истинная ф.р. лежит в этой эмпирической -окрестности ->1 при .

По т. Колмогорова, вероятность того, что истинная ф.р. лежит в - окрестности эмпирической стремится к пределу K( ), где К(х) – ф.р. Колмогорова.

Пусть >0 – маленькое число, F – истинная ф.р., тогда если F0=F , где F0 предполагаемая ф.р., то с вероятностью

, т.е.

- доверительный интервал для теоретической ф.р.

Гистограмма и полигон частот:

Один из способов наглядного представления статистических данных – Гистограмма частот. Область значений с.в. разбивается на равные интервалы, подсчитывается число значений с.в. попавших в интервал и на каждом интервале строится прямоугольник, с основанием на этот интервал и высотой V/(nh), где V – число выборочных точек попавших в этот интервал, n – объем выборки, h – длина интервала. Площадь каждого такого прямоугольника по т Бернулли будет сходится при n-> к вероятности попадания с.в. в интервал.

Для оценки гладких плотностей используют методику, основанную на полигоне частот – ломаной кривой, строящейся следующим образом: если построена гистограмма частот, то ординаты ее средних точек на каждом из интервалов последовательно соединяются отрезками прямых. Гистограмма и полигон – статистические аналоги теоретической плотности.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]