
- •.Основные понятия математической статистики. Статистический эксперимент. Виды задач математической статистики.
- •3)Некоторые распределения, использующиеся в мат.Статистике. Нормальное распределение, гамма распределение, хи – квадрат распределение.
- •5)Постановка задачи точечного оценивания параметра. Функция потерь. Риск.
- •6)Пусть х1,…,Хn –выборка из распеределения с начальными r моментами I порядка:
- •7)Регулярный эксперимент. Информация Фишера.Св-ва. Теорема о рег-ти прямого произв.Регулярн. Экспериментов
- •8) Выборка из нормального распределения. Представление Хи-квадрат распределения с помощью нормальных. Распределение Стьюдента. Распределение Фишера-Снедекора.
- •9)Постановка задачи доверительного оценивания. Простейший метод построения доверительных интервалов (без примеров).
7)Регулярный эксперимент. Информация Фишера.Св-ва. Теорема о рег-ти прямого произв.Регулярн. Экспериментов
Пусть x1..xn выборкаиз P(ро)={Pθ :θ€ΘcR}-сем-во однопарам, существ мера μ доминирующая сем-во P(ро) μ>>P(ро) с плотностями Pθ условие регулярности :
Эксперимент (сем-во) наз-ся реулярным если1) Pθ непрерывно дифф-мо по θ 2) В условиях сем-ва допускаются диффер-ное под знаком ∫ :
∂\∂θ∫Pθ(x~)μ(dx)=∫∂Pθ(x~)/∂θ*μ(dx)=0 3) Существ I(θ): I(θ)€(0..∞) ; I(θ)=∫[(Pθ’(x~))2/Pθ(x) ]*μ(dx)=∫(Pθ’(x)/Pθ(x))2*Pθ(x)
[pθ’(x)=pθ(x)/∂θ] ; μ(dx)=Eθ[(lnpθ(x~))’]2 ;pθ(x~)=L(x¬,θ)-ф-ция правдоп.
8) Выборка из нормального распределения. Представление Хи-квадрат распределения с помощью нормальных. Распределение Стьюдента. Распределение Фишера-Снедекора.
Пусть
выборка из N(0,
1).
Введем некоторые распределения , используемые в матстатистике.
Рассмотрим
случайную величину
.
Говорят что
имеет
-распределение(или
распределение Пирсона ) с n
степенями
свободы. Плотность распределения
величины
имеет вид
где
- гамма – функция Эйлера, определяемая
равенством
Семейство
-распределение
является подмножеством двухпараметрического
семейства гамма-распределений Г(b,p),
p,b
0,
с плотностями
При
b=1/2,
p=n/2,
n
N.
Известное свойство , что сумма двух
независимых гамма-распределений Г(b,p)
и Г(b,q)
снова имеет гамма-распределение Г(b,p+q)
, здесь следует непосредственно из
представления в виде суммы квадратов
незвис нормальных величин.
Пусть
сл. в. Y
независима от
.
Рассмотрим случайную вел-ну
Распределение
величины Tn
называется
распределением Стьюдента с n
степенями свободы. Соответствующая
плотность распределения имеет вид
Отметим , что плотность распределения Стьюдента симметрична относительно нуля.
Распределения
Фишера-Снедекора
F(n1,n2)
определяется как распределение сл. в.
независимы
и распределены как
и
. Плотность распределения Фишера-
Снедекора представляется в виде
9)Постановка задачи доверительного оценивания. Простейший метод построения доверительных интервалов (без примеров).
До сих пор мы говорили о точечном
оценивании параметров. Будем строить
множество: пусть
- статистический эксперимент. Доверительной
оценкой параметра
уровня значимости
(или 1ровня доверия
)
называется статистика Ĥ:
,
где С –некоторая совокупность подмножества
Ĥ,
;
мн-во, построенное по результатам
наблюдений, кот. с вероятностью
накрывает истинное значение параметра
Замечание: необходимо накладывать
какое-либо ограничение на множество С.
Пусть
(одномерный параметр), С – совокупность
интервалов
.
В этом случае доверительная оценка
-
доверительный интервал.
Альтернативное определение:
Доверительный интервал уровня значимости
наз-ся пара статистик T1,
T2 :
;
.
Основные методы построения ДИ. Пусть
удается найти функцию
а) Распределение
не зависит от параметра
б)
,тогда
-
интервал
в) Распределение
- известно, т.е. можно найти
10)Асимптотические доверительные интервалы. Построение асимптотических доверительных итервалов на базе асимптотически нормальной оценки параметра. Пример (распределение Бернулли, три подхода и связь между ними).
Определение: Послед-ть областей
-
ас.д.область уровня α для θ,
если
Если
-
ас.д.и.
Замечание:
если
- ас.д.и.ур.α
Способ построения:
Найти
,
т.ч.
а)
б)
Построение ас.д.и. на базе ас.норм.оценки
Пусть
δ – ас.норм.оценки, т.е.
т.е.
Пусть
Если
удастся выразить θ из
то находим д.и. в противном случае
Пусть δк(θ) – состоят. оценка для δ(θ)
(δ(θ)0) тогда
11)Постановка задачи проверки статистических гипотез. Понятие статистической гипотезы, вероятностей ошибок 1-го и 2-го рода, критерия, доверительной, критической области и области сомнений, мощности критерия. Выражение вероятностей ошибок в терминах критерия.
Статистическая гипотеза
Гипотеза – утверждение
Опред: Стат. гипотеза – утверждение о значении пар-ра θ.
Стат.
гипотеза м.б. записана в виде
Опред:
стат. гипотеза простая,
если
- одноточечное.
В прот. случае стат. гип. – сложная
Задача:
Выдвигается основная гип.
и альтернативная (несколько)
По результатам наблюдений надо выбрать Н0 или Н1
Правило выбора – критерий.
Опред:
Критерий
Значение
вероятность
отвергнуть осн. гипотезу по результатам
наблюдений
Согласно критерию область разбивается на 3 части:
Доверит.
|
Обл. сомнений
|
Критическая
область
|
Опред: Критерий - нерандомизированный, если (Х)={0,1}(или Рθ((Х) (0,1))=0 θ)
В противном случае - рандомизированный.
Классический подход Пирсона
В результате решения задачи ПСГ могут возникнуть следующие ситуации
|
Принять Н0 |
Принять Н1 |
Верна Н0 |
+ (верное реш.) |
ошибка 1 рода |
Верна Н1 |
ошибка 2 рода |
+ |
Ошибка 1 рода наиболее нежелательна. Вероятность ошибки 1 рода д.б. ограниченна некоторым числом α. α – уровень значимости критерия.
Рθ(ош.
1 рода)
α,
θΘ0
, Рθ(ош.
1 рода)=
Ошибка 2 рода:
Р(ош. 2 рода)=
-
мощность критерия
Задача: Найти
критерий ,
такой что
если эта задача имеет решение *, то *-равномерно наиболее мощный (РНМ) критерий
РНМ критерий не всегда существует.
12)Различные постановки задач проверки статистических гипотез. Задачи проверки согласия, однородности, независимости, случайности. Основной метод построения критериев значимости. Альтернативы и различимость.
При анализе различных типов данных возможны различные постановки задач.
Проверка согласия.
Тип данных:
а) однородные – выборка
б) неоднородные – со связями (регрессионная модель)
Гипотеза согласия:
Задача проверки гипотезы согласия в указанной модели – задача проверки согласия (обычно используется ранговый критерий)
Проверка однородности:
Тип данных :
Две
(несколько) выборок
~F,
~G
(
)
– независимы
Гипотеза однородности:
(т.е.
X1
и Y1
имеют
одинаковое распределение)
Проверка независимости:
Тип данных:
Выборка
из k-мерного
распределения с функцией распределения
F=F(x1…xn),
Fi
– распределение компонент.
Гипотеза независимости:
-
это задача проверки независимости.
Проверка случайности:
х1,…,хn – какие-то наблюдения (не обязательно независимые, но обязательно одинаово распределенные)
Гипотеза случайности:
Θ – множество всех распределений
Θ0 – множество распределений с независимыми и одинаово распределенными компонентами.
Альтернативы и различимость:
Например:
-
при альтернативе
Как можно их точно различить?
При
фиксированном количестве данных нельзя
(!) сказать, что H0
верна с какой-либо вероятностью (т.к.
близкие параметры не различимы). При
определенных условиях регулярности
граница различимости О(1/
)
,
n-
число данных
Если не рассматривать альтернативу, то критерии, решающие задачи без альтернативы, наз-ся критерий значимости.
Проверка значимости
Ответ: Н0 отвергается на уровне α либо Данные не противоречат Н0.
Методы построения критерия значимости
Пусть
- основная гипотеза.
Задача- построить критерий значимости уровня α.
Статистика
критерия
.
а)
- не зависит от параметра при
.
б)
распределение
не зависит от параметра при
(если (б) сохраняется и при
,
то такой критерий бессмысленен).
Распределение известно (напр. ф.р. - G(x)).
Тогда нерандомизованный критерий строиться:
Возможен асимптотический подход.
40. Проверка гипотез о параметрах нормального распределения.
На примере критерия Стьюдента.
1)Данные
- выборка из
.
-
неизв.
Задача параметрическая.
Гипотеза: а=а0 (сложная гипотеза, т.к. σ неизвестно).
Критерий Стьюдента:
Статистика
критерия
.
- не зависит от
мешающего параметра.
При
θ=
(Н0)
- не зависит от θ.
Распределение ~Sn-1
Распределение Стьюдента симметрично
Принимаем гипотезу, если она попала в интервал (<tα), иначе отвергаем.
2) 2 выборки. По двум выборкам обычно выбирается с одинаковыми дисперсиями. Надо построить статистику для проверки гипотезы однородности.
13)Задача проверки простой гипотезы при простой альтернативе. Лемма Неймана-Пирсона. Примеры наиболее мощных критериев.
Пусть Н0: θ=θ0 – простая гипотеза. Рассмотрим задачу проверки Н0 при альтернативе:
Н1: θ=θ1 - простая (т.е. Θ={θ0,θ1}). Замечание: Поскольку альт. – простая, то РАМ критерий, если называть Н.М. Пусть
μ – мера доминирующая
сем.
Например:
;
(μ – мера Лебега или считающая мера,
если возможно) Функция правдоподобия:
Введем статистику
отношения правдоподобия:
Замечание: 1) Не зависит от выбора доминирующей меры
2) Если
=0
или
=,
то выбор очевиден.
Лемма Неймана-Пирсона
В задаче проверки Н0: θ=θ0 при альтернативе Н1: θ=θ1, существует наиболее мощный критерий уровня значимости α, он строится следующим образом:
р[0,1)
Причем С выбирается следующим образом:
Замечание: 1) Если
>0,
то р выбирается однозначно и
2) Если =0 не важно значение р – критерий не рандомизированный.
Дополнение: Критерий
определяется однозначно на множестве
Если критерий есть функция от МДС, то он есть и единственный.
Доказательство: Перепишем критерий в виде:
Пусть имеется другой критерий, у которого тот же уровень значимости,
т.е.
=
=
|*С и вычтем из
В свою очередь мощность критерия:
Дополнение: Можно показать, что на S+ и S- Н. М. критерий определяется однозначно с
15)Критерий хи-квадрат для проверки простой гипотезы согласия.
Разбивается вся вещественная прямая на зоны.
Ø,
Ii
- интервал
Данные группируются (гистограмма)
ni – число наблюдений в i-й зоне
Ii – зона
Проверка:
H0 : F=F0 (простая гипотеза)
ni
можно назвать частотами, ni
– выборочные вероятности
.
При справедливости H0 рассмотрим теоретические вероятности
-
теоретические вероятности попадания
в зону.
Статистика критерия
Предельное распределение
X
Рассмотрим случайный вектор (n1…nr) имеет мультиномиальное распределение
Матрица
ковариации
Известно, что, если X~Nk(0,D)
XTD-1X~
Критерий (ас.)
43. Критерий хи-квадрат для проверки сложной параметрической гипотезы согласия.
,
,
Например: x1…xn~N(a,σ2)
H0 : a=a0
dimΘ0=1
Возможны
H0 :x1~N(a,σ2), a,σ2 – неизв.
dimΘ0=2
Поставим задачу проверки значимости
ni – частоты
pi(θ) – зависит от θ
-не
является статистикой даже при Н0
I. Мультиномиальное ОМП
ni~мульт.распр-е (p1(θ),…, pn(θ))
Мульт. функция правдоподобия
Если pi – дифф-мы
Решая это уравнение, получиться оценка (мультиномиальная) ОМП
! Нельзя использовать ОМП по не группированным данным.
Пусть
-
мультиномиальное ОМП
Выберем статистику
критерия
для сложной гипотезы
II.
Утверждение: пусть p(θ) – дважды дифф. по θ.
Матрица
имеет
ранг m
–полный ранг, тогда
~
и
16)Критерий согласия Колмагорова.
Пусть х1…хn – выборка из непрерывного распределения в ф.р. F – полностью неизв. F0 – фиксированная ф.р.
(простая гипотеза
согласия, но не параметрическая, т.к.
ф-я многомерная).
Критерий Колмогорова:
Статистика
критерия:
,
Fn(x)
– выборочная (эмпирическая) ф.р.
Асимптотический
критерий
,
,
К – ф.р. Колмогорова.
Для
вычисления Dn
достаточно вычислить
,
,
,
.
Вар.ряд X(1) X(2) |
F0(Xi) |
|| A |
|| B |
max(A,B) || C |
|
17)Постановка задач линейной регрессии. Метод наименьших квадратов. Геометрическая интерпретация. Оценка по методу наименьших квадратов. Примеры.
Линейная регрессия.
Модель:
Y1,…,Yn – независимые (некоррелированные) наблюдения
Пусть
предполагается, что справедлива следующая
модель
.
-
наблюдения (отклики), X’
– n*m
–матрица (известны, характеризуют
условия проверки эксперимента). Отклики
линейно зависят от условий через параметр
β. β – неизвестный параметр =
.
-ошибка
(шумы).
Основные предположения:
а)
б)
-
мешающий параметр – неизвестен.
В условиях (а), (б) EY=X’β.
Задача точечного оценивания – построить оценки параметра β при мешающем параметре .
Оценка
по методу наименьших квадратов (МНК)
,
где норма
Примеры:
1) Измерительный прибор
/некор. О.Р.С.В./
Прямая
на плоскости
.
-
хар-ка процесса.
В
матричной форме
- нормальные уравнения. Если rk(XXT)=m
(т.е. rkX=m),
то матрица будет обратимой
,
получаем
-оценка
по МНК.
Геометрическая интерпретация:
– i-я
строка матрицы X’,
то
.
.
-
столбец.
-расстояние
между элементами Y
и X’b.
Вывод: решение существует.
18)Функции параметра, допускающие несмещенную оценку (ДНО). Теорема Гаусса-Маркова.
Определение:
линейная функция параметра называется
ДНО - функцией, если существует такая
матрица А – матрица оценки, т.ч.
.
Лемма:
Сβ – ДНО
матрица S:
С=SX’
Док-во:
Сβ – ДНО
,
.
Ч.т.д.
Теорема
(Гаусса-Маркова):
Пусть
- ДНО – функция. Тогда
несмещенная
оценка
.
,
т.ч. С=AX’ (т.е. столбцы С – элементы Vm).
Данная оценка – оценка по МНК. Пусть
- другая лин. несм.оценка, тогда
(т.е.
- НРМД оценка в классе линейных оценок).