- •Введение в математическую статистику.
- •15) Лемма Неймана-Пирсона (рэндомизированный и нерэндомизированный вариант).
- •21) Проверка независимости признаков.
- •Пример:
- •24) Общая задача дисперсионного анализа.
- •25) Однофакторный, двуфакторный дисперсионный анализ. Однофакторный дисперсионный анализ
- •Двуфакторный дисперсионный анализ
- •26) Байесовская классификация.
- •27) Общая постановка задачи оценивания.
- •1) Минимаксный подход.
- •2) Байесовский подход
- •28) Достаточные статистики. Критерий факторизации. Достаточные статистики
- •Критерий факторизации
- •29) Условное матожидание, его своиства.
- •30) Теорема о ковариации.
- •31) Теорема Леммана Шафе. Алгоритм построения эффективных оценок.
- •Алгоритм нахождения эффективных оценок
- •32) Примеры вывода полноты.
- •33) Доверительный интервал и примеры. Доверительный интервал.
- •Примеры
- •34) Неравенство Рао-Крамера. Теорема Рао-Крамера
- •Пример 1.
- •Пример 2.
- •Пример 3.
30) Теорема о ковариации.
Пусть есть x,y
Cov(x,y)=E(cov(x,y/F)+ cov(E(x/F), E(y/F))
Доказательство:
Cov(x,y)=E(x-Ex)(y-Ey)=E((x-E(x/F))+(E(x/F)-Ex))(y-E(y/F))(E(y/F)-Ey)= E((x-E(x/F))(y-E(y/F))+E(E(x/F)-Ex)(E(y/F)-Ey)+E((x-E(x/F))(y-E(y/F))+E(E(x/F)-Ex)(E(y/F)-Ey)
Последние 2 слагаемых=0, т.к.
E(E((x-E(x/F))(E(y/F)-Ey)/F)=E((E/y)/F)-Ey)E((x-E(x/F)/F)=0
Если X и Y совпадают, то cov(x,y)=D(x)
Следствие:
DX=E(D(x/F))+D(E(x/F))
В частности: Dx>E(D(x/F)) и Dx>D(E(x/F))
31) Теорема Леммана Шафе. Алгоритм построения эффективных оценок.
Свойство полноты. Полные статистики.
X, p(x,) – плотность, T – статистика
если из Ef(T(x))=0 => f(x)=0
Будем рассматривать полные достаточные статистики (ПДС), получим ограничение сверху и снизу.
Пример вывода полноты.
Если существует экспоненциальное распределение, то при определенных условиях T=(T1,…,Tn) является полной статистикой.
Надо, чтобы в Tii(), i было k-мерным, (1()),…,k()) отображалось в Rk.
1) Схема Бернулли
Предположим, что m – число успехов, является достаточной статистикой.
возьмем m=0nf(m)Cnmpmqn-m=0 q(0,1), нужно доказать, что f(m)=0
m=0nf(m)CnmZm=0, Z=p/q, Z(0,)
получается полином с коэффициентами = 0, т.к. Cnm0, то f(m)=0
2) Распределение Пуассона
Существует объем выборки n=1, тогда
=0 уберем e получим =0, для>0 1/k!0 => f(k)=0
Равномерное распределение R(0,)
объем выборки n=1
получается => f(x)=0с вероятностью 1
Теорема Лемана Шеффе
X, p(x,), S=S(x) – несмещенная дляg(),T – ПДС, тогдаS*=E(S/T) – эффективная, несмещенная,c минимальной дисперсией, оценка.
Алгоритм нахождения эффективных оценок
Ищем T – ПДС
Ищем несмещенную оценку, являющуюся функцией от Т. Она и будет несмещенной оценкой.
Доказательство: Пусть существует несмещенная оценка S построим S*=E(S/T), тогда S* - оценка, т.к. T – достаточная, она несмещенная, т.к. ES*=ES (по свойствам условного мат.ожидания)
минимальная дисперсия
Пусть существует еще одна несмещенная оценка S1, построим S*=E(S1/T), но тогда по по теореме
Рао-Блекуэлла DS1>DS1*= DS* => дисперсия любой другой оценки будет больше DS*
Осталось доказать DS1*=DS*
т.к. S* и S1* совпадают с вероятностью 1, в силу полноты.
(S* - S1*) они измеримы относительно T (т.к. мат.ожидание), т.е. являются функциями от Т. Они обе не смещены, поэтому E(S*-S1*)=0, значит в силу полноты S*-S1*=0 с вероятностью 1
Пример:
Экспоненциальное семейство:
(x, S2) – ПДС
=(m,2) – если хотим оценить
f(m,2) – достаточно построить несмещенную оценку T.
Пусть x – выборка из распределения Бернулли.
xi={1, p; 0, q} i<n, =p
m – число успехов – ПДС
оценка для p – несмещенная
x=m/n – частота – функция от m и p. => x – это эффективная оценка.
Возьмем в качестве параметра функции g(p)=p2
S2=-несмещенная оценка 2
но в схеме Бернулли =pq=p(1-p)=p-p2, т.е., чтобы оценить s2 надо иметь несмещенную оценку p2, p2=m/n.
E(S2)=pp2
p-E(S2)=p2 если взять T=m/n-S2, то ET=p-p+p2=p2, т.е. это не смещенная оценка.
S2====
T=m/n-===
получается несмещенная оценка, для p2
можно было не пользоваться S2, а взять x2, т.к. (p=x) оценивают, тогда p2=x2
Если мы оцениваем pk, то несмещенной оценкой будет
Пример: Распределение Пуассона
Мы доказали, что x – ПДС
тогда если взять x, Ex=, то мы получим, x является эффективной оценкой, но для Распределения Пуассона ES2= будет ли S2 эффективной статистикой, т.к. она не является функцией отx. По теореме Лемана-Шефе, надо было бы взять E(S2/x)
Распределение Пуассона
g()=2 Найти эффективную оценку, если брать 2
x2 – неявляется эффективной т.к. она смещенная
Возьмем (x)2 посчитаем E(x)2.
Ex=D(x)+(Ex)2=Dx1/n+2=/n+2 – асимптотически несмещенная
E(x2-/n)= - неявляется статистикой, т.к. зависит от параметра
заменим: E(x2-x/n)= => T=x2-x/n
Пусть существует выборка из нормального закона
N(m,2), =(m,2) не известны m, 2
построим эффективную оценку для 2
S2==2
по теореме о совм. выборке x, x2 для нормального распределения
имеет 2n-1
Пусть Mn,r=
Mn,r – матожидание.
Если бы Mn,r известно, то можно было бы т.е.
В качестве статистики T, которая является эффективной надо брать
Осталось найти Mn,r ?
G((n-1)/2 ; ½) – плотность распределения
; заменим,тогда Надо подставить в оценку