- •Введение в математическую статистику.
- •15) Лемма Неймана-Пирсона (рэндомизированный и нерэндомизированный вариант).
- •21) Проверка независимости признаков.
- •Пример:
- •24) Общая задача дисперсионного анализа.
- •25) Однофакторный, двуфакторный дисперсионный анализ. Однофакторный дисперсионный анализ
- •Двуфакторный дисперсионный анализ
- •26) Байесовская классификация.
- •27) Общая постановка задачи оценивания.
- •1) Минимаксный подход.
- •2) Байесовский подход
- •28) Достаточные статистики. Критерий факторизации. Достаточные статистики
- •Критерий факторизации
- •29) Условное матожидание, его своиства.
- •30) Теорема о ковариации.
- •31) Теорема Леммана Шафе. Алгоритм построения эффективных оценок.
- •Алгоритм нахождения эффективных оценок
- •32) Примеры вывода полноты.
- •33) Доверительный интервал и примеры. Доверительный интервал.
- •Примеры
- •34) Неравенство Рао-Крамера. Теорема Рао-Крамера
- •Пример 1.
- •Пример 2.
- •Пример 3.
32) Примеры вывода полноты.
Свойство полноты. Полные статистики.
X, p(x,) – плотность, T – статистика
если из Ef(T(x))=0 => f(x)=0
Будем рассматривать полные достаточные статистики (ПДС), получим ограничение сверху и снизу.
Пример вывода полноты.
Если существует экспоненциальное распределение, то при определенных условиях T=(T1,…,Tn) является полной статистикой.
Надо, чтобы в Tii(), i было k-мерным, (1()),…,k()) отображалось в Rk.
1) Схема Бернулли
Предположим, что m – число успехов, является достаточной статистикой.
возьмем m=0nf(m)Cnmpmqn-m=0 q(0,1), нужно доказать, что f(m)=0
m=0nf(m)CnmZm=0, Z=p/q, Z(0,)
получается полином с коэффициентами = 0, т.к. Cnm0, то f(m)=0
2) Распределение Пуассона
Существует объем выборки n=1, тогда
=0 уберем e получим
=0, для >0 1/k!0 => f(k)=0
Равномерное распределение R(0,)
объем выборки n=1
получается => f(x)=0с вероятностью 1
33) Доверительный интервал и примеры. Доверительный интервал.
Существует выборка x1 x2 … xn с плотностью распределения P(x,) надо построить интервал с произвольными концами P(())=1- надо выбрать интервал покороче.
Например
Хотим построить доверительный интервал дл m
2 неизвестно
x – оценка для m
отцентрируем (x – m), тогда дисперсия будет /m
(отнормировали)
распределение Т мы знаем
=> =>
Примеры
2 неизвестно
;
надо для t построить интервал
Если симметричен, то легко ограничить и получить маленький интервал
Можно брать по-разному, но сумма площадей хвостов= (т.е. 1/3 и 2/3)
Пусть /2
;
= >
доверительный интервал:
Рассмотрим схему Бернулли
выборка хотим построить доверительный интервал для Р
воспользуемся законом больших чисел:
можно взять
=>
доверительный интервал:
Асимптотический доверительный интервал
Пусть n=2k+1
упорядочили
x(k+1) – выборочная медиана
Выборочная медиана:
m
m совпадает с матожиданием
Какая оценка лучше?
x – лучшая оценка (x(k+1) - хуже)
Выборочная медиана при нарушении основных предположений меняется мало, а x – сильно.
Пример
Пусть - плотность распределения Коши.
Характеристическая функция у x совпадает с характеристической функцией одного наблюдения (для Коши), т.е. информация о параметре в x такая же, как в одном наблюдении, т.е. x – несостоятельна. Ее нельзя применять, а - дает хорошую оценку.
Распределение Коши похоже на нормальное.
Сколько мы теряем, если распределение нормальное?
Построим доверительные интервалы. Какой короче?
1) По x :
2) По :
, если x=, то
т.е. интервал для в больше, чем дляx. Это асимптотически больше для n.
34) Неравенство Рао-Крамера. Теорема Рао-Крамера
Пусть существует X=(X1,...,Xn), g(), p(x,)
ET=g(), для всех R.
DT>-неравенство Крамера
Граница может достигаться а может и не достигаться
Всегда имеем дело с оценкой, насколько она хороша – она не может быть лучше дисперсии. Если она мало отличается от дисперсии, то оценка хорошая.
I()=,тогда неравенство Рао-Крамера выполняется, но оно выполняется не всегда, а при определенных условиях
Пример:
Условие регулярности
I() корректно определению, т.е. существует производная и такое мат.ожидание I() конечно
Можно переходить к пределу под знаком
=-возможность дифференцирования под знаком интеграла, достаточно потребовать h(x) –рвномерно по всем
h(x) – интегрируема в Rn
если 1), 2) выполняются, то выполняется неравенство Рао-Крамера.
I(информационное количество Фишера
Доказательство:
Т.к. T – несмещенная оценка для g(), то ET=g(), а E+T=g(), значит g()-g()=E+T-ET=T(x)p(x,)d-T(x)p(x,)d=T(x)(p(x,)-p(x,))d(T(x)-ET(x))(p(x,)-p(x,))d= =применим неравенство Коши-Буняковского в терминах мат.ожидания
|Exy|<(Ex2Ey2) равенство <=> когда x,y пропорциональны с вероятностью 1, т.е. существует константа : x=y
<
Это верно при малых . Условие регулярности позволяет перейти к пределу 0
Случай равенства:
T(x)-ET(x)=()
- это экспоненциальное семейство первого порядка
т.е. равенства достигаются, если p(x,) – экспоненциальное семейство, тогда T – ПДС
DT>(g’())2/I()
I()=, p(x,)=
ln p(x,)=
=
=(*)
==0
достаточно, чтобы p(x,) мажорировалась непрерывной функцией. => (*)=0
тогда I()=nI1()
I() – информация о всей выборке
I1() – информация о первом наблюдении
DT>(g’())2/nI1() при условии регулярности дисперсия убывает не быстрее чем 1/n
Замечание:
Существует случай, когда дисперсия убывает быстрее чем 1/n