
- •Введение в математическую статистику.
- •15) Лемма Неймана-Пирсона (рэндомизированный и нерэндомизированный вариант).
- •21) Проверка независимости признаков.
- •Пример:
- •24) Общая задача дисперсионного анализа.
- •25) Однофакторный, двуфакторный дисперсионный анализ. Однофакторный дисперсионный анализ
- •Двуфакторный дисперсионный анализ
- •26) Байесовская классификация.
- •27) Общая постановка задачи оценивания.
- •1) Минимаксный подход.
- •2) Байесовский подход
- •28) Достаточные статистики. Критерий факторизации. Достаточные статистики
- •Критерий факторизации
- •29) Условное матожидание, его своиства.
- •30) Теорема о ковариации.
- •31) Теорема Леммана Шафе. Алгоритм построения эффективных оценок.
- •Алгоритм нахождения эффективных оценок
- •32) Примеры вывода полноты.
- •33) Доверительный интервал и примеры. Доверительный интервал.
- •Примеры
- •34) Неравенство Рао-Крамера. Теорема Рао-Крамера
- •Пример 1.
- •Пример 2.
- •Пример 3.
32) Примеры вывода полноты.
Свойство полноты. Полные статистики.
X, p(x,) – плотность, T – статистика
если из Ef(T(x))=0 => f(x)=0
Будем рассматривать полные достаточные статистики (ПДС), получим ограничение сверху и снизу.
Пример вывода полноты.
Если существует экспоненциальное распределение, то при определенных условиях T=(T1,…,Tn) является полной статистикой.
Надо, чтобы в Tii(), i было k-мерным, (1()),…,k()) отображалось в Rk.
1) Схема Бернулли
Предположим, что m – число успехов, является достаточной статистикой.
возьмем m=0nf(m)Cnmpmqn-m=0 q(0,1), нужно доказать, что f(m)=0
m=0nf(m)CnmZm=0, Z=p/q, Z(0,)
получается полином с коэффициентами = 0, т.к. Cnm0, то f(m)=0
2) Распределение Пуассона
Существует объем выборки n=1, тогда
=0
уберем e
получим
=0,
для >0
1/k!0
=>
f(k)=0
Равномерное распределение R(0,)
объем выборки n=1
получается
=> f(x)=0с
вероятностью 1
33) Доверительный интервал и примеры. Доверительный интервал.
Существует
выборка x1
x2
…
xn
с плотностью
распределения P(x,)
надо
построить интервал с произвольными
концами P(())=1-
надо выбрать
интервал покороче.
Например
Хотим
построить доверительный интервал дл m
2 неизвестно
x – оценка для m
отцентрируем (x – m), тогда дисперсия будет /m
(отнормировали)
распределение Т мы знаем
=>
=>
Примеры
2 неизвестно
;
надо для t построить интервал
Если
симметричен, то легко ограничить и
получить маленький интервал
Можно брать по-разному, но сумма площадей хвостов= (т.е. 1/3 и 2/3)
Пусть /2
;
=
>
доверительный
интервал:
Рассмотрим схему Бернулли
выборка
хотим
построить доверительный интервал для
Р
воспользуемся
законом больших чисел:
можно
взять
=>
доверительный
интервал:
Асимптотический доверительный интервал
Пусть
n=2k+1
упорядочили
x(k+1) – выборочная медиана
Выборочная
медиана:
m
m совпадает с матожиданием
Какая оценка лучше?
x – лучшая оценка (x(k+1) - хуже)
Выборочная медиана при нарушении основных предположений меняется мало, а x – сильно.
Пример
Пусть
- плотность распределения Коши.
Характеристическая функция у x совпадает с характеристической функцией одного наблюдения (для Коши), т.е. информация о параметре в x такая же, как в одном наблюдении, т.е. x – несостоятельна. Ее нельзя применять, а - дает хорошую оценку.
Распределение Коши похоже на нормальное.
Сколько мы теряем, если распределение нормальное?
Построим доверительные интервалы. Какой короче?
1)
По x
:
2)
По
:
,
если x=,
то
т.е.
интервал для
в
больше,
чем дляx.
Это асимптотически больше для n.
34) Неравенство Рао-Крамера. Теорема Рао-Крамера
Пусть существует X=(X1,...,Xn), g(), p(x,)
ET=g(), для всех R.
DT>-неравенство
Крамера
Граница может достигаться а может и не достигаться
Всегда имеем дело с оценкой, насколько она хороша – она не может быть лучше дисперсии. Если она мало отличается от дисперсии, то оценка хорошая.
I()=,тогда
неравенство Рао-Крамера выполняется,
но оно выполняется не всегда, а при
определенных условиях
Пример:
Условие регулярности
I() корректно определению, т.е. существует производная
и такое мат.ожидание I() конечно
Можно переходить к пределу под знаком
=
-возможность
дифференцирования под знаком интеграла,
достаточно потребовать
h(x)
–рвномерно
по всем
h(x) – интегрируема в Rn
если 1), 2) выполняются, то выполняется неравенство Рао-Крамера.
I(информационное количество Фишера
Доказательство:
Т.к.
T –
несмещенная
оценка для g(),
то ET=g(),
а E+T=g(),
значит
g()-g()=E+T-ET=T(x)p(x,)d-T(x)p(x,)d=T(x)(p(x,)-p(x,))d(T(x)-ET(x))(p(x,)-p(x,))d=
=
применим
неравенство Коши-Буняковского в терминах
мат.ожидания
|Exy|<(Ex2Ey2) равенство <=> когда x,y пропорциональны с вероятностью 1, т.е. существует константа : x=y
<
Это верно при малых . Условие регулярности позволяет перейти к пределу 0
Случай равенства:
T(x)-ET(x)=()
-
это
экспоненциальное семейство первого
порядка
т.е. равенства достигаются, если p(x,) – экспоненциальное семейство, тогда T – ПДС
DT>(g’())2/I()
I()=,
p(x,)=
ln
p(x,)=
=
=(*)
=
=0
достаточно, чтобы p(x,) мажорировалась непрерывной функцией. => (*)=0
тогда I()=nI1()
I() – информация о всей выборке
I1() – информация о первом наблюдении
DT>(g’())2/nI1() при условии регулярности дисперсия убывает не быстрее чем 1/n
Замечание:
Существует случай, когда дисперсия убывает быстрее чем 1/n