- •Введение в математическую статистику.
 - •15) Лемма Неймана-Пирсона (рэндомизированный и нерэндомизированный вариант).
 - •21) Проверка независимости признаков.
 - •Пример:
 - •24) Общая задача дисперсионного анализа.
 - •25) Однофакторный, двуфакторный дисперсионный анализ. Однофакторный дисперсионный анализ
 - •Двуфакторный дисперсионный анализ
 - •26) Байесовская классификация.
 - •27) Общая постановка задачи оценивания.
 - •1) Минимаксный подход.
 - •2) Байесовский подход
 - •28) Достаточные статистики. Критерий факторизации. Достаточные статистики
 - •Критерий факторизации
 - •29) Условное матожидание, его своиства.
 - •30) Теорема о ковариации.
 - •31) Теорема Леммана Шафе. Алгоритм построения эффективных оценок.
 - •Алгоритм нахождения эффективных оценок
 - •32) Примеры вывода полноты.
 - •33) Доверительный интервал и примеры. Доверительный интервал.
 - •Примеры
 - •34) Неравенство Рао-Крамера. Теорема Рао-Крамера
 - •Пример 1.
 - •Пример 2.
 - •Пример 3.
 
32) Примеры вывода полноты.
Свойство полноты. Полные статистики.
X, p(x,) – плотность, T – статистика
если из Ef(T(x))=0  => f(x)=0
Будем рассматривать полные достаточные статистики (ПДС), получим ограничение сверху и снизу.
Пример вывода полноты.
Если существует экспоненциальное распределение, то при определенных условиях T=(T1,…,Tn) является полной статистикой.
Надо, чтобы в Tii(), i было k-мерным, (1()),…,k()) отображалось в Rk.
1) Схема Бернулли
Предположим, что m – число успехов, является достаточной статистикой.
возьмем m=0nf(m)Cnmpmqn-m=0  q(0,1), нужно доказать, что f(m)=0
m=0nf(m)CnmZm=0, Z=p/q, Z(0,)
получается полином с коэффициентами = 0, т.к. Cnm0, то f(m)=0
2) Распределение Пуассона
Существует объем выборки n=1, тогда
=0
 
уберем e
получим
=0,
для >0
 1/k!0
=>
f(k)=0
Равномерное распределение R(0,)
объем выборки n=1
получается
 
=> f(x)=0с
вероятностью 1
33) Доверительный интервал и примеры. Доверительный интервал.
Существует
выборка x1
x2
…
xn
с плотностью
распределения  P(x,)
надо
построить интервал с произвольными
концами P((
))=1-
надо выбрать
интервал покороче.
Например
Хотим
построить доверительный интервал дл m
2 неизвестно
x – оценка для m
отцентрируем (x – m), тогда дисперсия будет /m
(отнормировали)
распределение Т мы знаем
=>
 
=>![]()
![]()
![]()
Примеры
2 неизвестно
;
    ![]()
надо для t построить интервал
Е
сли
симметричен, то легко ограничить и
получить маленький интервал
          
![]()
Можно брать по-разному, но сумма площадей хвостов= (т.е. 1/3 и 2/3)
Пусть /2
;
   
![]()
![]()
=
>  
![]()
доверительный
интервал:  
![]()
Рассмотрим схему Бернулли
выборка
хотим
построить доверительный интервал для
Р
![]()
![]()
воспользуемся
законом больших чисел: 
![]()
![]()

можно
взять 
![]()
=>
  
![]()
доверительный
интервал: 
![]()
Асимптотический доверительный интервал
Пусть
n=2k+1
упорядочили
x(k+1) – выборочная медиана
![]()
![]()
В
ыборочная
медиана:![]()
m
m совпадает с матожиданием
Какая оценка лучше?
x – лучшая оценка (x(k+1) - хуже)
Выборочная медиана при нарушении основных предположений меняется мало, а x – сильно.
Пример
Пусть
- плотность распределения Коши.
Характеристическая функция у x совпадает с характеристической функцией одного наблюдения (для Коши), т.е. информация о параметре в x такая же, как в одном наблюдении, т.е. x – несостоятельна. Ее нельзя применять, а - дает хорошую оценку.
Распределение Коши похоже на нормальное.
Сколько мы теряем, если распределение нормальное?
Построим доверительные интервалы. Какой короче?
1)
По x
: 
![]()
2)
По 
: 
![]()
,
если x=,
то 
![]()

т.е.
интервал для
 в 
больше,
чем дляx.
Это асимптотически больше для n.
34) Неравенство Рао-Крамера. Теорема Рао-Крамера
Пусть существует X=(X1,...,Xn), g(), p(x,)
ET=g(), для всех R.
DT>
-неравенство
Крамера
Граница может достигаться а может и не достигаться
Всегда имеем дело с оценкой, насколько она хороша – она не может быть лучше дисперсии. Если она мало отличается от дисперсии, то оценка хорошая.
I()=
,тогда
неравенство Рао-Крамера выполняется,
но оно выполняется не всегда, а при
определенных условиях
Пример:
Условие регулярности
I() корректно определению, т.е. существует производная
и такое
	мат.ожидание I()
	конечноМожно переходить к пределу под знаком 
=
-возможность
дифференцирования под знаком интеграла,
достаточно потребовать 
h(x)
–рвномерно
по всем 
h(x) – интегрируема в Rn
если 1), 2) выполняются, то выполняется неравенство Рао-Крамера.
I(информационное количество Фишера
Доказательство:
Т.к.
T –
несмещенная
оценка для g(),
то ET=g(),
а E+T=g(),
значит
g()-g()=E+T-ET=T(x)p(x,)d-T(x)p(x,)d=T(x)(p(x,)-p(x,))d(T(x)-ET(x))(p(x,)-p(x,))d=
=
применим
неравенство Коши-Буняковского в терминах
мат.ожидания
|Exy|<(Ex2Ey2) равенство <=> когда x,y пропорциональны с вероятностью 1, т.е. существует константа : x=y
<![]()
![]()
Это верно при малых . Условие регулярности позволяет перейти к пределу 0
![]()
![]()
Случай равенства:
T(x)-ET(x)=()
![]()
![]()

-
это
экспоненциальное семейство первого
порядка
т.е. равенства достигаются, если p(x,) – экспоненциальное семейство, тогда T – ПДС
DT>(g’())2/I()
I()=
,
p(x,)=
![]()
ln
p(x,)=
![]()
![]()
=![]()
=(*)
=![]()
=0
достаточно, чтобы p(x,) мажорировалась непрерывной функцией. => (*)=0
тогда I()=nI1()
I() – информация о всей выборке
I1() – информация о первом наблюдении
DT>(g’())2/nI1() при условии регулярности дисперсия убывает не быстрее чем 1/n
Замечание:
Существует случай, когда дисперсия убывает быстрее чем 1/n
