Билеты по математической статистике с ответами / Вопросы по ТВиМС [8-14]
.doc8. Выборка из нормального распределения. Представление Хи-квадрат распределения с помощью нормальных. Распределение Стьюдента. Распределение Фишера-Снедекора.
Пусть выборка из N(0, 1).
Введем некоторые распределения , используемые в матстатистике.
Рассмотрим случайную величину . Говорят что имеет -распределение(или распределение Пирсона ) с n степенями свободы. Плотность распределения величины имеет вид
где - гамма – функция Эйлера, определяемая равенством
Семейство -распределение является подмножеством двухпараметрического семейства гамма-распределений Г(b,p), p,b0, с плотностями
При b=1/2, p=n/2, n N. Известное свойство , что сумма двух независимых гамма-распределений Г(b,p) и Г(b,q) снова имеет гамма-распределение Г(b,p+q) , здесь следует непосредственно из представления в виде суммы квадратов незвис нормальных величин.
Пусть сл. в. Y независима от . Рассмотрим случайную вел-ну Распределение величины Tn называется распределением Стьюдента с n степенями свободы. Соответствующая плотность распределения имеет вид
Отметим , что плотность распределения Стьюдента симметрична относительно нуля.
Распределения Фишера-Снедекора F(n1,n2) определяется как распределение сл. в. независимы и распределены как и . Плотность распределения Фишера- Снедекора представляется в виде
9. Выборка из нормального распределения. Лемма Фишера.
Лемма: Пусть X1,X2,…Xn- выборка из нормального распределения N(a, σ2). Тогда
1) ;
2) и S2– независимы
3) имеет -распределение с (n-1) степенью свободы;
4) имеет распределение Стьюдента с (n-1)степенью свободы.
Доказательство:
-
пусть Yi=Xi-a распределена по N(0, σ2).
, где величина распространена по закону N(0,n), а величина по закону N(0,1).
-
рассмотрим новые величины : , где A- ортогональная матрица , первая строка которой состоит из из чисел равных .
Вычислим матрицу ковариации: отметим что матожидание
Рассмотрим , т.к.
(*)
П.2 cov()
П. 3 следует из представления (*) , т.к. - НОРСВ имеющие нормальное распределение N(0,1).
4) представим
Следствие:
Если X1…Xn и Y…Y – две независимые нормальные выборки из N(a1, σ1) и N(a2 , σ2), то статистика s12 / s22 имеет распределение Фишера – Снедекора.F(n1 , n2) .
10. Примеры параметрических семейств распределений.
1) Распределение Бернулли : Bi(1, p)- биномиальное распределение с параметрами 1 и p.
Дискретное распределение , сконцентрированное в точках {0;1} ; P(X1=1)=p. Параметр θ=p[0;1]
2)Биномиальное распределение
Дискретное распределение, сконцентрированное в точках {0,1…}
P(X1=k)=Cmk pk (1-p)m-k , k=0,1…m
Параметр θ=(m,p). mN, p[0,1]
3)Семейство распределений Пуассона Pas(λ).
Дискр. распр., неотрицательное, сконцентрированное в точках {0,1…}
P(X=k)= λk\(k!)*exp(-λ), k=0,1… θ = λ
4)Геометрическое распр Geom(p)
Дискретное, значения N
P(X1=k)=p (1-p)k , k=0,1,… θ =p
5)Нормальное , абсолютно непрерывное распределение N(a, σ2).
p θ (x)=
Параметр
6) Показательное Exp(α)
Абсолютно непрерывное
Параметр θ = α>0
7)распределение Лапласа L(a,b)
Абсолютно непрерывное
8)Гамма Г(α,p)
Абсолютно непрерывное
11. Постановка задачи точечного оценивания параметра. Функция потерь. Риск.
Пусть ()- статистический эксперимент, результатом которого является набор наблюдений X1…Xn. Задача точечного оценивания заключается в том, чтобы используя результаты наблюдений, выбрать из множества параметров θ значение, наиболее подходящее в том или ином смысле.
Пусть в качестве оценки параметра θ (или функции от пар-ра g(θ)) выбрана оценка .Для определения близости оценки к истинному значению пар-ра θ вводится функция потерь W(δ, θ) удовлетворяющая следующим условиям:
-
неотрицательность W(δ, θ)
-
если δ=0, то потери нулевые: W(θ, θ)=0
Наиболее употребительными функциями потерь являются W (δ, θ)=( δ - θ)2 - функция потерь Гаусса и W(δ, θ)= |δ - θ| - функция потерь Лапласа.
Функция потерь – величина случайная, зависящая от двух параметров.
Точность оценки измеряется функцией риска R(δ, θ)=Eθ W(δ, θ), где Eθ берется при условии , что распределение соответствует значению параметра θ , т.е. средними потерями при оценивании с помощью δ.
Риск в случае функции потерь Гаусса R(δ, θ)=Eθт.н. средне квадратичное отклонение
Хотелось бы найти оценку , минимизирующую риск при каждом значении θ. Однако в такой постановке задача неразрешима. Действительно, если выбрать в качестве оценки параметра θ некоторое постоянное значение δ = θ0 , θ0, то при θ= θ0 данная оценка абсолютно точна, т.е. имеет нулевой риск. Ясно , что подобная оценка с точки зрения матстатистики абсолютно бесполезна, однако приведённый пример показывает , что , за исключением тривиальных случаев (когда параметр определяется абсолютно точно), оценки , минимизирующей риск при каждом не существует.Для преодоления этой трудности можно ограничить класс рассматриваемых оценок:
-
рассматривать только состоятельные оценки
-
рассматривать только несмещенные оценки
12)Несмещенное оценивание. Теорема единственности несмещенной оценки с равномерно минимальной дисперсией. Примеры несмещ оценок. Пример параметрического семейства для которого не существует несмещенной оценки.
Оценка параметрической функции называется несмещенной , если при любом значении параметра
или просто
Смещением оценки называется величина .
Отметим что выборочная дисперсия не является несмещенной. С учетом независимости наблюдений (не умаляя общности считаем что ):
Тогда смещение . Нетрудно заметить что несмещенной оценкой дисперсии будет .
Несмещенная оценка не всегда может быть построена.Рассмотрим семейство распределений Пуассона. 1) θ= λ →-несмещенная оценка; 2)если Ограничимся одним наблюдением и построим несмещенную оценку:
, т.е. равенство не достижимо.
несмещенной оценки.
Риск несмещенной оценки совпадает с её дисперсией, поэтому если существует равномерно наилучшая из несмещенных оценок (т.е. имеющая наименьший среди всех несмещенных оценок риск при каждом значении ), то она называется несмещенной с равномерно минимальной дисперсией(НРМД).Т.е.
, где δ*- несмещ оценка.
Теорема:параметра θ .
Доказательство : пусть существует две - НРМД оценки
Рассмотрим полусумму оценок -несмещ оценка.
Но
Т.о.
. Случайная величина равна нулю.. чтд.
13)Допустимые и недопустимые оценки. Оптимальная, в смысле среднеквадратического риска, оценка дисперсии в классе оценок, пропорциональных выборочной дисперсии и ее смещение.
Какая из оценок лучще: S2 или S’2?
.
Найдем наилучшую оценку дисперсии в классе всех оценок вида S2(λ)= λS’2, по выборке из нормального распределения N(a, σ2) . Только при λ=1 оценка S(λ) является несмещенной . Вычислим среднеквадратичное отклонение (риск) оценок этого типа
По лемме Фишера
Тогда в итоге получим
- минимум выражения в скобках достигается при данном значении
-смещенная оценка, наилучшая в данном классе оценок дисперсии нормальной выборки
Оценка называется недопустимой в данном классе если существует оценка такая что
Вывод: Оценка S’2 и S2 – недопустимые в классе оценок вида (при фиксированном n S1 лучше S’)
14)Минимаксный и байесовский подходы. Метод построения байесовских оценок. Пример (байесовская оценка среднего нормального распределения с нормальным априорным распределением параметра)
Оценка называется минимаксной если она минимизирует максимальный риск , т.е.
или
Другой подход : Байесовский.
Пусть Q распределение задано на множестве
Байесовским риском оценки , с соответствующим функции потерь W, называется величина
Оценка минимизирующая байесовский риск, называется байесовской.
Пусть на задана (мера) вероятность , плотность которой (относительно доминирующей меры ) задается формулой , где - плотность р-ния θ, а - условная плотность р-ния при условии θ [(- где - мера Лебега)],относительно некоторой доминирующей меры . Байесовский риск(функция потерь Гаусса)
Найдем минимум этой функции по оценкам . Поскольку , фиксируем X, будем минимизировать интегральное выражение по d
Тогда-байесовская оценка.
Совместная плотность
Условная плотность (апостериорная)
- формула Байеса в непрерывном случае
-апостериорное матожидание при условии .
Пример
Пусть выборка из N(a, σ2), σ2 –известно; а ~ N()
(σ2, -известны, =а- параметр)
Построим байесовскую оценку
Совместная плотность
Т.о плотность можно представить в виде
Фиксируем X, расс-м апостериорную пл-ть
Условное матожидание
- байесовская оценка для функции потерь Гаусса. При больших n эта оценка близка к выборочному среднему . - хорошая (состоятельная ) оценка , если имеет нормальное распределение.