
Основные понятия математической статистики
Неравенство Чебышева
для любого>0.
Пусть
наблюдаемая в эксперименте случайная
величина принимает
значенияa1,
a2,…,r–
число элементов соответствующей выборки=(X1,…,Xn),
принявших значениеar(r=1, 2,…),r*=r/n– относительная
частота.
Запись в виде последовательности пар {( ar,r)}, гдеr>0, или в виде таблицы
-
a1
a2
a3
…..
…..
1
2
3
……
……
называется статистическим рядом.
Наиболее
важными характеристиками случайной
величины являются
ее моментыk=Ek,
а также центральные моментыk=E(–1)k(когда они существуют). Их статистическими
аналогами, вычисляемыми по соответствующей
выборке=
(X1,…,Xn),
являютсявыборочные моменты
,
.
Величина
называетсявыборочным средними
обозначается
:
=
=
;
величина
называетсявыборочной дисперсиейDв=
=
=
.
Если выборочные данные представлены в виде статистического ряда {( ar,r)}, то выборочные моменты вычисляются по формулам
,
.
Для произвольного распределения Fи произвольного числаp(0,1)
уравнениеF(x)=pопределяетр-квантильp,
т.е.F(p)=p(чтобы решение было однозначным, графикF(x)в точках разрыва (когда они есть) дополняют
вертикальными отрезками, а в случаях,
когда этому уравнению удовлетворяет
много значенийх, в качествеpвыбирается минимальное) . Выборочнаяр-квантильопределяется какр-квантиль
эмпирической функции распределения
,
т.е.
=p,
и является статистическим аналогомp.
Статистика Tn= Tn(X1,…,Xn) являетсясостоятельной оценкойдля характеристикиgнаблюдаемой случайной величины, если приnдля любого>0 выполняется условиеP{| Tn– g|>}0.
Оценка Tnдляg называется несмещенной, еслиETn=g. Величинуb=ETn–gназываетсясмещениемоценкиTn.
Статистику Tn=Tn(X1,…,Xn)
называютдостаточнойдля параметра, если условная
функция распределенияслучайной выборки
=(X1,…,Xn)
при условии, что
не
зависит от параметрапри любом возможном значенииt.
Функция
L(X1,…,Xn;)=p(x1;)… p(xn;)
называется функцией правдоподобия. Здесь p(x;) обозначает плотность распределения непрерывной случайной величины или вероятность события {X=x} в случае дискретной случайной величины.
Теорема (критерий факторизации
Неймана-Пирсона).Статистика Tn=
Tn(x1,…,xn)
является достаточной для параметра
тогда и только тогда, когда для любой
реализации
=(x1,…,xn)
случайной выборки
=(X1,…,Xn)
выборочное значение функции правдоподобия
имеет вид
L(x1,…,xn)=f(Tn(x1,…,xn),)h(x1,…,xn),
т.е. может быть представлен в виде произведения двух сомножителей, из которых второй не зависит от , а первый (зависящий от ) зависит от результатов наблюдения x1,…,xn только через статистику Tn= Tn(x1,…,xn).
Пусть
независимая выборка из распределения
,
зависящего от неизвестного параметра
,
– случайная величина с функцией
распределения
.
Метод правдоподобия
В качестве оценки
параметрапо
выборке
из распределенияF(y,) выбирается значение
параметра,максимизирующеефункцию
правдоподобия:
.
Здесь p(x;) обозначает плотность распределения непрерывной случайной величины или вероятность события {=x} в случае дискретной случайной величины.
Таким образом,
.
Статистика
называетсяоценкой наибольшего
правдоподобия. Если функция
правдоподобия
является дифференцируемой по переменным
,
то оценка наибольшего правдоподобия
удовлетворяет следующей системе
уравнений:
.