Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Уральский Федеральный университет им. Б.Н. Ельцина «УПИ»

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ПП _11 _Оценки пар расп

.pdf

Скачиваний:

Добавлен:

23.02.2015

Размер:

364.45 Кб

Скачать

☆

1 / 21 2 > Следующая >>>

ПП 11. ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ И ФОРМУЛЫ

1. Статистические оценки параметров распределения

Выборка – {X1 , X 2 ,..., X n } - n ─мерная случайная величина.

Статистическая оценка неизвестного параметра теоретического распре-

деления – функция от наблюдаемых случайных величин X1 ,X2 ,...,Xn .

2.Точечные и интервальные оценки. Доверительный интервал, точность оценки, доверительная вероятность (надежность)

Точечная оценка неизвестного параметра Θ ≈Θ* (x1 ,x2 ,...,xn ) – случайная функция Θ* (X1 ,X2 ,...,Xn ), значение которой для любой реализации выборки

принимают за приближенное значение параметра Θ.

Интервальная оценка неизвестного параметра Θ – случайная функция

Θ* (X1 ,X2 ,...,Xn ) такая, что

P (−ε1 < Θ−Θ* (X1 ,X2 ,...,Xn )<ε2 )=γ =1−α ,

или

P(Θ* (X1 ,X2 ,...,Xn )−ε1 <Θ<Θ* (X1 ,X2 ,...,Xn )+ε2 )=1−α ,

т.е., интервал

(Θ* (X1 ,X2 ,...,Xn )−ε1 ,Θ* (X1 ,X2 ,...,Xn )+ε2 )за-

ключает в себе (покрывает) неизвестный параметр Θ с вероятностью γ . Сам интервал носит название доверительного интервала, величина γ =1 −α называется доверительной вероятностью оценки (надежностью, коэффициентом доверия), числа

Θ* (X1 ,X2 ,...,Xn )−ε1

иΘ* (X1 ,X2 ,...,Xn )+ε2

– доверительными границами, α – уровнем значимости (существенности).

Доверительная вероятность характеризует степень доверия к событию (вероятность события), что неизвестный (но не случайный!) параметр Θ содержится внутри доверительного интервала; уровень значимости α характеризует риск наступления события, что параметр Θ в интервале не содержится. Чем более существенны последствия ошибки, что параметр Θ не содержится в доверительном интервале, тем меньшим уровнем значимости нужно задаваться.

Если плотность распределения Θ* (X1 ,X2 ,..., Xn ) симметрична относи-

тельно своей медианы, применяют следующий способ получения интервальной оценки:

P (Θ* (X1 , X 2 ,..., X n )− Θ < ε)=γ =1 −α ,

P (Θ* (X1 , X2 ,..., Xn )−ε <Θ<Θ* (X1 , X2 ,..., Xn )+ε)=γ =1 −α ,

т.е. нижняя и верхняя границы доверительного интервала симметричны относительно оценочной функции Θ* (X1 ,X2 ,...,Xn ). Величина ε , характеризующая ширину доверительного интервала, называется точностью оценки.

При несимметричной плотности распределения Θ* (X1 ,X2 ,...,Xn ) для на-

хождения доверительных границ обычно пользуются условиями

P (Θ < Θ* (X1 ,X 2 ,...,X n )−ε1 )= α2 , P (Θ > Θ* (X1 ,X 2 ,...,X n )+ε2 )= α2 .

Точечные оценки проще в вычислении, но не позволяют установить степень достоверности оценки.

Интервальные оценки наряду с возможными границами значений параметра, дают вероятность, с которой истинное (неслучайное!) значение параметра лежит между этими (случайными) границами. Естественно, чем больше надежность оценки, тем шире доверительный интервал, и наоборот, так что практические вычисления являются компромиссом между точностью и надежностью оценки. Наиболее часто задают надежность 0,95; 0,99 и 0,999.

3. Несмещенные, состоятельные и эффективные оценки

Статистическая оценка Θ* называется несмещенной, если ее математическое ожидание равно Θ, т.е. M Θ* = Θ.

Статистическая оценка Θ* называется состоятельной, если она сходится по вероятности к оцениваемому параметру, т.е.

ε > 0 nlim→∞ P (Θ* −Θ < ε)=1.

Из неравенства Чебышева следует, что несмещенная оценка, дисперсия которой стремится к нулю при n → ∞, является состоятельной.

Статистическая оценка Θ* называется эффективной, если при данном объеме выборки из всех возможных оценок она имеет наименьшую дисперсию.

4. Точечная оценка генерального среднего по выборочному среднему

			=	X1 + X 2 + ...+ X n		.
		X B		X1 + X 2 + ...+ X n
		X B
					n
	– несмещенная оценка M [X ],				– состоятельная оценка M [X ].
X B	– несмещенная оценка M [X ],			X B	– состоятельная оценка M [X ].

Если случайная величина X распределена нормально, то оценка X B будет и

эффективной.

5. Точечная оценка генеральной дисперсии по исправленной выборочной дисперсии

	1	n
Выборочная дисперсия DB =		∑(Xi −		)2 (среднее значение квадрата
			X B
	n i=1

отклонения) является смещенной оценкой генеральной дисперсии. Для получения несмещенной оценки достаточно перейти к исправленной выборочной дисперсии,

s2 =

DB =

∑(Xi −

)2 .

X B

n −1

n −1 i=1

Исправленная выборочная дисперсия является несмещенной и состоя-

тельной оценкой генеральной дисперсии.

Оценка s2 =

D для генеральной совокупности не является эффектив-

−1

ной, но для нормального распределения величины X оценка является асимптотически эффективной, т.е., при n →∞ отношение дисперсии этой оценки к минимально возможной дисперсии оценки стремится к единице.

6. Методы получения точечных оценок параметров распределения

Метод моментов.

Оценка одного параметра. Пусть известен вид плотности распределения f (x,θ ), зависящей от одного параметра θ , но не известно значение этого па-

раметра. Для нахождения оценки этого параметра достаточно составить одно уравнение, например, для начальных моментов первого порядка: xB = M (X ).

Так как математическое ожидание признака генеральной совокупности

∞
M (X )= ∫ x f	(x,θ)dx =ϕ (θ) зависит от неизвестного параметра θ ,								а выбо-
−∞
рочное среднее	x	B	=	x1 + x2 + ... + xn	зависит от реализации выборки			x ,x ,...,x ,
рочное среднее	x		=		зависит от реализации выборки			x ,x ,...,x ,
				n				1	2	n
				n		x1 + x2 + ... + xn
то после решения уравнения					ϕ (θ)=	x1 + x2 + ... + xn	мы	получаем
то после решения уравнения					ϕ (θ)=	n	мы	получаем
						n

θ* =ψ (x1 ,x2 ,...,xn ), оценку неизвестного параметра как функцию значений

конкретной выборки.

Оценка двух параметров. Пусть задан вид плотности распределения, зависящей от двух неизвестных параметров, f (x,θ1 ,θ2 ). Для их оценки можно, на-

пример, приравнять начальные моменты первого порядка и центральные моменты второго порядка, т.е.,

	1	n	[X ], или M (X )= xB , D (X )= DB .
αk* [X ]= xk =		∑(xi )k , µ2* [X ]= µ2
	n i=1

Аналогично случаю одного параметра, теоретические моменты есть функции параметров θ1 ,θ2 , а выборочные моменты зависят от реализации выборки. Ре-

шая полученную систему относительно неизвестных параметров, получаем их точечные оценки:

θ * =ψ	1	(x ,x ,...,x	n	),	θ * =ψ	2	(x ,x ,...,x	n	).
1	1	1 2	n		2	2	1 2	n

Метод максимального правдоподобия Дискретные случайные величины. Пусть Х – дискретная случайная величи-

на, для которой в результате опыта получена выборка значений x1 ,x2 ,...,xn . Вид

закона распределения известен; закон содержит неизвестный параметр θ , для
которого требуется найти точечную оценку на основании данных выборки.
Обозначим вероятность P (X = xi )= p (xi ;θ), i					= 1 , 2 , . .. , n .
Функцией правдоподобия дискретной случайной величины Х называ-
ют функцию аргумента θ и данных выборки x1 ,x2 ,...,xn :
		L (x1 ,x2 ,...,xn ;θ)= p (x1 ;θ) p (x2 ;θ) ... p (xn ;θ).
В качестве				точечной оценки параметра	θ принимается значение
θ* =θ* (x ,x	2	,...,x	n	), при котором функция правдоподобия достигает наиболь-
1

шего значения. Полученную оценку называют оценкой максимального прав-

доподобия.

При практических вычислениях чаще используют функцию

ln L (x1 ,x2 ,...,xn ;θ)= ln p (x1 ;θ)+ln p (x2 ;θ)+ ...+ln p (xn ;θ),

называемую логарифмической функцией правдоподобия, так как функции L

и ln L достигают максимума при одном и том же значении θ .

Непрерывные случайные величины. Пусть Х – непрерывная случайная величина, для которой в результате опыта получена выборка значений x1 ,x2 ,...,xn .

Вид плотности распределения известен; плотность содержит неизвестный параметр θ , f (x)= f (x,θ), для которого требуется найти точечную оценку на

основании данных выборки.

Функцией правдоподобия непрерывной случайной величины Х назы-

вают функцию аргумента θ и данных выборки x1 ,x2 ,...,xn :

L(x1 ,x2 ,...,xn ;θ) = f (x1 ;θ) f (x2 ;θ) ... f (xn ;θ).

Дальнейшие вычисления аналогичны случаю дискретной случайной величины.

После решения уравнения ddlnθL = 0 , называемого уравнением правдопо-

добия, которое дает критические точки функции правдоподобия, необходимо

отобрать точки максимума, пользуясь условием	d 2 ln L	< 0	. Полученная точка
	dθ2

максимума θ* дает оценку максимального правдоподобия параметра θ .

Если плотность распределения зависит от двух неизвестных параметров, f (x)= f (x;θ1 ,θ2 ), то и функция правдоподобия является функцией двух пере-

менных, θ1 ,θ2 . Для нахождения критических точек нужно решить систему

∂ln L = 0,

∂θ1

∂ln L = 0,

∂θ2

Для того, чтобы в критической точке достигался максимум, достаточно, чтобы выполнялись условия AC − B2 > 0 , A < 0 (или C < 0 ), где A,B,C – значения вторых производных в критической точке P (θ1 ,θ2 ):

A =	∂2 ln L		, B =	∂2 ln L		, C =	∂2 ln L	.
	∂x2			∂x∂y			∂y2
		P			P			P

	7. Интервальные оценки

При получении точечной оценки необходимо знать лишь выражение для оценки Θ* (X1 ,X2 ,...,Xn ) как функцию данных выборки, а для получения интервальной оценки необходимо также знать закон распределения Θ* (X1 ,X2 ,...,Xn ), с помощью которого рассчитывается вероятность, вид гене-

рального распределения и значение параметров распределения, которые и подлежат оценке.

Первое затруднение преодолевается тем, что иногда вид генерального распределения может постулироваться (нормальное распределение, равномерное распределение и т.д.). В некоторых случаях при достаточно большом объеме выборки реальную функцию распределения оценки с достаточной точностью можно заменить асимптотической (соответствующей n →∞). В частности, из

теоремы Ляпунова					следует, что распределения выборочной	средней
			=	X1 + X 2 + ...+ X n	или относительной частоты значения признака	w = ni
	X	B

				n		i	n

распределены асимптотически нормально независимо от вида генерального распределения.

Попытки разрешения второго затруднения приводят к двум способам построения интервальной оценки: приближенному и точному.

Приближенный способ состоит в замене неизвестных параметров гене-

ральной совокупности, от которых зависит распределение Θ* , на их точечные оценки, полученные в результате выборки. Далее оценка строится, как если бы параметры распределения были бы известны.

Точный способ может быть использован лишь в том случае, когда известен закон генерального распределения. При этом строятся вспомогательные случайные величины, распределение которых не зависит от неизвестных параметров генеральной совокупности, но зависит лишь от объема выборки. В част-

ности, при оценке среднего значения нормально распределенной генеральной совокупности можно использовать оценку

	M [X ]−
*	M [X ]−			X B
Θ = T =					n ,
Θ = T =		n	D		n ,
		n
		n −1
		n −1		B

которая подчиняется распределению Стьюдента, зависящему только от объема выборки n .

Синтервальной оценкой связано решение трех типов задач:

1)определение доверительной вероятности по заданному доверительному интервалу и объему выборки;

2)определение доверительного интервала по заданной доверительной вероятности и объему выборки;

3)определение необходимого объема выборки по заданным доверительной вероятности и доверительному интервалу.

Интервальная оценка математического ожидания нормально распределенной случайной величины

при известном σ.

Пусть случайная величина Х генеральной совокупности распределена по

			1	e−	( x−a )2
нормальному закону	f ( x ) =					, где σ = D[Х], a = M [Х] =		,
					2σ2
							X
		σ	2π

при этом среднее квадратическое отклонение σ считаем известным.

Пусть сделана выборка объема n и вычислена X B , которая является точечной оценкой математического ожидания a генеральной совокупности.

Так как		=	X1 + X 2 + ...+ X n	– среднее арифметическое случайных величин
	X B
			n

X1 ,X2 ,...,Xn , распределенных так же, как и признак генеральной совокупности X, то закон распределения X B также нормален, M [X B ]= M [X ]= a , а диспер-

сия случайной величины X B в n раз меньше дисперсии случайной величины X:

σ2 X B = σn2 .

1). Определим, с какой надежностью математическое ожидание а покрыва-

ется доверительным интервалом

при

заданной точности

ε, т.е.

найдем

−a

<ε) или P (

−ε < a <

+ε).

X B

ε n

Тогда, P (

Хв −a

< ε)= 2Ф

= 2Ф

= 2Ф(t )= γ ,

где

t =

σ (Хв )

где Ф(t) – функция Лапласа. Зная σ, ε и n, можно найти по таблице значений функции Лапласа надежность γ оценки X B математического ожидания a.

2). По выборочному значению математического ожидания X B и известному

σ найти доверительный интервал, который с заданной надежностью γ покрывает математическое ожидание а генеральной совокупности. Это и есть задача

получения интервальной оценки X B . Используя таблицы значений функции Лапласа, по γ определяют t = εσn , отсюда ε = tσn . Таким образом получают

искомый доверительный интервал, с надежностью γ покрывающий неизвест-
ный параметр а; точность оценки ε =	tσ	.
ный параметр а; точность оценки ε =		.
	n
			ε		n
3). По заданным σ, ε и γ, используя соотношение 2Ф				σ	=γ , найти объ-
				σ
ем выборки n. Решая уравнение 2Ф(t)=γ , по γ находим t				, а затем из t =		ε n
ем выборки n. Решая уравнение 2Ф(t)=γ , по γ находим t				, а затем из t =		σ
						σ

находим минимальный объем выборки n = tσ 2 .

10.3.Интервальная оценка математического ожидания нормально распределенной случайной величины

при неизвестном σ.

Для решения этой задачи используется распределение Стьюдента случай-

Хв

−a

ной величины

t =

, где sв =

∑(xi −

в )2 несмещенная оценка

s /

n −1 i=1

среднего квадратичного отклонения.

Плотность этого распределения :

−n

1 +

fn (t )=

n −1

π( n −1)Г

fn ( t ) определяется только объемом выборки n и не зависит от неизвестных па-

раметров. При n→∞ распределение Стьюдента стремится к стандартному нормальному N (0,1), то практически при n > 30 можно пользоваться вместо рас-

пределения Стьюдента нормальным распределением.

Аналогично предыдущей задаче, по заданным n и γ находим в таблицах кван-

тиль распределения Стьюдента Учитывая, что t = Хв −a , можно записать sв / n

−a

P (

< tγ )= P

< tγ

=γ , или P

Хв −a

=γ ,

s /

откуда доверительный интервал для a : Х − tγ snв < a < Х + tγ snв .

Итак, по имеющейся выборке x1 ,x2 ,...,xn находим Хв и sв . Затем, задава-

ясь надежностью γ, определяем доверительный интервал, покрывающий математическое ожидание а.

10.4. Интервальная оценка среднего квадратического отклонения σ нормального распределения

Пусть случайная величина Х распределена нормально и требуется оценить неизвестное генеральное среднее квадратическое отклонение (с.к.о.) σ по исправленному выборочному с.к.о. s . Точечной оценкой параметра σ служит исправленное выборочное с.к.о.. Построим доверительный интервал, покрывающий параметр σ с заданной надежностью γ .

Для решения этой задачи используется распределение χ2 (Пирсона). Для

выборки

,...,X

величина

(n −1)

= χ2

распределена по закону

χ2 с n −1

σ2

степенями свободы.

Рассмотрим симметричный доверительный интервал

P (s −δ <σ < s +δ )= γ .

Это приводит к оценке s (1−q)<σ < s (1+q), где числа q = q (n,γ ) ищутся по таблицам распределения χ2 .

Так как более доступны таблицы квантилей распределения χ2 , изложим еще один способ построения доверительного интервала, покрывающего гене-

ральное с.к.о. σ с заданной доверительной вероятностью. Запишем его в виде:

P (s −δ− <σ < s +δ+ )= γ ,

где границы s −δ− и s +δ+ пока не определены. Неравенства для σ могут быть

преобразованы в неравенства для χ2 =

s2 (n −1)

: P (χ2

− < χ2 < χ2

+ )=γ и вели-

1 −γ

чины

χ2

− и

χ2

определяются

из условий:

P (χ2 ≤ χ2

− )=

=α ,

P (χ2

≥ χ2

+ )=α ,

P (χ2

≤ χ2

+ )=1 −α , т.е. являются квантилями распределения

χ2 уровня α и уровня 1 −α , соответственно.

Часто в таблицах приводятся не квантили qp ( P (X < qp )= p ) , а критические точки распределений k p ( P (X > kp )= p ). Неравенства предыдущего раздела с

использованием критических точек будут выглядеть так:

P (χ2кр(−) < χ2 < χ2кр(+) )=γ ,

P (χ2 > χ2 кр(+) )= 1 −2γ =α ,

P(χ2 > χ2кр(−) )=1 −α .

ПП11.1. Точечные оценки параметров распределения

№ п/п

Задание

Ответ

Случайная величина X распределена по показательному

закону с плотностью распределения f (x)= λe−λx

(x ≥ 0)

неизвестным параметром λ . Методом моментов по вы-

ПП

борке x1 ,x2 ,...,xn оценить значение этого параметра.

РЕШЕНИЕ:

11.№1.

M (X )= ∞∫xλe−λxdx =

λx = t

∞∫te−t dt =

= xB , т.е. λ =

λ 0

Итак, оценка параметра распределения λ* =

Случайная величина X

распределена по нормальному

закону с плотностью распределения f (x)=

e−

(x−a)2

2σ2

σ 2π

неизвестными параметрами a и σ . Методом моментов

по выборке x1 ,x2 ,...,xn оценить значение этих параметров.

ППРЕШЕНИЕ:

11.№2. Приравняем теоретические и эмпирические средние и
дисперсии. Как известно, для нормального распределе-
ния M (X )= a , D (X )=σ 2 .
Тогда
*	x1 + x2 +...+ xn			*		1 n	2

a = xB =			, σ		= DB =	∑(xi − xB )		.
	n
						n i=1
Случайная величина X распределена по биномиальному
закону:		Pm (X = xi )= Cmxi pxi (1− p)m−xi ,

где m – длина серии испытаний, xi – число появлений
события в i -й серии испытаний, n– объем выборки (чис-

ППло проведенных серий испытаний), p – неизвестный па-

11.№3. раметр распределения (вероятность появления события в

однократном испытании). Методом максимального прав-

доподобия по выборке x1 ,x2 ,...,xn оценить значение этого

параметра.

РЕШЕНИЕ:

Составим функцию правдоподобия:

(1− p)

m−x1

(1− p)

m−x2

L (x1 ,x2 ,...,xn ; p)= Cm

×...

(1− p)

m−xn

x1 x2

)

x1 +x2 +...+xn

(1− p)

mn−(x1 +x2

+...+xn )

...× Cm p

= (Cm Cm ... Cm

Логарифмическая функция распределения:

ln L =ln(Cmx1 Cmx2 ... Cmxn

)+(∑xi )ln p +(nm −∑xi )ln(1− p),

Уравнение правдоподобия:

d ln L

∑xi

−

nm −∑xi

= 0 ,

1− p

его решение (критическая точка): p = ∑nmxi . Проверим выполнение достаточных условий экстрему-

ма:		d 2 ln L		= −	∑xi −	nm −∑xi	, при	p =	∑xi	d 2 ln L	< 0 , т.е.,
		dp2								dp2
					p	(1− p)2			nm
p =	∑xi		– точка максимума, и в качестве оценки макси-
		nm

мального правдоподобия параметра p биномиального распределения нужно взять p = ∑nmxi .

Случайная величина X распределена по закону Пуассона:

Pm (X = xi )= λxxi ei!−λ ,

где m – длина серии испытаний, xi – число появлений

события в i -й серии испытаний, n– объем выборки (число проведенных серий испытаний), λ – неизвестный параметр распределения. Методом максимального правдоподобия по выборке x1 ,x2 ,...,xn оценить значение этого

параметра. РЕШЕНИЕ:

ППСоставим логарифмическую функцию правдоподобия:

11.№4.

ln L (x1 ,x2 ,...,xn

λx1 e−λ

λx2 e−λ

λxn e−λ

;λ)= ln

x1!

x2!

...

xn!

λ∑xi

)

−nλ −ln (x ! x !

... x !).

= ln

e−nλ =

ln λ

x ! x ! ... x !

(∑ i

(∑xi )

Уравнение правдоподобия: d ln L

−n = 0 , его ре-

dλ

шение (критическая точка): λ =

(∑xi )

. Проверим вы-

полнение достаточных условий экстремума:

d 2 ln L

= − (∑xi )

< 0 , т.е.,

λ =

– точка максимума, и в

dλ2

λ2

1 / 21 2 > Следующая >>>

Соседние файлы в папке ПП_4_сем_pdf

#
23.02.2015296.9 Кб36ПП _06 _Схема Бернулли.pdf
#
23.02.2015503.45 Кб36ПП _07 _Законы распр и числ хар.pdf
#
23.02.2015262.21 Кб35ПП _08 _Предельные теоремы.pdf
#
23.02.2015515.48 Кб39ПП _09 _Многомерные СВ.pdf
#
23.02.2015270.78 Кб36ПП _10 _Функции СВ.pdf
#
23.02.2015364.45 Кб35ПП _11 _Оценки пар расп.pdf
#
23.02.2015501.49 Кб39ПП _12_Проверка_стат_гипотез.pdf
#
23.02.2015564.15 Кб36ПП_5_2_Функ_ряды.pdf
#
23.02.2015381.39 Кб40ПП_5_3_Ряды_Фурье.pdf