3. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

3. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

3.1. Точечные оценки

3.1.1. Свойства оценок

3.1.3. Метод наибольшего правдоподобия для оценки параметров распределений

3.1. Точечные оценки

3.1.1. Свойства оценок

3.1.2. Оценки для математического ожидания и дисперсии

3.1.3. Метод наибольшего правдоподобия для оценки параметров распределений

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МЭИ»

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Tip_rasch_ver.pdf

Скачиваний:

775

Добавлен:

31.03.2015

Размер:

3.46 Mб

Скачать

☆

<<< < Предыдущая 13 14 15 16 17 18 19 20 21 22 23 2425 / 4825 26 27 28 29 30 31 32 33 34 35 36 37 > Следующая >>>

Пусть

случайная величина имеет неизвестную характеристику.

Такой характеристикой может быть, например, закон распределения,

математическое

ожидание,

дисперсия,

параметр

закона

распределения,

вероятность

определенного

значения

случайной

величины .

т.д

Пронаблюдаем случайную величинуn раз и получим выборку из ее

возможных

значений Х1, Х 2 ,K, Х n . В

выборке

скрыта

информация

об

интересующей нас характеристике. Для получения этой информации

необходимо

подвергнуть

результаты

наблюдений

соответствующей

обработке.

Существует два подхода к решению этой задачи. Можно по результатам

наблюдений вычислить приближенное значение характеристики,

можно

указать целый интервал ее значений, согласующихся с опытными данными. В

первом случае говорят о точечной оценке, во втором –– об интервальной.

Определение.

Функция

результатов

наблюдений

а% = а%( Х1, Х 2 ,¼, Х n ) ,

значения

которой

близки к

неизвестному

значению

характеристики а, называется точечной оценкой этой характеристики.

Для одной и той же характеристики можно предложить разные

точечные оценки. Необходимо иметь критерии сравнения оценок, для

суждения об их качестве. Оценка а%( Х1, Х 2 ,¼, Х n ) , как функция случайных

результатов

наблюдений Х1, Х 2 ,K, Х n ,

сама

является

случайной

величиной. Значения а%, найденные по разным сериям наблюдений, могут

отличаться

от

истинного

значения

характеристики в

ту

или

другую

сторону. Естественно потребовать, чтобы

оценка систематически

не

завышала

и не

занижала оцениваемое значение,

с ростом числа

наблюдений

становилась

более

точной. Формализация

названных

требований приводит к следующим понятиям.
Определение.	Оценка	называетсянесмещенной, если	ее
математическое ожидание равно		оцениваемой величине: М (а%) = а.	В
противном случае оценку называют смещенной.

Определение. Оценка называется состоятельной, если при увеличении числа наблюдений она сходится по вероятности к оцениваемой величине, т.е. для любого сколь угодно малого e > 0

n®¥

Р(| а%( Х1, Х 2 ,K, Х n ) - a | < e) ¾¾¾®1.

175

Если известно, что оценка а% несмещенная, то для ее состоятельности достаточно, чтобы

n®¥

D(а%( Х1, Х 2 ,K, Х n )) ¾¾¾®0.

Последнее условие удобно для проверки.

В качестве меры разброса значений оценки а% относительно а можно рассматривать величину М (а% - а)2. Из двух оценок предпочтительней та, для которой эта величина меньше. Если оценка имеет наименьшую меру

разброса	среди	всех	оценок	характеристики, построенных	по n
наблюдениям, то оценку называют эффективной.
Следует отметить, что			несмещенность и состоятельность		являются

желательными свойствами оценок, но не всегда разумно требовать наличия этих свойств у оценки. Например, может оказаться предпочтительней

оценка		хотя	и	обладающая	небольшим		смеще, ноием имеющая
значительно меньший разброс значений, нежели							несмещенная оценка.
Более	того,		есть	характеристики,	для	которых нет		одновременно
несмещенных и состоятельных оценок.
		3.1.2. Оценки для математического ожидания и дисперсии
Пусть			случайная величина имеет неизвестные математическое
ожидание		и	дисперсию, причем		D( X ) < ¥.		Если Х1, Х 2 ,K, Х n ––

результаты n независимых наблюдений случайной величины, то в качестве

оценки для математического ожидания можно предложить среднее арифметическое наблюдаемых значений

= åХ i

/ n.

(3.1.1)

i=1

Несмещенность такой оценки следует из равенств

çæ

åXi ÷ö

åM ( X i )

) = М ç

nM=( X )

M ( X ).

М ( Х

i=1 =

В силу независимости наблюдений

æ 1

n D( X ) D( X )

D( Х ) = Dç

åX=i ÷

å=D( X i )

(3.1.2)

è n i=1

i=1

При условии D( X ) < ¥

D( X )

n®¥

D( X ) =

имеем

¾¾¾®0, что

означает

состоятельность оценки X

Доказано, что

для

математического

ожидания

нормально

еще и эффективна.

распределенной случайной величины оценка Х

176

Оценка

математического

ожидания

посредством

среднего

арифметического наблюдаемых значений наводит на мысль предложить в

качестве оценки для дисперсии величину

å( X i

D =

- X )

Преобразуем величину D,

n i=1

обозначая для краткости М(Х) через m:

D =

éX

- m -

( X - m)ù =

åë

n i=1

n( X - m)

å( X i - m)2 -

- m)å( X i - m) +

( X

n i=1

i=1

=1 ån ( X i - m)2 - ( X - m)2. n i=1

В силу (3.1.2) имеем M ( Х - m)

D=( X )

D( X ). Поэтому

D( X )

-1

M (D)

åM ( X i - m)

= D( X ) -

D( X ).

n i=1

Последняя

запись

означает, что

оценка D имеет

смещение. Она

систематически

занижает

истинное

значение дисперсии. Для получения

несмещенной оценки введем поправку в виде множителя и n -1

полученную оценку обозначим через s2:

å( X i - X

i=1

D =

n -1

Величина

å( X i - X )2

s2 =	i=1		(3.1.3)

		n -1

является несмещенной и состоятельной оценкой дисперсии.

Пример 3.1. Оценить математическое ожидание и дисперсию случайной величины Х по результатам ее независимых наблюдений: 7, 3, 4, 8, 4, 6, 3.

Решение. По формулам (3.1.1) и (3.1.3) имеем

					7 + 3 + 4 + 8 + 4 + 6=+ 3	5;
			М ( X ) » X		7 + 3 + 4 + 8 + 4 + 6=+ 3	5;
					7
D( X ) » s	2	(7 - 5)2		+ (3 - 5)2 + (4 - 5)2 + K+ (3 - 5)2			25	» 4,17.
		=	=
		=	=		6		6
					6		6

177

Ответ. М ( X ) » 5; D( X ) » 4,17.

Задача 3.1. Оцените математическое ожидание и дисперсию случайной величины Х по результатам ее независимых наблюдений. (См. пример 3.1; в качестве исходных данных возьмите данные к задаче 3.22.)

Пример 3.2. Данные 25 независимых наблюдений случайной величины представлены в сгруппированном виде:

Требуется оценить математическое ожидание и дисперсию этой случайной величины.

Решение. Представителем каждого интервала можно считать его середину. С учетом этого формулы(3.1.1) и (3.1.3) дают следующие оценки:

6 × 2 + 8 × 4 +10 ×9 +12 ×7 +14 ×3

260

М ( X ) »

10,4;

D( X ) » s

-10, 4)2 × 2 + (8 -10, 4)2

× 4 +K+ (14

-10, 4)2 3 120

Ответ.

М ( X ) »10,5;

D( X ) » 5.

Задача 3.2. По сгруппированным данным результатов наблюдений случайной величины оцените математическое ожидание и дисперсию этой случайной величины. (См. пример 3.2; в качестве исходных данных возьмите данные к задаче 3.12.)

В теории вероятностей и ее приложениях часто приходится иметь дело с законами распределения, которые определяются некоторыми параметрами. В качестве примера можно назвать нормальный закон


распределения N (m,s2 ).			Его	параметрыm и s2		имеют	смысл
математического	ожидания		и	дисперсии	соответственно. Их		можно
		и	s2. В	общем	случае	параметры	законов
оценить с помощьюХ
распределения	не всегда		напрямую связаны со			значениями	числовых

178

характеристик. Поэтому практический интерес представляет следующая задача.

Пусть случайная величина Х имеет функцию распределения F (x, q), причем тип функции распределенияF известен, но неизвестно значение параметра q. По данным результатов наблюдений нужно оценить значение параметра. Параметр может быть и многомерным.

Продемонстрируем идею метода наибольшего правдоподобия на упрощенном примере. Пусть по результатам наблюдений, отмеченных на рис. 3.1.1 звездочками, нужно отдать предпочтение одной из двух функций

плотности вероятности f (x,q1 ) или	f (x,q2 ) .
f(x,q1)	f(x,q2)

Рис. 3.1.1

Из рисунка видно, что при значении параметраq2 такие результаты наблюдений маловероятны и вряд ли бы реализовались. При значении же q1 эти результаты наблюдений вполне возможны. Поэтому значение

параметра q1	более правдоподобно, чем значение q2. Такая			аргументация
позволяет	сформулировать	принцип	наибольшего	правдоподобия:

качестве оценки параметра выбирается то его значение, при котором данные результаты наблюдений наиболее вероятны.

Этот принцип приводит к следующему способу действий. Пусть закон распределения случайной величиныХ зависит от неизвестного значения параметра q. Обозначим через Р(х,q) для непрерывной случайной величины плотность вероятности в точкех, а для дискретной случайной величины –– вероятность того, что Х = х. Если в n независимых наблюдениях реализовались значения случайной величиныХ1, Х 2 ,K, Х n , то выражение

L( Х1, Х 2 ,¼, X n ,q) P(=X1,q)P( X 2 , q) ×¼× P( X n ,q)

(3.1.4)

называют функцией правдоподобия. Величина L зависит только от параметра q при фиксированных результатах наблюдений Х1, Х 2 ,K, Х n . При каждом

значении параметра q функция L равна вероятности именно тех значений дискретной случайной величины, которые получены в процессе

179

<<< < Предыдущая 13 14 15 16 17 18 19 20 21 22 23 2425 / 4825 26 27 28 29 30 31 32 33 34 35 36 37 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
31.03.20154.5 Mб51Thermodynamics.pdf
#
31.03.201526.11 Кб15Tiitel.doc
#
13.03.2016782.91 Кб7tipar_po_empp мой.docx
#
31.03.20153.18 Mб318Tipovoy_po_ISU_2014.doc
#
31.03.201586.02 Кб33Tipovoy_raschyot_po_elektrostatike_IEE.doc
#
31.03.20153.46 Mб775Tip_rasch_ver.pdf
#
31.03.201528.16 Кб15Titul_Razdatochnyy_material.doc
#
31.03.2015144.38 Кб22TPI_Zadania_14.doc
#
31.03.201588.06 Кб24tr1_dlya_enmi_2012.doc
#
31.03.20157.49 Mб8tr2(2014-1)gox.doc
#
31.03.2015825.55 Кб52tr3.pdf

интервалов

наблюдений