Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Binder1

.pdf
Скачиваний:
30
Добавлен:
30.03.2015
Размер:
2.59 Mб
Скачать

Ширина столбца гистограммы 10 4 1,5. 4

Начиная расчет с левой границы 4, получим интервальное представление исходных данных (интервальные данные).

Номер интервала

Интервал

Частота

Высота столбца гистограммы

1

[4; 5,5)

3

3 / 10 1,5 0, 2

2

[5,5; 7)

2

2/15

3

[7; 8,5)

2

2/15

4

[8,5; 10]

3

0,2

Искомые гистограмма и полигон относительных частот.

Ядерная оценка плотности случайной величины, определенной на Rd :

 

1

 

n

x

X

i

 

 

 

 

 

 

fn* x

 

 

K

 

 

 

,

nh

d

h

 

 

 

 

i 1

 

 

 

 

 

где h – шаг разбиения, K x – ядро (некоторая финитная плотность).

Предложили: Розенблатт (1956), Парзен (1962). Литература: (Деврой Л., Дьерфи Л. Непараметрическое оценивание плотности. – Мир, 1988).

Распределение независимой повторной выборки(НПВ) и интервальных данных.

 

 

 

 

 

n

 

 

1.

P X1 x1, , X n xn P xi

 

 

 

 

 

 

i 1

 

 

 

 

 

n

 

 

 

 

f X1 , , X n

x1 , , xn f xi

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

n!

k

 

2.

P 1 n1

, , k

nk

 

pini ,

pi P Ei .

n1

 

 

 

 

 

! nk ! i 1

 

Здесь E1, , Ek – разбиение множества значений случайной величины .

Предельное поведение выборочных характеристик и выборочного распределения

Понятие состоятельной оценки.

Tn X

Tn X

.

 

P

 

 

– состоятельная оценка , если Tn X

при n для любого .

– сильная состоятельная оценка ,

 

п.н.

при n для любого

если Tn X

 

Асимптотически нормальная оценка статистическая оценка параметра, распределение которой при должной нормировке стремится к нормальному с ростом объема выборки.

Пример 1 (состоятельность выборочных характеристик). По ЗБЧ Хинчина

*

 

1 n

 

k

P

 

k

 

 

m

 

 

 

X

i

M X

 

 

m .

 

 

k

 

 

 

n

 

1

k

 

 

n i 1

 

 

 

 

 

 

 

С учетом теоремы непрерывности

 

 

 

 

1

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k*

 

Xi

 

 

k

 

 

Ckj Xi j

 

k j

 

 

 

 

 

 

 

 

 

 

 

X

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

n i 1 j 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

j *

 

 

 

 

 

 

 

k j

 

 

 

P

 

 

k

 

j

m m

k j

 

 

 

 

 

 

 

 

C

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

C

 

 

 

 

 

 

 

 

 

k

 

 

j

 

 

 

 

 

 

 

 

n

 

 

 

k

 

j

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

k

 

 

 

 

 

 

 

1

 

k j

 

 

 

 

 

 

 

 

 

 

k

 

 

 

k

 

 

 

 

M

 

 

X j

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

j 0

 

C j

 

m

 

 

M X

M

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

3*

 

 

 

P

 

 

 

 

3

 

 

 

 

 

 

 

 

*

 

 

4*

 

 

 

 

P

 

 

 

 

 

4

 

 

K1

 

 

 

 

 

 

 

K1 ,

 

K2

 

 

 

3

 

 

 

 

 

3 K2 .

SX3

X3

 

 

SX4

X4

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

Теорема (об асимптотической нормальности выборочных начальных моментов). Если существует m2k , то при n

 

 

 

 

 

 

 

 

 

 

*

d

2

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n mk

mk Y N 0; m2k

mk

 

 

 

 

mk* mk

d

 

 

 

 

 

 

n

 

 

 

Следствие.

 

 

 

 

 

 

 

Y N 0;1 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

* 2

 

 

 

 

 

m2k

mk

 

 

 

 

 

 

 

Пример 2. Найти предельное распределение m2* в случае НПВ из генеральной совокупности

Е( ).

Решение. Для этого распределения:

 

 

 

m

 

k !

;

 

m

2

;

 

m

4!

 

24

; m m2

 

20

.

 

 

 

 

k

 

2

 

4

4

 

 

 

 

k

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

4

 

 

 

4

2

 

4

 

 

*

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поэтому n (m2

m2 )

а.н.

0;

 

 

 

 

 

. Отсюда при n

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n m2

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

n

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m*

а.н.

0; 1 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

5

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 3. Найти предельное распределение для вектора выборочных начальных моментов

T

X , m2* .

T

Решение. Числовые характеристики вектора X1, X12 :

 

 

2

 

T

 

 

 

 

 

 

 

T

 

 

 

 

 

 

M

 

m1

, m2 ;

 

 

 

 

 

X1, X1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

K X1, X12

 

 

 

 

 

 

 

2

 

T

 

 

 

D X1

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

 

,

X1

, X1

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, X1

 

D X 2

 

 

где

 

 

 

 

 

 

 

 

 

 

 

K X1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

2

 

M

 

4

 

M

2

2

 

2

 

 

 

X1

X1

 

X1

m4 m2 ,

 

 

 

2

 

 

 

 

 

 

 

 

2

M X1 M

 

2

m1 m2 .

K X1, X1 M

X1 X1

X1 m3

По многомерной ЦПТ имеем

n m* m , m* m T1 1 2 2

n

T

 

X i m1, X i2 m2

 

i 1

 

а.н. 0; .

 

 

 

 

 

n

 

 

 

 

Теорема (об

 

асимптотической нормальности

выборочных

квантилей). Пусть

 

 

 

 

 

f x ,

 

 

 

 

 

 

f x положительна и

X X1, , X n

– НПВ из ГС

функция

плотности

непрерывна в точке xp , 0 p 1.

Тогда при n

 

 

 

 

 

 

 

 

 

 

*

d

 

 

p 1 p

 

 

 

 

 

 

 

 

 

n xp

xp Y N

0;

 

 

 

.

 

 

 

 

 

2

xp

 

 

 

 

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 4. Сравнить по точности при большом объеме выборки оценки X и x0,5* параметра a нормального распределения N a; 2 , – известно.

 

 

 

 

 

 

 

2

 

 

Решение. X m* ; X а.н.

a;

по теореме 1. С другой стороны по теореме 2 при

 

 

 

 

1

 

 

 

n

 

 

 

 

 

 

 

 

 

 

p 0,5 имеем

 

2

 

a ;

xp x0,5 N a;

 

 

x0,5* а.н.

 

 

p(1 p)

 

0,5 0,5

 

 

 

 

 

1

 

 

 

f 2 (xp )

 

 

 

 

 

 

 

 

2 2

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

a;

 

 

.

 

 

 

2n

 

 

 

 

 

 

 

 

 

2 ;

2

Точность оценивания при большом объеме выборки и одинаковом значении предельного среднего характеризуется значением асимптотической дисперсии (дисперсией предельного распределения).

Вывод: оценка X «точнее» x0,5* .

Cтатистика Смирнова–Колмогорова. Для оценки расстояния между распределениями используется статистика Смирнова–Колмогорова:

Dn

sup

Fn* x F x

.

 

x R

 

 

Теорема Гливенко–Кантелли.

При

n для

любого

несингулярного распределения

п.н.

 

 

 

 

 

 

 

Dn 0.

 

 

 

 

 

 

 

 

 

 

 

 

– НПВ из ГС F x ,

F x

Теорема Колмогорова. Если

 

X X1, , X n

непрерывная функция распределения, то

 

 

 

 

lim P

 

 

x

 

 

 

 

 

 

1 j e 2 j2 x2

K (x),

 

nDn

 

n

 

 

 

j

 

 

 

 

 

 

 

 

 

 

где K x – функция распределения Колмогорова.

Распределения элементов вариационного ряда

Пусть X 1 , , X n – вариационный ряд по НПВ X1, , X n из генеральной совокупности .

Теорема 1. Пусть F x . Тогда k–й элемент вариационного ряда имеет функцию

распределения

n

FX(k ) (x) Cnm F m (x)[1 F (x)]n m .

m k

Доказательство. Проводятся n измерений случайной величины

с двумя исходами:

A { x} ,

 

{ x}. Тогда P A F x ,

P

 

1 F x . Вычислим

A

A

по крайней мере k элементов выборки имеют

n

FX(k ) (x) P

 

 

Cnm F m (x)[1 F (x)]n m.

значение меньшее x

 

 

 

m k

Следствие 1.

1.FX(n) (x) F n (x) .

2.Если f x , то f X(n) (x) nF n 1 (x) f (x) .

Следствие 2.

1.FX(1) (x) 1 [1 F (x)]n .

2.Если f x , то f X(1) (x) n[1 F (x)]n 1 f (x) .

Теорема 2. Пусть F x . Тогда FX(1) , X(n) (x, y) F n ( y) I ( y x) [F ( y) F (x)]n .

Доказательство. Воспользуемся равенством: P AB P B P AB . Отсюда

FX(1) , X(n) (x, y) P( X (1) x; X (n) y)

P( X ( n) y) P( X (1) x; X (n) y)

F n ( y) P x X1 y, , x X n y F n ( y) I ( y x) [F ( y) F (x)]n

Следствие 3. Если n 2, f x , то

f X(1) , X(n) (x, y) I ( y x)n(n 1)[F ( y) F (x)]n 2 f (x) f ( y) .

Элементы теории точечного параметрического оценивания

Постановка задачи. Имеется X X1, , X n – НПВ из генеральной совокупности , распределение которой принадлежит параметрическому семейству P , k . 1, k – неизвестный k– мерный параметр этого распределения. Надо построить точечную оценку для заданной параметрической функции g – оценить величину g .

Примеры параметрических функций g :

M , D , F x , P a b .

Проблема. Статистических оценок существует бесконечно много. Как выбрать лучшую из них.

При выборе «наилучшей» оценки чаще всего руководствуются следующими соображениями.

1.Оценка должна быть функцией достаточной статистики.

2.Оценка должна быть состоятельной.

3.Оценка должна быть несмещенной.

4.Оценка должна быть эффективной.

Достаточные статистики. Критерий факторизации

Выборка содержит всю информацию, которая имеется о распределении исследуемой случайной величины . При этом X n .

Вопрос: можно ли без потери информации сузить выборочное пространство, уменьшив его размерность, используя статистику T : X XT .

Такие статистики и называются достаточными или исчерпывающими.

 

 

называется достаточной статистикой для параметра , если условное

Опр. Статистика T X

 

 

 

t не зависит от параметра .

распределение выборки при

T X

Достаточная статистика содержит о распределении ту же информацию, что и вся выборка.

Обычно стремятся найти достаточную статистику минимально возможной размерности –

минимальную достаточную статистику.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, значения

Опр.

Функцией правдоподобия выборки X

называется случайная величина L L , X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

которой при X

x x1, xn определяются с помощью соотношений:

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L( , x)

P ( x ) P (x), если P ( x );

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

f (x, ).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L( , x) f (xi

, ) f X (x, ), если

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

Функция правдоподобия группированной выборки:

 

n j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

L ; n1, , nk n!

p j

,

 

 

 

 

 

 

 

 

 

 

 

 

n j !

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

где p

j

E

j

– веpоятность попадания наблюдаемой случайной величины в E

j

j–й интервал

 

P

 

 

 

группирования.

Теорема (критерий факторизации Неймана). Статистика T X является достаточной статистикой

для параметра

тогда и только тогда, когда функция правдоподобия выборки при

 

 

 

X x допускает

факторизационное представление:

 

 

 

 

 

 

 

 

 

 

,

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L( , x) g ,t h x

где t T x

 

 

 

 

 

 

 

Доказательство.

Пусть

 

для

 

 

определенности

 

X i

 

ДСВ.

 

Обозначим

 

 

 

Тогда

 

 

 

 

 

 

 

 

t T x .

 

 

 

 

 

t , а потому

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

x T

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

x

T X

t X

x .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

 

Необходимость.

Пусть

T X

 

 

достаточная

 

статистика для

параметра

а

потому

P

 

 

 

 

 

 

 

. Тогда верны

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

x | T X

t h x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L( , x) P X

x

P X

x,T X t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

t P X

x | T

X t

g ,t h x ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассмотрим

 

 

 

 

 

 

 

 

 

Достаточность. Пусть верно L( , x) g ,t h x .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P X

x,T

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P X

x | T

X t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P T X t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P X

x

 

 

 

 

 

,t h x .

 

 

h x

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

T

X

t, X x

 

 

g ,t h x

 

x

 

 

 

 

 

 

 

 

 

 

x:T x t

 

 

 

 

 

 

 

 

 

h

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x:T x t

 

 

 

 

 

x:T x t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 1. Найти минимальную достаточную статистику для нормального распределения N a; 2 по

НПВ X .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a; .

 

 

 

 

 

 

 

 

Решение. В данном случае параметр является векторным:

 

 

 

Найдем значение функции

правдоподобия

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

(xi a)2

 

 

 

 

1

 

 

 

 

 

 

 

 

1

 

 

n

 

 

 

 

2

 

L(a, ; x)

 

 

 

 

 

 

 

 

exp

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

exp

 

 

 

 

 

(xi a)

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

2

 

i 1

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(xi

a)2 xi2

 

2a xi a2n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nx

 

 

 

 

 

 

 

 

 

 

n n(x

2a x

a

 

 

 

x a

 

 

 

 

 

 

2anx a

 

 

 

 

) n Sx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

exp

 

n

 

S 2

(

 

a)2

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

2

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

g (t, )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

– достаточная статистика для a; .

 

 

 

 

 

 

 

 

 

 

 

 

 

Вывод: T T X ( X , SX2 )

 

 

 

 

 

 

 

 

 

 

 

 

Пример 2. Найти минимальную достаточную статистику для параметра по НПВ X из генеральной

совокупности .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение. В данном случае:

P m

m

e . Поэтому

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m!

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

xi

 

 

 

xi

n

 

 

n i 1

L( , x)

 

e

 

e

 

 

 

x !

 

n

 

i 1

i

 

 

 

xi !

 

 

 

 

 

 

 

i 1

e n nx

 

 

1

.

 

 

 

 

n

g ( ,t )

 

xi !

 

 

 

i 1

 

 

 

 

 

 

 

h( x)

Вывод: T X – достаточная статистика для .

Пример 3. Пусть X – НПВ из генеральной совокупности с плотностью распределения

 

 

 

 

 

 

 

 

f (x)

e ( x ) , x

I (x ) e ( x ) .

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

0,

 

 

Найти достаточную статистику для векторного параметра , .

Решение. Запишем функцию правдоподобия:

 

 

 

 

 

n

 

 

 

( x )

 

 

 

 

L( , ; x) I (xi ) e

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

n

 

 

 

 

 

 

ne n

 

I (x )

 

e xi nen I (x

) e nx

1 .

 

 

i

 

 

(1)

 

 

 

 

 

i 1

 

 

i 1

 

 

h( x)

 

 

 

 

 

 

 

 

 

g ( , ,x,x(1) )

 

 

Вывод: T (

 

, X (1) )

– достаточная статистика для , .

X

Основные методы получения точечных статистических оценок

1)Решение уравнения несмещенности (см. Воинов, Никулин «Несмещенные оценки и их применение») и др.

2)Метод моментов.

3)Метод квантилей.

4)Метод максимального правдоподобия.

5)Метод подстановки.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача

оценивания. Имеется выборка

X X1, , X n из ГС

, имеющей

параметрическое

распределение с неизвестным параметром 1, , r . Оценить значение или g .

 

Метод моментов. Пусть

имеет начальные моменты до r–го порядка включительно. Берем моменты

m1, , mr (или 1, , r ) и приравниваем их к соответствующим выборочным аналогам.

Получаем

систему уравнений метода моментов: m j =m*j ,

j 1, 2, , r относительно неизвестных параметров

1, , r

. Далее решаем систему относительно . Решение системы называют оценкой параметра по

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

методу моментов. Ее обозначение .

 

 

 

 

 

 

 

 

 

Свойства оценки по методу моментов.

 

 

 

 

 

 

 

 

 

1) Состоятельна, если решение системы является непрерывным с вероятностью 1.

 

 

Пусть

*

m1* , , mr*

решение

системы

метода

моментов.

В

таком

случае

mj =mj ,

j 1, 2, , r

имеет

аналогичное

решение

m1, , mr .

По

теореме

Хинчина

*

P

 

 

 

 

P

(m1,..., mr ) .

 

 

 

 

mk

mk . По теореме непрерывности

 

 

 

 

2) Асимптотически нормальна.

 

 

 

 

 

 

 

 

 

 

Пусть

 

 

 

 

 

ее оценка по методу моментов. Тогда при выполнении

 

 

 

 

 

– скалярный параметр, а ( X )

ряда дополнительных условий:

F x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n ( )

n ( X ) (M[ ]

 

~

 

n

(M[ X ])( X

M

 

X ) а.н.

 

0;

 

 

 

M

 

 

D .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итак, асимптотическая дисперсия оценки метода моментов определяется выражением

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M

 

 

 

D

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

– НПВ из ГС R a;b

,

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример. Пусть X

a,b – неизвестные параметры распределения. Найти

оценку по методу моментов параметров a,b .

Решение. Находим характеристики равномерного распределения:

M

a b

;

D

b a 2 .

 

2

 

 

12

Составим систему уравнений метода моментов

a b

 

 

 

 

 

 

X

 

 

 

2

 

 

 

 

 

 

(b a)2

 

 

 

 

2

 

 

 

 

SX

12

 

 

 

 

 

 

 

Решая систему, находим ОММ:

a b 2 X

.b a 2 3SX

b X 3SX , a X 3SX .

Метод квантилей. Берем какие–либо r различных квантилей xpk , k 1, , r распределения и

приравниваем их к выборочным квантилям. Получаем систему уравнений метода квантилей:

xpk ( ) x*pk , k 1, r.

Решение этой системы относительно называют оценкой параметра по методу квантилей. Ее

обозначение * .

Примечание. Обычно метод квантилей используется только для распределений непрерывного типа, у которых функция распределения непрерывна. Поэтому систему уравнений метода квантилей можно записать в следующей эквивалентной форме:

pk F (xpk ), k 1, r .

Свойства оценки по методу квантилей.

1)Состоятельна, если решение системы является непрерывным с вероятностью 1.

2)Асимптотически нормальна при выполнении ряда дополнительных условий.

Пусть

 

 

 

 

– скалярный

параметр,

* (x*p ) .

 

По

теореме об асимптотической нормальности

выборочной квантили:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

 

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

*

 

n

 

 

 

 

*

) (x )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

 

p

 

 

 

 

 

 

 

 

 

2

 

 

p(1 p)

 

 

 

 

~ n

 

 

 

 

x

x

а.н.

 

 

 

 

 

 

 

 

 

 

 

 

)

 

 

0;

 

 

)

 

 

 

 

 

 

 

 

 

.

 

 

 

 

(x

p

p

 

 

(x

p

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f

(xp )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Асимптотическая дисперсия оценки метода моментов

p(1 p)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

)

 

2

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

p

 

 

 

 

f

2 (xp )

 

Пример.

Пусть

 

 

 

НПВ из ГС R a;b ,

 

a,b –неизвестные параметры распределения. Найти

 

 

X

 

 

оценку по методу квантилей параметров a,b .

 

0,

 

x a,

 

 

 

 

 

x a

 

Решение. Найдем

F (x)

 

 

, a x b ,

 

 

 

b

a

x b.

 

1,

 

 

 

 

 

Составим систему уравнений метода квантилей:

 

 

F (x*

 

x*p

a

 

p

)

1

 

 

 

 

1

 

p1

 

b a

 

 

 

 

 

 

 

 

 

x*p a

 

 

 

p2

 

2

 

 

 

 

 

b a

 

 

 

 

 

 

 

 

 

 

x*

 

p

x*

p

 

a*

p

2

p

1

,

 

1

 

2

 

 

 

p2 p1

 

 

 

 

 

 

 

*

a p1

(b a) a(1 p1 ) bp1

 

xp1

 

 

 

a(1 p2 ) bp2

x*p

 

 

2

 

 

 

x*p

(1 p1 ) x*p

(1 p2 )

b*

2

1

 

.

 

p2 p1

 

 

 

 

 

Метод максимального правдоподобия

Статистику ( X ) называют оценкой максимального правдоподобия параметра , если при этом значении параметра функция правдоподобия выборки достигает свой супремума (sup):

 

 

 

L( , X ) sup L( , X ) .

Для нахождения оценки используются следующие соображения.

1)Точки sup функций L( , X ) и ln L( , X ) .

2)sup может достигаться на границе области .

3)sup может достигаться во внутренней точке области , в точке локального экстремума. В этом случае для нахождения ОМП используется необходимое условие экстремума

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

L( , X )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

или

 

 

 

ln L( , X ) 0, i 1, r

 

T

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 1. Пусть X – НПВ из ГС X E , 0 . Найти оценку максимального правдоподобия для

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

, x 0,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение. В данном случае f X (x) e

 

 

 

 

 

 

 

 

 

 

 

 

0, x 0

n

 

 

 

 

 

 

 

 

 

n

 

 

 

xi

n

 

 

 

 

 

 

L( , x) e xi I (xi

0) ne

i 1

I (xi

0) ne n x I (x(1) 0).

i 1

 

 

 

 

 

i 1

 

 

 

 

 

 

Функция правдоподобия не является монотонной. Супремум (в данном случае локальный max или min) может достигаться только внутри области : 0 . Запишем необходимое условие экстремума для ln L (для L вычисление производной по громоздко):

ln L n ln n x (для результатов наблюдений индикатор равен 1),

 

 

 

ln L

 

n

 

nx

0 ;

n

nx

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вывод:

 

n

 

1

– критическая точка.

 

 

 

 

 

 

 

 

 

 

 

 

 

nx

 

 

x

 

 

 

 

 

 

 

 

Проверяем достаточное условие локального максимума:

 

2

ln L

 

n

 

 

0

. в точке

1

 

локальный максимум.

 

2

2

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

– оценка максимального правдоподобия параметра .

Вывод:

 

 

 

 

 

 

 

 

 

 

 

 

X

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]