Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Лавренченко, А. С. Лекции по математической статистике и теории случайных процессов учебное пособие

.pdf
Скачиваний:
13
Добавлен:
19.10.2023
Размер:
4.94 Mб
Скачать

вариационного ряда (2). Но для нормальной к все эти оцейкй не эффективны.

Методы получения точечных оценок параметров

Рассмотрим непрерывную случайную величину X. На практике

часто удается предсказать вид ее плотности вероятности

 

 

f(x-

в и . . . , в к).

(12)

При этом по

выборке (1)

остается лишь оценить неизвестные

параметры в,,...,

0 ft. Для этого обычно используют метод наиболь­

шего правдоподобия, который состоит в следующем.

 

Выборку (1)

априорно можно понимать как «-мерную

случай­

ную величину с независимыми компонентами х........ хп. Плотность вероятности

L {хх,

х

п\ 0 „ . . . , 0*) = П/(*,;

0 ц , 0*)

(13)

 

 

;-л

 

функцией

этой величины

как

функция от 0 ь ..., 0 /;

называется

правдоподобия.

 

 

 

 

Параметры 0 , .......0* по методу наибольшего правдоподобия находятся из допущения, что для фактически полученной выборки

(1) функция правдоподобия (13) принимает наибольшее значение.

Но функция правдоподобия

(13)

и ее логарифм

 

 

 

 

InL(xu . . . ,

хп\

0 „ . . .

, 0 ft)

 

 

(14)

достигают максимума

при

одних и

тех

же значениях

0 ь .

0 ь .

Поэтому если

функция

(14)

дифференцируема

но

0 Ь.

0к у

то оценки

 

 

 

 

 

 

 

 

 

 

 

01 (*1, . ••)

•*•I 0 * (-^15 ■ ■ •> Х„)

 

 

(15)

параметров

0*

можно

найти

из

необходимого условия

максимума функции (14)

 

 

 

 

 

 

 

 

д

In L(xu ----- х„; 0 Х, . . . ,

0/,) = 0;

 

 

 

 

 

 

 

 

 

 

 

 

 

( Ш )

д

lnL(jc,,

 

0 ,

, 0*) = о,

 

 

 

 

 

 

 

 

 

 

 

 

при котором

функция

(14)

выбрав то решение (15) системы (16),

принимает наибольшее значение.

Все сказанное верно и для дискретной X с рядом распределения

P ,( 0 1 ,..., 0ft) P(X =

Xl).

(17)

Только здесь функция правдоподобия

определяется

так:

L ( 0 „ . . . , 0») = ПЯ,“' ( 0 . . - - , 0 * ) . /=>1

где mt— кратность возможного значения xt (i 1, 2,..., г) чины X в выборке (1).

(18)

велп-

10

Функция (18) есть вероятность получения тех значении Ип

в выборке

(1),

которые в действительности и получены.

Пример 1. Оценим вероятность р события А по числу т появ­

лений события А в п независимых опытах.

Вероятность

р

есть

параметр распределения

 

 

 

X

|

0

 

1

 

 

 

р

\

1 - Р

 

Р

числа X появлений события А в одном опыте.

Согласно (18)

имеем

 

 

 

 

 

 

L(P) =

0 - Р У '

 

и система

(16)

дает

 

 

 

 

 

 

д

In L (р) =

п т

т

 

 

1

Р

-н ------- == 0,

 

 

др

 

р

откуда

 

 

 

 

гп

 

 

 

 

 

 

 

 

 

 

 

 

р = —

 

 

 

 

 

 

п

 

 

Метод наибольшего правдоподобия имеет следующие достоин­ ства: он дает состоятельные оценки, асимптотически несмещенные,

асимптотически

эффективные

и асимптотически нормальные,

т. е. те, которые

при /г—>-оо сходятся к несмещенным, эффектив­

ным и нормальным оценкам.

 

Система (16)

часто сложна. В этих случаях применяют метод

моментов, который состоит в том,

что параметры 0 ),..., в* распре­

деления (12) или

(17) выбирают так, чтобы k первых важнейших

его моментов, и в первую очередь математическое ожидание и дисперсия, равнялись бы соответствующим выборочным моментам.

Пример 2. Оценим методом моментов вероятность р в при­

мере 1.

Из распределения величины X имеем тх = р, и согласно методу

моментов

 

 

1

"

 

п

1

 

Но

 

 

V X, /77,

(-1

 

поэтому

 

171

 

Р =

 

--- •

 

 

П

Значком /ч помечены оценки,

полученные по методам наиболь­

шего правдоподобия и наименьших квадратов (лекция 5), знач­ ком ------остальные.

11

Л е к ц и я 2 ОСНОВНЫЕ РАСПРЕДЕЛЕНИЯ В МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ

Распределение хм-квадрат. Распределение Стыодента. Распределение Фишера.

Распределение х2

Выборочные оценки, как случайные величины, имеют некоторые распределения. Основные из них:

нормальное распределение (рассмотрено в теории вероятностей); распределение х2 (хи-квадрат); распределение Стыодента; распределение Фишера.

Рассмотрим величину

П

( 1 )

равную сумме -квадратов п независимых нормальных нормирован­

ных (/и = 0 ,

aXk = 1)

случайных величин Хк

(к — 1,...,

п).

Закон распределения случайной величины

хл2

называется рас­

пределением

х2.

или

распределением

Пирсона,

с п

степенями

свободы.

1.

Случайная величина

х«2 имеет плотность вероят­

Т е о р е м а

ности

 

 

 

 

 

 

 

V

т

(2)

 

и по определению гамма-функция

Г"(х) == j yx~le-»dy.

(3 )

и

-12

Доказательство. Для (2) найдем характеристическую функцию

оо

1

 

I'

V 2

1

V

 

g(t) = j f {v)eitvdv

------

е

2 eitvdv.

 

ос

пЛ

о

 

 

 

 

 

 

2 2 Г

 

 

 

 

 

 

 

 

2 /

 

 

 

 

 

 

 

Сделаем подстановку

 

 

 

 

 

 

 

 

z — | —

it | V. О

V <

оо .

 

 

(4)

Тогда

 

 

 

 

 

 

 

 

&'(0

( 1 — 2//)

2 f z 2

'e~zdz,

(5)

где интеграл берется по лучу

(4) комплексной плоскости г.

 

Можно показать, что значение интеграла

(5)

не изменится,

если

интегрирование по лучу (4) заменить интегрированием по положи­ тельной части вещественной оси. Поэтому в силу (3) получим

 

 

g(t) =

{ \ - 2 t i f J?.

(6)

Найдем теперь характеристическую функцию величины

(1). Для

слагаемого

X 2(k — 1,..., п)

величины

(1) имеем

 

 

 

 

 

л-2

 

 

g^(t)

М [eitx-l\ = ] eu*k — =■ е ~ dxk.

 

Сделаем

подстановку

 

 

 

1 огда

 

z = xk у Т — 2«, —

< Xk < оо .

(?)

 

 

 

 

 

 

ё4

^ )==

2**)~"* J e ~ T *fe>

 

где интеграл берется по прямой (7) комплексной плоскости г.

Можно показать, что этот интеграл равен У 2л.

Тогда

gx2(t) = ( \ - 2 t i ) ~ ^ .

(8)

k

 

Но по основному свойству характеристических функций харак­ теристическая функция суммы независимых случайных величин

равна произведению

характеристических

функций слагаемых.

Поэтому в силу (8) для

(1) получим

 

г , а ( 0 = ( 1 - 2 « ) " Т

(9)

КП

 

Это совпадает с (6). Следовательно, (2) есть плотность вероят­ ности величины (1). Теорема доказана.

13

Графики функции (2) называются кривыми Пирсона. Они асимметричным начиная с ft — 2 имеют по одному максимуму в точке v = n — 2 (рис. 2).

Из (9) по известной формуле

 

найдем

v* =

4 s

<*, <0)

Ч, zn ft,

v, =

ft* + 2п.

 

Отсюда для математического ожидания и дисперсии распределе­

ния Хп

получим

 

 

 

 

 

 

 

 

 

m t>s s v, = ft,

D/2

 

[х2 =

v2 — vj2 = 2ft.

 

Т е о р е м а

2.

Сумма любого числа т независимых случайных

величин, имеющих распределения х2 с.о степенями свободы пи ....

п т,

также имеет распределение х2 со степенью свободы п — п\-\-... +

Доказательство. По условию слагаемые случайные величины

независимы и имеют характеристические функции

 

 

 

ёг2 (*) = (1 —

 

k = 1,.

, m.

 

 

 

2«)

2

,

 

 

 

"k

 

 

 

 

 

 

Поэтому для их суммы имеем характеристическую функцию

 

ё,г (0

m

 

Ш

_Л±

 

- —

 

= П ^ /2 (0

= П ( 1 - 2 ^ )

2

= ( 1 - 2 ti)

2 , n = n t + . . . + n m,

»

k~\ "к

к 1

 

 

 

 

 

 

которая соответствует плотности вероятности (2).

 

Теорема доказана.

 

 

 

 

 

 

Т е о р е м а

3.

Пусть случайная величина %2

представлена в виде

суммы

m

/ 2п= 2

к=1

где случайные величины Vк (k— \, ■■■, tn) в свою очередь пред­ ставляют собой суммы некоторого числа слагаемых. При этом

14

величины Vk независимы и каждая из них имеет распределение х2 тогда и только тогда, когда сумма степеней свободы этих величин

равна п.

Число степеней свободы величины V,, определяется как число независимых слагаемых среди всех слагаемых, образующих эту величину.

Теорему 3, обратную теореме 2, примем без доказательства.

Распределение Стыодента

Рассмотрим величину

где U и V — независимые случайные величины, причем U имеет нормальное нормированное (ш„ = 0, о „ = 1) распределение, а V — распределение х2 с п степенями свободы.

Закон распределения случайной величины Т называется распре­ делением Стыодента* с п степенями свободы.

Т е о р е м а 4. Случайная величина Т имеет плотность вероят­ ности

«+1

2

( 10)

Доказаи’льсгпо. Пусть /„ (м) и fv (у) -плотности вероятностей независимых величин U и V. Тогда плотность вероятности величины

(U, V)

 

1

V

 

2

 

 

где — оо<^и<^оо, о

0.

 

Отсюда для величины Т найдем функцию распределения

F(t) = P ( T < t )

= P ( U < a W ) = Я /« (u)fv (v) du dv =

где

* Стыодент — псевдоним английского статистика Госсета, открывшего это

распределение в 1908 г.

15

Сделаем подстановку

и = х У v

и изменим порядок интегрирования. Тогда

оо

п ~

1

a

vx*

а

со

/f

*

1

(1+а*»)р

/=■(z1) = А Сv

2

е

2 dv j е

2 йд: =

/1 |'с/х |

г;

2

е

7

о

 

 

- «о

 

—«в

о

 

 

 

 

Сделаем подстановку

У= у ( 1 + -*2)^

и учтем, что

Тогда

Отсюда в силу / ( / ) ~ Р ( 0 получим плотность вероятности (10).

Теорема доказана.

Графики функции (10) называются кривыми Стыодента. Они

при

любом н — 1, 2, . . . симметричны относительно оси ординат

(рис.

3). Поэтому при любом п — 1, 2, . . .

 

М 17] —0.

Можно показать, что при п- +оо плотность вероятности распре­ деления Стыодента (10) сходится к плотности вероятности нор­ мального нормированного распределения

f (0 =

1

(И)

~ т= г е

 

УЪ:

 

16

Уже

при « > 3 0 распределение Стыодеита

(10)

практически

можно

заменить нормальным распределением

(11).

Однако при

п30 распределение Стьюдента может сильно отличаться от

нормального. Поэтому его роль очень велика

в микростатистике,

т. е. статистике малых выборок.

совпадает с распре­

При я = 1 распределение Стьюдента (10)

делением Коши

 

' “ ' - Т Т Л т -

которое замечательно тем, что его дисперсия О, ---- оо.

Распределение Фишера

Рассмотрим величину

F

V_.W_

( 12)

птп

где V и W — независимые случайные величины, имеющие

распре­

деления х2 со степенями свободы п и пг.

называется распре­

Закон распределения случайной величины F

делением Фишера с п, ш степенями свободы.

плотность

вероят­

Т е о р е м а 5. Случайная величина F имеет

ности

 

 

где / >

0.

 

 

 

(ш)— плотности вероятностей

Доказательство. Пусть /„ (и) и

независимых величин V и W. Тогда плотность вероятности вели­

чины ( V, W)

 

 

 

 

 

/, И

fw№) = — —

 

 

 

 

 

 

2^Г

 

 

 

 

где у >

0, w >

0.

F

найдем

функцию распределения

Отсюда для

величины

Ф (f) ~ P ( F < f ) = P(v < aW) fv (v) fw (w)dvdw =

 

 

 

 

v < aw

 

 

 

__

 

m

^ w

 

 

A § \ v 2 e 2 w 2 e 2dv dw —

 

 

v aw

 

 

 

 

 

 

~

^

w_ оо»

j i ___^

___

 

 

= Aj w 2

e

2dw f v 2

e 2 dv,

 

 

о

 

0

 

 

2 me

 

 

 

 

 

_________ , 17

Гос. публичная

где

5

А

 

 

 

 

 

1

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

Сделаем подстановку

 

 

 

 

 

 

 

 

 

 

и изменим порядок интегрирования.

Тогда

 

 

 

Ф (f)

— А \ да

 

е

 

 

 

а. __1 -

2 dy

 

 

1dw i

у

2

е

' '

D

 

 

 

 

 

 

 

 

 

 

 

 

1

п+ т

 

 

5“( 1■!

 

 

=

А \ у*

I да

2

— 1

е

У)а>

die.

dy

 

 

1

 

 

оО

Но легко проверить,

что при

р >

О

о*

w

 

 

 

l w ri-e

t3 dw

=

рчН1Г -f 1).

о

 

 

 

 

Поэтому

 

 

пI

п+т

 

 

 

«I» (/)

 

 

 

 

Отсюда в силу ср(/) =

Ф'(/)

получим плотность вероятности (13).

Теорема доказана.

 

 

 

 

Графики функции (13) называются кривыми Фишера. Они асимметричны, имеют длинные «хвосты» и достигают максимума вблизи точки / — 1 (рис. 4).

Квантили

Квантилем, отвечающим вероятности р, называется то значе­ ние х = хр, при котором функция распределения F(х) равна р, т. е.

F(xp) ~ P ( X < х р) = р .

1S

 

Квантиль, отвечающий вероятности

..называется медиа­

ной Me [К].

 

 

Квантили*/, н * 1_р называются симметричными. Если распреде­

ление симметрично относительно нуля, то хр=

 

Применение квантилей основывается на равенстве

 

P(xp ^ X < x q) = q —p,

 

где

и хц— квантили, отвечающие вероятностям р и q.

 

Таблицы квантилей распределений (нормального, %2, Стыодента

и Фишера) приведены в приложении.

с параметрами а и о

 

Квантиль о,, нормального распределения

выражается через квантиль нормального нормированного распре­ деления ир по формуле

v p = a + ш р.

Если величина (12) имеет распределение Фишера (13) с пара­ метрами п, ш, то величина

P - x = ± . = 3L , v _

F m п

также имеет распределение Фишера, но уже с параметрами т , п. Поэтому если fp (n,m)— квантиль распределения Фишера с пара­ метрами п, т, отвечающий вероятности р, то

Р = р [р < /„ (« . >п)\=Р F

 

 

=

P F~'>

1

Iv in,

m)

 

J

 

fp(n, m)

1

F ~ ' <

1

 

 

fp(n,

m)

 

 

откуда

 

 

 

1

 

 

 

(14)

F~l<

=

1

P,

 

no

f P(Л, rn) .

 

 

(15)

 

//)] — \ — p.

Р \ Р~' < f i - P(m,

Сравнив (14) ii (15), получим

1

/,,(/;. in) = ■

h-p(m, n)

Этой (формулой пользуются при нахождении квантилей fp {n,m) распределения Фишера для значений вероятности р, не вошедших в таблицу.

2*

19

Соседние файлы в папке книги из ГПНТБ