Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Агекян Т.А. Теория вероятностей для астрономов и физиков учеб. пособие

.pdf
Скачиваний:
45
Добавлен:
23.10.2023
Размер:
8.81 Mб
Скачать

180

ОЦЕНИВАНИЕ ПАРАМЕТРОВ

РАСПРЕДЕЛЕНИЙ

[ГЛ. 4

 

Стандарты обеих функций

практически одинаковы.

У функции Паренаго меньше средняя абсолютная

вели­

чина (больше средняя светимость), больше по абсолют­ ной величине асимметрия и меньше эксцесс.

Если члены статистического коллектива могут отли­ чаться друг от друга значениями двух или более характе­ ристик, то такой статистический коллектив называется многомерным. Многомерный статистический коллектив может изучаться при помощи аппарата, применяемого для исследования случайных векторов.

§ 50. Случайная выборка из статистического коллектива

Если из статистического коллектива объема т случай­ ным образом извлечь один член, затем, не возвращая его, второй член и т. д., то полученная таким образом сово­ купность значений

Хг, Х а, . . . , Х п

(4.18)

называется случайной безвозвратной выборкой объема п.

Очевидно, что п т.

Если каждый раз после извлечения члена статистиче­ ского коллектива записывать значение аргумента и воз­ вращать член коллектива обратно, то совокупность (4.48)

называется случайной возвратной выборкой объема п.

В этом случае значение п не ограничено.

Если статистический коллектив имеет бесконечно большой объем, то понятия безвозвратной и возвратной выборки совпадают.

В дальнейшем нас будут интересовать случайные вы­ борки из статистического коллектива бесконечно боль­ шого объема. Пусть плотность вероятности аргумента в нем есть / (х). Случайную выборку (4.18) можно рассма­ тривать как случайный n-мерный вектор. Все компоненты этого вектора имеют одну и ту же плотность вероятности и взаимно независимы. Поэтому плотность вероятности случайного вектора (4.18) определяется равенством

П

 

/ п {Хи Х2, . . . , Хп) = П / (xt).

(4.19)

t=l

§ 50] СЛУЧАЙНАЯ ВЫБОРКА 181

Можно рассматривать различные характеристики слу­

чайной выборки, например,

 

выборочную сумму

 

 

и =

П

хь

 

 

 

2

(4.20)

выборочное

среднее *)

 

1=1

 

 

 

 

п

 

 

 

 

 

 

 

 

 

^

^

 

S

X о

(4.21)

выборочную дисперсию

 

i =

l

 

 

 

 

 

 

 

п

 

 

 

 

 

° 2 =

4 - 2

 

- ^ ) 2-

(4-22)

 

 

2=1

 

 

 

наименьший

элемент

выборки — min (Xi,

Х2, . . ., Х п),

наибольший элемент выборки — max (Xi, Х2, . . ., Х„) и другие.

Эти характеристики сами являются случайными вели­

чинами.

Любая

функция выборки т) (Хь Х2, . . ., Х п)

есть случайная

величина.

Пусть

х0 — математическое ожидание аргумента в

статистическом коллективе. Определим математическое ожидание выборочного среднего:

ПП

М Х=*м (±% X .) = -± - 2 мх{= ± п х 0= (4.23)

' г — 1 ' i = l

Таким образом, математическое ожидание выборочного среднего равно математическому ожиданию аргумента статистического коллектива.

Пусть Со — дисперсия аргумента в статистическом коллективе. Найдем дисперсию выборочного среднего

П

4 = м (X - M X f = м ( Х - х0у = м Г- i -S ( - *о)Т=

 

n

L i = l

 

 

2 M (Xj — x ay

2 2 ^ l(Xj — £o) (Xj —a:0)].

 

i=l

гф)

*) Отметим, что, в отличие от предыдущих глав, X здесь обо­

значает не математическое ожидание аргумента X , а среднее но

индивидуальной выборке, т. е. случайную величину.

182

ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ

[ГЛ. 4

Так

как X; и X j взаимно независимы, то М [(Хг — х 0) х

x ( X j — £о)] = 0, если i Ф /. Следовательно,

 

 

4

(4.24)

Дисперсия выборочного среднего равна дисперсии аргу­ мента статистического коллектива, деленной на п.

Найдем математическое ожидание выборочной дис­ персии

ft

Ма2 = М ± -

S

(Xt -

X)* =

 

 

 

 

 

 

г=1

 

 

 

п

 

 

 

 

 

п

 

 

 

 

 

 

= т-м 2 Г(х4- *0) -

 

4- 2 (х,-- *0)п

 

п

 

i= l

L

 

п

3=0

 

 

 

 

 

 

 

п

 

 

 

= ~ г м [ 2

-

xoY - 2 —

2

2 (X, -

х0) (X, -

х0) +

' i= 1

 

 

 

 

г = 1 ; = 1

 

 

 

 

 

 

2 2 (-^i ^о) {Х} Xq)

 

 

 

 

 

г = 1

3= 1

 

, ^2,

_

п — 1 с2

 

 

 

 

1 г ,2

 

(4.25)

 

 

 

1п ^о

2о0 -f- <30]

п

Таким образом, математическое ожидание дисперсии слу­ чайной выборки меньше дисперсии аргумента статисти­ ческого коллектива. Поэтому дисперсию (4.22) случайной выборки называют смещенной дисперсией и наряду с ней рассматривают величину

П

& =

° а = ТГ^Т 2 № - ^ )2-

(4-26)

для которой согласно (4.25) справедливо равенство

M S 2 - а\.

(4.27)

S2 называется несмещенной выборочной дисперсией. Введем также случайную величину

S 51]

ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ

183

математическое ожидание которой

= 4 = 4 (4.29)

'i=l

равно дисперсии выборочного среднего.

Т2 называется приведенной несмещенной выборочной дисперсией, а Т — приведенным несмещенным выбороч­ ным стандартом.

§ 51. Принцип наибольшего правдоподобия. Точечные оценки параметров

На практике функция распределения аргумента (одно­ мерного или многомерного) в статистическом коллективе обычно является неизвестной. Известна лишь случайная выборка из статистического коллектива. Такой случай­ ной выборкой является ряд наблюденных значений ар­ гумента статистического коллектива. Задача состоит в том, чтобы по данным случайной выборки вынести сужде­ ние о распределении аргумента в статистическом коллек­ тиве. При этом возможны два случая.

В первом случае вид функции распределения аргумен­ та в статистическом коллективе известен с точностью до одного или нескольких параметров. Необходимо по дан­ ным случайной выборки произвести оценку неизвестных параметров.

Во втором случае неизвестен сам вид функции распре­ деления аргумента в статистическом коллективе. Необ­ ходимо по случайной выборке произвести проверку ги­ потез о виде функции распределения аргумента в стати­ стическом коллективе.

Сначала рассмотрим первую задачу. Пусть плотность вероятности одномерного аргумента X в статистическом коллективе есть / (х; ах, а2, . . ., ah), где а1: о2, . . ., ak — неизвестные параметры.

Допустим, что получена случайная выборка значений аргумента

184 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ 1ГЛ. 4

Как отмечалось выше (см. (4.19)), плотность вероятно­ сти, отвечающая данной выборке, равна

L (-^1? -^2» • • м Хп, Uij

 

П

. . ., ft^) ==

/ (-^Ц, &1, б&2, . . .,

 

 

(4.31)

Функция L называется функцией правдоподобия.

Принцип наибольшего правдоподобия состоит в том, что выбираются такие значения параметров аи а2, . . ., ah, при которых функция (4.31) достигает максимума. Эти значения называют точечными оценками параметров

^1» &2, . *•, ак.

Для практического решения задачи вместо L удобно рассматривать In L, и тогда согласно правилу определе­ ния максимума функции многих переменных для нахож­ дения точечных оценок параметров aj нужно решить си­

стему

уравнений

 

 

a In L

_ Y д 1а / (Х У

да-

gfc)

да.

р

;' = 1 , 2 , . . ., к.

?

г = 1

/

(4.32)

 

 

 

§52. Принцип наибольшего правдоподобия

встатистическом коллективе

сдискретным аргументом. Точечные оценки вероятностей

Пусть аргумент статистического коллектива может принимать к значений

хи ж2, . . ., хк.

(4.33)

Соответствующие вероятности равны

TYI.

Ри Рг, • • •, Ph,

(4-34)

К

 

причем Pi =

и

2 j Pi =

 

 

 

i—1

 

 

Допустим теперь, что вероятности (4.34) неизвестны,

но из статистического

коллектива извлечена

случайная

(возвратная,

если

он

ограниченного объема)

выборка,

§ 52]

ТОЧЕЧНЫЕ ОЦЕНКИ ВЕРОЯТНОСТЕЙ

185

давшая

соответствующие частоты

 

 

 

 

к

 

 

 

Щ, П2, ...,Щ

( 2 ni =

П)

(4-35)

 

 

' г=1

 

Нужно определить наиболее вероятные значения (4.34). Вероятность случайной выборки (4.35) равна

L (в1( п2, . .., пк] ри р2, ..., рк) = д1[ noJ”! п] Pi'p? . . . p l k.

(4.36)

Значения рх, р2, . . p h можно рассматривать как пара­ метры распределения статистического коллектива.

Принцип наибольшего правдоподобия для статисти­

ческих

коллективов с дискретным аргументом состоит

в том,

что

выбираются такие значения

параметров

ри р2,

. . ., р к, при которых вероятность случайной вы­

борки (4.33)

максимальна. Вследствие того,

что величины

к

(4.34) должны удовлетворять условию 2 Pi — 1, для Неду­

га чения максимума (4.36) необходимо решить систему урав­

нений

 

к

 

 

 

- g f - f a - T

2

л1 = 0 ,

/ = 1 , 2 , . . . , * ,

(4.37)

L

i=i

J

 

 

где у — неопределенный коэффициент Лагранжа. Выпол­ няя дифференцирование и умножая полученные уравнения

на щ , придем к

системе

уравнений

 

п\

 

п1

п%

• Ркк - - ^ - Ч = 0,

7 = 1, 2, . . . , *.

т\ п<&\... Ti

РгРш

 

 

п}

 

 

г

 

 

 

 

(4.38)

 

 

 

 

 

 

 

Из (4.38)

следует,

что ^ от /

не зависит и, следовательно,

 

 

 

 

Р)

=

cnj,

(4.39)

т. е. согласно принципу наибольшего правдоподобия ве­ роятности р] пропорциональны соответствующим часто­ там выборки.

186

ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ

[ГЛ. 4

К

Подставляя (4.39) в равенство ^ й = 1 находим, что

i= l

точечные оценки вероятностей pj нужно принять равными относительным частотам выборки, т. е.

# =

/ = 1, 2, . . к.

(4.40)

Этот результат представляется естественным.

§53. Принцип наибольшего правдоподобия

встатистическом коллективе с нормально распределенным аргументом. Точечные оценки математического ожиданйя

идисперсии аргумента

Статистический коллектив с нормально распределен­ ным аргументом называется нормальным (или нормальной генеральной совокупностью). Он характеризуется двумя параметрами: математическим ожиданием аргумента х 0

и дисперсией аргумента Oq.

 

Пусть получена случайная выборка

 

 

■^1? -^2» • • м

Х п9

(4.41)

ее

выборочное среднее

п

 

 

 

 

 

 

 

 

2 Х .

(4.42)

и

выборочная дисперсия

2=1

 

 

 

 

 

 

П

 

 

 

 

= 4 - 2

№ -

^ )2-

(4.43)

 

Функция правдоподобия

имеет вид

 

 

In L (х0, а0) = — п In (з0 У 2л) —

П

 

 

2 №

— ж0)2. (4.44)

 

 

 

“ О i= l

 

Находим значение х 0, при котором In L максимален, полагая

д L

 

п

 

- 4 2

№ - ^ ) = о,

(4.45)

дхо

 

«=г

 

« 54]

РАСПРЕДЕЛЕНИЕ ВЫБОРОЧНОГО

СРЕДНЕГО

187

поэтому

точечная оценка математического ожидания ар­

гумента

есть

 

П

 

 

 

 

 

 

 

 

 

Хо = 4 -

2 X, = X,

 

 

 

 

 

i=l

 

 

т. е. равна выборочному среднему значению.

 

Далее,

 

 

 

 

д InL

— — + — у, ( X i - X ) 2= - — + 4 - ° 2 = О,

дзо /

бо

б®

 

60 ~ а?

 

откуда находим

 

 

 

(4.46)

 

 

 

(4.47)

 

 

«о

О 2 ,

 

т. е. выборочная дисперсия есть точечная оценка диспер­ сии нормальной генеральной совокупности.

§54. Распределение выборочного среднего значения

истандарта в выборках из нормальной генеральной совокупности

Плотность вероятности выборки (4.41) из нормальной генеральной совокупности при x t = Х%, i = 1, . . ., п,

равна'

П

/ (Хъ

Х п) =

 

_

2°° i=1

»)■

(а0/ 2я)"пв

. (4.48)

Преобразуем сумму, входящую в показатель экспо­

ненты

(4.48),

 

 

 

 

 

П

 

П

 

 

 

 

2

- *о)2 =

2 № -

X) +

(X -

*0)]2 =

 

 

 

 

=

по2 +

п (X ха)2,

(4.49)

где согласно (4.42) и (4.43) X — среднее значение аргу­ мента, а а — стандарт выборки. Следовательно,

-

( Х - Х о ) 1------- I L - 0‘

 

f(x1, x i, . . . , x n)= е 2а°

2°°

(4.50)

где с = (<з0 V 2л)_п.

188

ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ

1ГЛ. 4

Равенство (4.50) показывает, что плотность вероятно­ сти случайного вектора-выборки с подставленными вместо переменных соответствующими значениями этой выборки определяется его средним X и стандартом о. Различные выборки объема п, имеющие одинаковые значения X и а, имеют одинаковые плотности вероятности.

Определим плотность вероятности случайного вектора (? , а). Величина

Д (х, a)dx da

есть вероятность того, что среднее значение и стандарт выборки попадут соответственно в промежутки

[х, X + dx], [а, о +

da],

(4.51)

Д {х, а) dx da = § ... § / (хи ...,

хп) dxx ... dxn,

(4.52)

G

 

 

где G — область пространства {хх, х2, . . ., х п), содержа­ щая все точки, для которых определяемые по формулам, соответствующим (4.42) и (4.43), X и а попадают в область

(4.51).

Согласно (4.50)

плотность

вероятности / (х1г

х2, . . .

. . ., х п) постоянна

в

области G. Ее можно вынести из-

под знака интеграла в (4.52)

 

 

ТТ

tv

 

 

- —

 

— Г 0’

 

Д (X, a) dx do — се 2°°

 

2°°

$ • • • $

(4.53)

 

 

 

 

в

 

Интеграл в правой части (4.53) равен объему области G. Чтобы найти его, заметим, что согласно (4.42) и (4.43) для попадания X жа в область (4.51) необходимо, чтобы в «-мерном пространстве точка (хх, х2, . . ., хп) была за­ ключена между параллельными гиперплоскостями

П

 

2 * i = пх,

(4.54)

г—1

 

п

2 xi = п (X + dx),

(4.55)

i=l

 

S Б*]

РАСПРЕДЕЛЕНИЕ ВЫБОРОЧНОГО СРЕДНЕГО

189

и между

концентрическими

гиперсферами

 

 

П

 

 

 

2 (*г — Я)2 =

ге°2,

(4.56)

г= 1

п

2

( x t - x y ^ n i a + daf.

(4.57)

г = 1

 

 

Гиперплоскость (4.54)

проходит через точку (х,

X, . . .

. . ., X), являющуюся центром гиперсфер (4.56) и (4.57).

Радиус гиперсферы (4.56)

равен а"|/ га• Расстояние между

гиперплоскостями

равно

га dx, разность радиусов ги­

персфер — J^ra da.

 

 

 

Область G есть кольцо ширины У п dx и толщины

У га da, заключенное между двумя гиперсферами и двумя гиперплоскостями. Сечение га-мерной гиперсферы плоско­ стью, проходящей через центр, образует (га 1)-мерную гиперсферу того же радиуса. Объем (га — 1)-мерной ги­ персферы пропорционален (га — 1)-й степени ее радиуса, а площадь ее поверхности пропорциональна (га — 2)-й степени радиуса. Объем области Gравен произведению пло­ щади поверхности (га — 1)-мерной гиперсферы (длина ок­ ружности кольца) на ширину и толщину кольца. Сле­ довательно, объем

^ . . . § dxx .. . dxn = C1an"2 dx da,

(4.58)

G

 

где все множители, содержащие степени га, включены в коэффициент Сх.

Подставляя (4.58) в (4.53), находим

 

— ; т (х- х«)— т "

dx da. (4.59)

(х, a) dx da = С2оп-ае 2 0

2 0

Правая часть (4.59) разбивается

на два

множителя,

из которых один зависит только от X, а второй только от а.

Из этого следует, что случайные переменные X и о не

зависят друг от друга. Выборочное

среднее и стандарт

Соседние файлы в папке книги из ГПНТБ