
книги из ГПНТБ / Агекян Т.А. Теория вероятностей для астрономов и физиков учеб. пособие
.pdf180 |
ОЦЕНИВАНИЕ ПАРАМЕТРОВ |
РАСПРЕДЕЛЕНИЙ |
[ГЛ. 4 |
|
Стандарты обеих функций |
практически одинаковы. |
|
У функции Паренаго меньше средняя абсолютная |
вели |
чина (больше средняя светимость), больше по абсолют ной величине асимметрия и меньше эксцесс.
Если члены статистического коллектива могут отли чаться друг от друга значениями двух или более характе ристик, то такой статистический коллектив называется многомерным. Многомерный статистический коллектив может изучаться при помощи аппарата, применяемого для исследования случайных векторов.
§ 50. Случайная выборка из статистического коллектива
Если из статистического коллектива объема т случай ным образом извлечь один член, затем, не возвращая его, второй член и т. д., то полученная таким образом сово купность значений
Хг, Х а, . . . , Х п |
(4.18) |
называется случайной безвозвратной выборкой объема п.
Очевидно, что п т.
Если каждый раз после извлечения члена статистиче ского коллектива записывать значение аргумента и воз вращать член коллектива обратно, то совокупность (4.48)
называется случайной возвратной выборкой объема п.
В этом случае значение п не ограничено.
Если статистический коллектив имеет бесконечно большой объем, то понятия безвозвратной и возвратной выборки совпадают.
В дальнейшем нас будут интересовать случайные вы борки из статистического коллектива бесконечно боль шого объема. Пусть плотность вероятности аргумента в нем есть / (х). Случайную выборку (4.18) можно рассма тривать как случайный n-мерный вектор. Все компоненты этого вектора имеют одну и ту же плотность вероятности и взаимно независимы. Поэтому плотность вероятности случайного вектора (4.18) определяется равенством
П |
|
/ п {Хи Х2, . . . , Хп) = П / (xt). |
(4.19) |
t=l
§ 50] СЛУЧАЙНАЯ ВЫБОРКА 181
Можно рассматривать различные характеристики слу
чайной выборки, например, |
|
выборочную сумму |
||||
|
|
и = |
П |
хь |
|
|
|
|
2 |
(4.20) |
|||
выборочное |
среднее *) |
|
1=1 |
|
|
|
|
|
п |
|
|
||
|
|
|
|
|
|
|
|
^ |
^ |
|
S |
X о |
(4.21) |
выборочную дисперсию |
|
i = |
l |
|
||
|
|
|
|
|||
|
|
п |
|
|
|
|
|
° 2 = |
4 - 2 |
|
№ |
- ^ ) 2- |
(4-22) |
|
|
2=1 |
|
|
|
|
наименьший |
элемент |
выборки — min (Xi, |
Х2, . . ., Х п), |
наибольший элемент выборки — max (Xi, Х2, . . ., Х„) и другие.
Эти характеристики сами являются случайными вели
чинами. |
Любая |
функция выборки т) (Хь Х2, . . ., Х п) |
есть случайная |
величина. |
|
Пусть |
х0 — математическое ожидание аргумента в |
статистическом коллективе. Определим математическое ожидание выборочного среднего:
ПП
М Х=*м (±% X .) = -± - 2 мх{= ± п х 0= (4.23)
' г — 1 ' i = l
Таким образом, математическое ожидание выборочного среднего равно математическому ожиданию аргумента статистического коллектива.
Пусть Со — дисперсия аргумента в статистическом коллективе. Найдем дисперсию выборочного среднего
П
4 = м (X - M X f = м ( Х - х0у = м Г- i -S ( - *о)Т=
|
n |
L i = l |
|
|
|
— |
2 M (Xj — x ay |
2 2 ^ l(Xj — £o) (Xj —a:0)]. |
|
i=l |
гф) |
*) Отметим, что, в отличие от предыдущих глав, X здесь обо
значает не математическое ожидание аргумента X , а среднее но
индивидуальной выборке, т. е. случайную величину.
182 |
ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ |
[ГЛ. 4 |
Так |
как X; и X j взаимно независимы, то М [(Хг — х 0) х |
|
x ( X j — £о)] = 0, если i Ф /. Следовательно, |
|
|
|
4 |
(4.24) |
Дисперсия выборочного среднего равна дисперсии аргу мента статистического коллектива, деленной на п.
Найдем математическое ожидание выборочной дис персии
ft
Ма2 = М ± - |
S |
(Xt - |
X)* = |
|
|
|
|
|
|
|
г=1 |
|
|
|
п |
|
|
|
|
|
|
п |
|
|
|
|
|
|
|
= т-м 2 Г(х4- *0) - |
|
4- 2 (х,-- *0)п |
|
||||||
п |
|
i= l |
L |
|
п |
3=0 |
|
|
|
|
|
|
|
п |
|
|
|
||
= ~ г м [ 2 |
№ |
- |
xoY - 2 — |
2 |
2 (X, - |
х0) (X, - |
х0) + |
||
' i= 1 |
|
|
|
|
г = 1 ; = 1 |
|
|
|
|
|
|
|
2 2 (-^i — ^о) {Х} — Xq) |
|
|
||||
|
|
|
г = 1 |
3= 1 |
|
, ^2, |
_ |
п — 1 с2 |
|
|
|
|
— |
1 г ,2 |
|
(4.25) |
|||
|
|
|
1п ^о — |
2о0 -f- <30] |
— |
п |
Таким образом, математическое ожидание дисперсии слу чайной выборки меньше дисперсии аргумента статисти ческого коллектива. Поэтому дисперсию (4.22) случайной выборки называют смещенной дисперсией и наряду с ней рассматривают величину
П
& = |
° а = ТГ^Т 2 № - ^ )2- |
(4-26) |
для которой согласно (4.25) справедливо равенство
M S 2 - а\. |
(4.27) |
S2 называется несмещенной выборочной дисперсией. Введем также случайную величину
S 51] |
ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ |
183 |
математическое ожидание которой
= 4 = 4 (4.29)
'i=l
равно дисперсии выборочного среднего.
Т2 называется приведенной несмещенной выборочной дисперсией, а Т — приведенным несмещенным выбороч ным стандартом.
§ 51. Принцип наибольшего правдоподобия. Точечные оценки параметров
На практике функция распределения аргумента (одно мерного или многомерного) в статистическом коллективе обычно является неизвестной. Известна лишь случайная выборка из статистического коллектива. Такой случай ной выборкой является ряд наблюденных значений ар гумента статистического коллектива. Задача состоит в том, чтобы по данным случайной выборки вынести сужде ние о распределении аргумента в статистическом коллек тиве. При этом возможны два случая.
В первом случае вид функции распределения аргумен та в статистическом коллективе известен с точностью до одного или нескольких параметров. Необходимо по дан ным случайной выборки произвести оценку неизвестных параметров.
Во втором случае неизвестен сам вид функции распре деления аргумента в статистическом коллективе. Необ ходимо по случайной выборке произвести проверку ги потез о виде функции распределения аргумента в стати стическом коллективе.
Сначала рассмотрим первую задачу. Пусть плотность вероятности одномерного аргумента X в статистическом коллективе есть / (х; ах, а2, . . ., ah), где а1: о2, . . ., ak — неизвестные параметры.
Допустим, что получена случайная выборка значений аргумента
184 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ 1ГЛ. 4
Как отмечалось выше (см. (4.19)), плотность вероятно сти, отвечающая данной выборке, равна
L (-^1? -^2» • • м Хп, Uij |
|
П |
. . ., ft^) == |
/ (-^Ц, &1, б&2, . . ., |
|
|
|
(4.31) |
Функция L называется функцией правдоподобия.
Принцип наибольшего правдоподобия состоит в том, что выбираются такие значения параметров аи а2, . . ., ah, при которых функция (4.31) достигает максимума. Эти значения называют точечными оценками параметров
^1» &2, . *•, ак.
Для практического решения задачи вместо L удобно рассматривать In L, и тогда согласно правилу определе ния максимума функции многих переменных для нахож дения точечных оценок параметров aj нужно решить си
стему |
уравнений |
|
|
a In L |
_ Y д 1а / (Х У |
да- |
gfc) |
да. |
р |
;' = 1 , 2 , . . ., к. |
|
? |
г = 1 |
/ |
(4.32) |
|
|
|
§52. Принцип наибольшего правдоподобия
встатистическом коллективе
сдискретным аргументом. Точечные оценки вероятностей
Пусть аргумент статистического коллектива может принимать к значений
хи ж2, . . ., хк. |
(4.33) |
Соответствующие вероятности равны
TYI.
Ри Рг, • • •, Ph, |
(4-34) |
К |
|
причем Pi = |
и |
2 j Pi = |
|
|
|
|
i—1 |
|
|
Допустим теперь, что вероятности (4.34) неизвестны, |
||||
но из статистического |
коллектива извлечена |
случайная |
||
(возвратная, |
если |
он |
ограниченного объема) |
выборка, |
§ 52] |
ТОЧЕЧНЫЕ ОЦЕНКИ ВЕРОЯТНОСТЕЙ |
185 |
||
давшая |
соответствующие частоты |
|
|
|
|
|
к |
|
|
|
Щ, П2, ...,Щ |
( 2 ni = |
П) • |
(4-35) |
|
|
' г=1 |
• |
|
Нужно определить наиболее вероятные значения (4.34). Вероятность случайной выборки (4.35) равна
L (в1( п2, . .., пк] ри р2, ..., рк) = д1[ noJ”! п] Pi'p? . . . p l k.
(4.36)
Значения рх, р2, . . p h можно рассматривать как пара метры распределения статистического коллектива.
Принцип наибольшего правдоподобия для статисти
ческих |
коллективов с дискретным аргументом состоит |
||
в том, |
что |
выбираются такие значения |
параметров |
ри р2, |
. . ., р к, при которых вероятность случайной вы |
||
борки (4.33) |
максимальна. Вследствие того, |
что величины |
к
(4.34) должны удовлетворять условию 2 Pi — 1, для Неду
га чения максимума (4.36) необходимо решить систему урав
нений
|
к |
|
|
|
- g f - f a - T |
2 |
л1 = 0 , |
/ = 1 , 2 , . . . , * , |
(4.37) |
L |
i=i |
J |
|
|
где у — неопределенный коэффициент Лагранжа. Выпол няя дифференцирование и умножая полученные уравнения
на щ , придем к |
системе |
уравнений |
|
|||||
п\ |
|
п1 |
п% |
• Ркк - - ^ - Ч = 0, |
7 = 1, 2, . . . , *. |
|||
т\ п<&\... Ti |
РгРш |
|||||||
|
|
п} |
|
|||||
|
г |
|
|
|
|
(4.38) |
||
|
|
|
|
|
|
|
||
Из (4.38) |
следует, |
что ^ от / |
не зависит и, следовательно, |
|||||
|
|
|
|
Р) |
= |
cnj, |
(4.39) |
т. е. согласно принципу наибольшего правдоподобия ве роятности р] пропорциональны соответствующим часто там выборки.
186 |
ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ |
[ГЛ. 4 |
К
Подставляя (4.39) в равенство ^ й = 1 находим, что
i= l
точечные оценки вероятностей pj нужно принять равными относительным частотам выборки, т. е.
# = |
/ = 1, 2, . . к. |
(4.40) |
Этот результат представляется естественным.
§53. Принцип наибольшего правдоподобия
встатистическом коллективе с нормально распределенным аргументом. Точечные оценки математического ожиданйя
идисперсии аргумента
Статистический коллектив с нормально распределен ным аргументом называется нормальным (или нормальной генеральной совокупностью). Он характеризуется двумя параметрами: математическим ожиданием аргумента х 0
и дисперсией аргумента Oq.
|
Пусть получена случайная выборка |
|
||
|
■^1? -^2» • • м |
Х п9 |
(4.41) |
|
ее |
выборочное среднее |
п |
|
|
|
|
|
|
|
|
|
2 Х . |
(4.42) |
|
и |
выборочная дисперсия |
2=1 |
|
|
|
|
|
||
|
П |
|
|
|
|
= 4 - 2 |
№ - |
^ )2- |
(4.43) |
|
Функция правдоподобия |
имеет вид |
|
|
|
In L (х0, а0) = — п In (з0 У 2л) — |
П |
|
|
|
2 № |
— ж0)2. (4.44) |
||
|
|
|
“ О i= l |
|
Находим значение х 0, при котором In L максимален, полагая
д 1ч L |
|
п |
|
|
- 4 2 |
№ - ^ ) = о, |
(4.45) |
||
дхо |
||||
|
3о |
«=г |
|
« 54] |
РАСПРЕДЕЛЕНИЕ ВЫБОРОЧНОГО |
СРЕДНЕГО |
187 |
|||
поэтому |
точечная оценка математического ожидания ар |
|||||
гумента |
есть |
|
П |
|
|
|
|
|
|
|
|
||
|
|
Хо = 4 - |
2 X, = X, |
|
|
|
|
|
|
i=l |
|
|
|
т. е. равна выборочному среднему значению. |
|
|||||
Далее, |
|
|
|
|
||
д InL |
— — + — у, ( X i - X ) 2= - — + 4 - ° 2 = О, |
|||||
дзо / |
||||||
бо |
б® |
|
60 ~ а? |
|
||
откуда находим |
|
|
|
(4.46) |
||
|
|
|
(4.47) |
|||
|
|
«о |
О 2 , |
|
т. е. выборочная дисперсия есть точечная оценка диспер сии нормальной генеральной совокупности.
§54. Распределение выборочного среднего значения
истандарта в выборках из нормальной генеральной совокупности
Плотность вероятности выборки (4.41) из нормальной генеральной совокупности при x t = Х%, i = 1, . . ., п,
равна'
П
/ (Хъ |
Х п) = |
|
_ |
2°° i=1 |
»)■ |
|
(а0/ 2я)"пв |
. (4.48) |
|||||
Преобразуем сумму, входящую в показатель экспо |
||||||
ненты |
(4.48), |
|
|
|
|
|
П |
|
П |
|
|
|
|
2 № |
- *о)2 = |
2 № - |
X) + |
(X - |
*0)]2 = |
|
|
|
|
= |
по2 + |
п (X — ха)2, |
(4.49) |
где согласно (4.42) и (4.43) X — среднее значение аргу мента, а а — стандарт выборки. Следовательно,
- |
( Х - Х о ) 1------- I L - 0‘ |
|
f(x1, x i, . . . , x n)= е 2а° |
2°° |
(4.50) |
где с = (<з0 V 2л)_п.
188 |
ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ |
1ГЛ. 4 |
Равенство (4.50) показывает, что плотность вероятно сти случайного вектора-выборки с подставленными вместо переменных соответствующими значениями этой выборки определяется его средним X и стандартом о. Различные выборки объема п, имеющие одинаковые значения X и а, имеют одинаковые плотности вероятности.
Определим плотность вероятности случайного вектора (? , а). Величина
Д (х, a)dx da
есть вероятность того, что среднее значение и стандарт выборки попадут соответственно в промежутки
[х, X + dx], [а, о + |
da], |
(4.51) |
Д {х, а) dx da = § ... § / (хи ..., |
хп) dxx ... dxn, |
(4.52) |
G |
|
|
где G — область пространства {хх, х2, . . ., х п), содержа щая все точки, для которых определяемые по формулам, соответствующим (4.42) и (4.43), X и а попадают в область
(4.51).
Согласно (4.50) |
плотность |
вероятности / (х1г |
х2, . . . |
||
. . ., х п) постоянна |
в |
области G. Ее можно вынести из- |
|||
под знака интеграла в (4.52) |
|
|
|||
ТТ |
— |
tv |
|
|
|
- — |
|
— Г 0’ |
|
||
Д (X, a) dx do — се 2°° |
|
2°° |
$ • • • $ |
(4.53) |
|
|
|
|
|
в |
|
Интеграл в правой части (4.53) равен объему области G. Чтобы найти его, заметим, что согласно (4.42) и (4.43) для попадания X жа в область (4.51) необходимо, чтобы в «-мерном пространстве точка (хх, х2, . . ., хп) была за ключена между параллельными гиперплоскостями
П |
|
2 * i = пх, |
(4.54) |
г—1 |
|
п
2 xi = п (X + dx), |
(4.55) |
i=l |
|
S Б*] |
РАСПРЕДЕЛЕНИЕ ВЫБОРОЧНОГО СРЕДНЕГО |
189 |
|
и между |
концентрическими |
гиперсферами |
|
|
П |
|
|
|
2 (*г — Я)2 = |
ге°2, |
(4.56) |
г= 1
п
2 |
( x t - x y ^ n i a + daf. |
(4.57) |
|
г = 1 |
|
|
|
Гиперплоскость (4.54) |
проходит через точку (х, |
X, . . . |
|
. . ., X), являющуюся центром гиперсфер (4.56) и (4.57). |
|||
Радиус гиперсферы (4.56) |
равен а"|/ га• Расстояние между |
||
гиперплоскостями |
равно |
га dx, разность радиусов ги |
|
персфер — J^ra da. |
|
|
|
Область G есть кольцо ширины У п dx и толщины
У га da, заключенное между двумя гиперсферами и двумя гиперплоскостями. Сечение га-мерной гиперсферы плоско стью, проходящей через центр, образует (га — 1)-мерную гиперсферу того же радиуса. Объем (га — 1)-мерной ги персферы пропорционален (га — 1)-й степени ее радиуса, а площадь ее поверхности пропорциональна (га — 2)-й степени радиуса. Объем области Gравен произведению пло щади поверхности (га — 1)-мерной гиперсферы (длина ок ружности кольца) на ширину и толщину кольца. Сле довательно, объем
^ . . . § dxx .. . dxn = C1an"2 dx da, |
(4.58) |
G |
|
где все множители, содержащие степени га, включены в коэффициент Сх.
Подставляя (4.58) в (4.53), находим |
|
|
— ; т (х- х«)— т " |
dx da. (4.59) |
|
/х (х, a) dx da = С2оп-ае 2 0 |
2 0 |
|
Правая часть (4.59) разбивается |
на два |
множителя, |
из которых один зависит только от X, а второй только от а. |
||
Из этого следует, что случайные переменные X и о не |
||
зависят друг от друга. Выборочное |
среднее и стандарт |