книги из ГПНТБ / Агекян Т.А. Теория вероятностей для астрономов и физиков учеб. пособие
.pdf200 |
ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ |
1ГЛ. 4 |
функция
п |
т |
|
|
Ф (Zi,-г2>. . хт) = 2 (Zi — 2 aiA' |
= |
min. (4.88) |
|
i=l ' |
j=l |
|
|
Функция (4.88) имеет |
минимум |
при |
значениях |
хх, ха, . . ., хт, обращающих в нуль все ее частные про изводные:
пm
* |
i= l |
4 |
J=1 |
7 |
|
|
n |
|
m |
n |
|
= 1, 2, ..., m. |
|
= 2 fflifcZi — |
2 |
2 ai/Aj = °> |
(4.89) |
|||
i=l |
|
J—X |
i=l |
|
|
|
Если |
обозначить |
|
|
|
||
|
|
|
|
П |
|
|
|
|
|
C/cj = |
2 |
ij |
(4.90) |
|
|
|
|
i=l |
|
|
и заменить z4 на y t, то система уравнений (4.89) в развер нутом виде запишется так:
|
|
|
|
п |
|
|
Cll^l + Ci2^2 Н" • • • + |
с 1тх т — |
2 |
|
|
||
|
|
|
|
i=l |
|
|
|
|
|
|
n |
|
|
с21х 1 “Ь С22 ^ 2 |
+ |
• • • 4" |
с2тх т = |
2 |
а 12Уь |
(4.91) |
|
|
|
|
i=l |
|
|
|
|
|
|
п |
|
|
Cmlxl 1" С |
i |
• • • ! |
Сттхт |
2 |
^ *!П ’ |
|
|
|
|
|
4 = 1 |
|
|
Система уравнений (4.91) называется нормальной си стемой избыточной системы (4.81). Матрица ее коэффициен тов, очевидно, квадратная и симметричная.
В высшей алгебре доказывается следующая теорема: если матрица (4.84) имеет ранг пг, то матрица (квадратная) коэффициентов, построенных по правилу (4.90), имеет ранг т.
Раз ранг матрицы || с^ || равен т, то определитель нормальной системы (4.91) отличен от нуля и система
§ 57] СУММА КВАДРАТОВ ОСТАЮЩИХСЯ ПОГРЕШНОСТЕЙ 201
имеет единственное решение. Согласно формулам Крамера
|
|
щ= |
П |
hm* |
|
|
|
|
2 |
(4.92) |
|||
где |
|
|
|
i= i |
|
|
|
|
|
т |
|
|
|
|
|
|
|
|
|
|
|
b'ii |
~ |
~jj 2 |
Dfrj, |
(4.93) |
|
|
|
|
|
/С=1 |
|
|
D — определитель |
системы |
(4.91), D hj — алгебраическое |
||||
дополнение элемента |
ск1. |
|
|
|
||
Таким образом, чтобы получить точечные оценки ве |
||||||
личин х1з х2, . . ., |
Хф |
необходимо по |
коэффициентам |
|||
избыточной системы построить нормальную систему (4.91) и решить ее при помощи формул (4.92) и (4.93), где вместо yi подставлены результаты измерений Y t.
Отметим важное свойство найденного решения. Срав нение (4.88) и (4.86) показывает, что сумма квадратов не
вязок |
условных |
уравнений минимальна, |
когда вме |
сто х1з |
х2, . . ., хт |
подставлены их точечные |
оценки. В |
этом случае невязки называются остающимися погреш ностями.
Требование к совокупности неизвестных, чтобы она обращала в минимум сумму квадратов невязок для из быточной системы (4.81), называется принципом наимень ших квадратов или принципом Лежандра. Мы видим,
что совокупность значений хг, х2, . . ., хт, полученных при решении нормальной системы (4.91), отвечает не только принципу максимального правдоподобия, но и принципу наменыних квадратов.
§ 57. Сумма квадратов остающихся погрешностей для точечных оценок неизвестных
Рассмотрим систему равенств (4.86). Помножим каж дое из равенств на aift и полученные равенства просумми руем. После изменения порядка суммирования в двойной сумме и использования (4.90) находим
n |
п |
п |
т |
п |
т |
2 aikei = |
2 |
— 2 |
в» 2 |
auxi = 2 |
— 2 ckjxj- |
1=1 |
1=1 |
1—1 |
i=1 |
1=1 |
;=1 |
(4.94)
202 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ [ГЛ. 4
Так как точечные оценки х1г |
х2, . . ., хт |
удовлетворя |
ют нормальной системе (4.91), |
то из (4.94) |
следуют соот |
ношения |
|
|
2 я г Л = 0, &= |
1, 2, ... , т , |
(4.95) |
1 = 1 |
|
|
которые справедливы для остаточных погрешностей, т. е. когда в условные уравнения подставлены точечные оцен ки неизвестных.
Помножим каждое из равенств (4.86) на ег; полученные равенства просуммируем и изменим порядок суммирова
ния в |
двойной |
сумме: |
|
|
|
|
п |
п |
п |
т |
|
|
|
2 Ej — |
2 ^1®1 |
2 2 |
®i3^j ~ |
|
|
|
= 1 |
i = l |
i = l |
3 = 1 |
m |
n |
|
|
|
|
n |
|
||
|
|
|
= 2 Y & - |
2 ^ з |
2 |
(4-96) |
|
|
|
i = l |
3 = 1 |
1 = 1 |
|
Согласно (4.95) двойная сумма в (4.96) равна нулю и, следовательно,
ПП
2 |
ef = 2 Y&. |
(4.97) |
1 = 1 |
1 = 1 |
|
Помножим каждое из равенств (4.86) |
на Y t и просумми |
||||
руем: |
|
|
|
|
|
n |
n |
п |
т |
|
|
2 |
= 2 и - |
2 |
^ |
2 w |
(4.98) |
1 = 1 |
1 = 1 |
1 = 1 |
3 = 1 |
|
|
Изменив порядок суммирования в двойной сумме и исполь зовав (4.97), находим
n |
п |
т |
п |
|
2 « ? = |
2 |
y ? - 2 * i |
2 «1з^1. |
(4.99) |
1 = 1 |
1 = 1 |
3 = 1 |
1 = 1 |
|
Равенства (4.97) и (4.99) справедливы, если в них фигури руют точечные оценки xlt х2, . . хт и соответствующие им остающиеся погрешности.
§ 58] |
ОЦЕНИВАНИЕ НЕИЗВЕСТНЫХ |
203 |
§58. Оценивание неизвестных в способе наименьших квадратов при помощи доверительного интервала
Когда система уравнений избыточная, условные урав нения вследствие случайных ошибок в измерениях y t противоречат друг другу, и сумма квадратов остаточных погрешностей отлична от нуля.
Используя (4.92), напишем равенство (4.99) в виде
n n m п п
2 в? = 2 у? - |
2 |
2 w |
2 <Mi, |
(4.Ю0) |
|
1=1 |
1=1 |
3=1 |
8=1 |
1=1 |
|
где коэффициенты bsj определяются выражениями (4.93). В равенстве (4.100) правая часть представлена непосред ственно через измеренные величины Y, и коэффициенты избыточной системы.
Измерения Y t являются случайными величинами, по этому определяемая ими сумма квадратов остающихся погрешностей также является случайной величиной. Под
ставим в (4.100) |
равенства |
(4.82) и выполним простейшие |
||||
преобразования: |
|
|
|
|
|
|
2 Vi + 2 2 У$1 + 2 а» — |
|
|
||||
1=1 |
|
1=1 |
1=1 |
|
|
|
т |
п |
n |
т |
п |
п |
|
2 |
2 |
2 |
2 |
2 |
2 |
®i3^i |
3=1 |
8=1 |
1=1 |
3=1 |
8=1 |
1=1 |
|
т |
п |
п |
т |
n |
п |
|
2 2 Ms 2 аиУ1 —2 2 м* 2 Мп (4.Ю1) |
||||||
3 = 1 8 = 1 |
1 = 1 |
3 = 1 8 = 1 |
1 = 1 |
|
||
Как уже отмечалось выше, если бы в измерениях величин Di случайные ошибки были равны нулю, то избыточная система (4.81) с Y t вместо yt решалась бы точно, сумма квадратов остающихся погрешностей была бы равна нулю.
Правая часть равенства (4.100) при 6*=0 равна нулю. Следовательно, первый и четвертый члены правой части (4.101) взаимно уничтожаются.
204 |
ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИИ |
ЕГЛ. 4 |
||
Найдем |
математическое |
ожидание случайной вели- |
||
|
П |
|
|
|
чины |
2 ®?- |
Так как измерения различных |
взаимно |
|
|
i=l |
|
|
|
независимы, |
М бД = 0, |
если s=j=i. |
(4.102) |
|
|
|
|||
Следовательно, в последней сумме правой части (4.101) отличны от нуля математические ожидания лишь тех сла гаемых, у которых s = i. Очевидно также, что
Mbi |
= |
0, |
(4.103) |
МЬ\ |
= |
0о |
(4.104) |
для всех значений г; а 0 — средняя квадратическая ошиб
ка |
измерений |
г/г. |
Итак, |
получаем |
|
|
|
|
|
|
п |
|
т п |
|
|
|
|
М 2 |
е? = т г0 — б» 2 2 |
а«А>- |
(4.105) |
||
|
|
|
t=l |
|
j=l 8=1 |
|
|
|
При помощи равенств (4.93) и (4.90) находим |
|
|||||
п |
|
п |
т |
|
|
|
|
2 |
= ~jj~2 |
|
2 |
= |
|
|
|
8=1 |
|
8=1 |
Л=1 |
т |
|
|
|
|
|
|
т |
п |
|
|
|
|
= |
2 Ао 2 |
в»*в« = -1У 2 |
= 1 |
(4-106) |
||
|
|
/с=1 |
8=1 |
fe=l |
|
|
|
независимо от значения |
Поэтому получаем |
|
|||||
|
|
|
|
гг |
|
|
|
|
|
|
М 2 « ! = ( в - и ) aS. |
(4-107) |
|||
|
|
|
|
г=1 |
|
|
|
|
В общем случае средние квадратические ошибки из |
||||||
мерений у; |
отличны от 0о'и различны между собой. Их ве |
||||||
личины определяются соотношением коэффициентов из быточной системы условных уравнений.
Точечные оценки неизвестных х} выражаются через измеряемые величины Y , при помощи линейных соотноше ний (4.92). Поэтому согласно закону распространения
средней ошибки |
|
П |
(4.108) |
а? = ао 2 Ь1- |
|
г=i |
|
§ 581 |
ОЦЕНИВАНИЕ НЕИЗВЕСТНЫХ |
205 |
Используя (4.93), находим
пп т
= |
W |
f = |
= i |
i = i ' r= i |
' |
m m |
n |
m m |
^ 7)T 21 2j |
2 aihaik |
= ~jjT 2j |
21 Dhichk- (4.109) |
k=4 h — l |
1=1 |
fc— 1 |
h=*1 |
Рассмотрим |
выражение |
|
|
|
mj |
|
|
|
S |
|
(4.HO) |
|
Л = 1 |
|
|
Если к Ф /, то (4.110) представляет собой сумму произ ведений алгебраических дополнений элементов /-го столб ца определителя на соответствующие элементы другого столбца, что, как известно из теории определителей, рав но нулю. Для значений жв к = j выражение (4.110) рав но определителю D. Поэтому получаем
2 Ь у = ^ г . |
(4-111) |
1=1 |
|
и искомые соотношения для средних квадратических оши бок таковы:
0} |
|
|
/ = |
1, 2,..., т. |
(4.112) |
Сравнивая (4.107) |
и (4.112), находим |
|
|||
П |
|
|
|
|
|
м 2 |
е? = |
(и — т) |
И |
(4.113) |
|
1 = 1 |
|
|
|
|
|
Напишем это равенство в виде |
|
|
|||
М п — т |
Dn |
|
4 |
(4.114) |
|
D |
i—l |
||||
|
|
|
|
|
|
исравним его с равенством (4.29).
Вобоих этих равенствах случайная величина, стоящая под знаком математического ожидания, есть произведение
206 |
ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ |
[ГЛ. 4 |
постоянного коэффициента на случайную величину, яв ляющуюся суммой квадратов отклонений от значений вы ражений, которые получаются, если в эти выражения вме сто измеряемых величин подставить их точечные оценки. Что касается постоянных коэффициентов, то множителю (п — 1) в равенстве (4.29), которое относится к задаче с одной измеряемой величиной, в равенстве (4.114), от носящемся к задаче с т измеряемыми величинами, соот ветствует множитель (гг — т). Множителю п в равенстве (4.29) соответствует множитель DIDjj в равенстве (4.114).
§59. Проверка гипотез
офункции распределения аргумента. Критерий согласия
Одной из задач математической статистики является вынесение суждения о функции распределения аргумента в статистическом коллективе по полученной случайной выборке.
До сих пор предполагалось, что закон рапределения аргумента известен с точностью до параметров, которые нужно было оценить. Рассмотрим теперь задачу, состоя щую в том, чтобы проверить некоторую гипотезу о функции распределения аргумента в статистическом коллективе, определив, совместима ли она с данными полученной слу чайной выборки из статистического коллектива.
Предположим, что следует проверить гипотезу состо ящую в том, что плотность вероятности аргемента в стати стическом коллективе есть / (х). Разобьем промежуток возможных значений х на к интервалов
ta-i, аД, |
1 = 1 , 2 , . . . , * . |
(4.115) |
Тогда вероятность того, что аргумент статистического коллектива примет значение внутри i-го интервала, равна
xi |
|
Р%= $ / (х)dx, i = 1, 2, ...,*. |
(4.116) |
Допустим, что в полученной случайной выборке объема п частоты, соответствующие интервалам аргумента (4.115),
§ 59] ПРОВЕРКА ГИПОТЕЗ О ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 20?
оказались равными |
|
пг15 т2, . . ., m h. |
(4.117) |
Не противоречит ли этот результат принятой гипотезе? Если объем случайной выборки равен п, то при справед ливости гипотезы математические ожидания соответству ющих интервалам (4.115) частот равны
npi, пр2, . . ., nph. |
(4.118) |
Совокупность отклонений полученных частот от их ма
тематических ожиданий |
должна |
показать, |
можно |
ли |
||
их объяснять случайностью или |
же следует считать, |
что |
||||
принятая гипотеза |
неверна. |
|
|
|
|
|
Для решения задачи используем результаты §47, в ко |
||||||
тором было показано, что случайная величина |
|
|||||
|
и = : 2 — |
ппПР. ^ |
(4.119) |
|||
при |
п ’/* (m-i |
npi)3 (npt) */* —*■0, |
|
|||
н- >оо, |
|
|||||
|
< = 1, |
2.......... Л, |
|
|
||
имеет асимптотическое распределение, такое же, как и случайная величина %2, рассмотренная в § 46 и соответ ствующая числу слагаемых в сумме (3.120), равном к—1,
т. е. Хк-1- Как показывает ход доказательства в § 47, уменьшение на 1 номера при %2 вызвано тем, что среди слагаемых в сумме (4.119) независимых всего к — 1, так как должно выполняться условие нормировки
кк
S mi = 2 nPi = п- |
(4.121) |
i=l i=l
Если принятая в гипотезе функция распределения / (х) определяется I параметрами, то, чтобы вычислить вероят ности (4.116), нужно сначала определить значения пара метров. Для этого можно применить метод наибольшего правдоподобия. Как было показано в § 51, при этом оп ределяется I соотношений (4.32), связывающих функцию распределения со значениями аргумента в случайной
208 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РА СП РЕДЕЛЕН И Й [ГЛ. 4
выборке. Это равносильно тому, что в сумме (4.119) еще I слагаемых будут зависимыми от других, число незави симых слагаемых станет равным к — I — 1. Соответствен но рассуждения, аналогичные проведенным в § 47, пока жут, что функция распредления величины U, определяе мой равенством (4.119), совпадает с функцией распреде
ления Хх’ где к = к — I — 1.
Таким образом, если функция / (х) описывается I па раметрами, которые вычислены методом наибольшего правдоподобия по случайной выборке, определяемой чи слами (4.117), то случайная величина (4.119), где p t задаются равенствами (4.116), при выполнении условий (4.120) имеет асимптотическое распределение с плотностью
где % — к — I — 1.
Если гипотеза верна, то отличие величины U от нуля вызывается случайными отклонениями частот ntj от их математических ожиданий npi. Интеграл
равен, следовательно, вероятности того, что при справед ливости проверяемой гипотезы величина (4.119) примет значение, не меньшее и.
Если при подстановке вместо и вычисленного по слу чайной выборке значения U эта величина будет мала, то едва ли можно допустить, что соответствующее событие произошло: будет больше оснований считать, что значи тельные отклонения лг* от npi вызваны неверностью гипо тезы о функции распределения аргумента в статистиче ском коллективе. В противном случае можно сделать вы вод о возможности объяснения отклонений mi от npi случайностью и заключить, что данные наблюденной слу чайной выборки не противоречат гипотезе. Как бы близка к единице полученная величина ни была, нельзя утверж дать, что доказана справедливость гипотезы. Можно лишь
§ 59] ПРОВЕРКА ГИПОТЕЗ О ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 209
Т а б л и ц а 8
Значения и, отвечающие х и
± t
|
Р («• «) = |
х/2 |
) |
X \ |
^ <Х/2 ^ |
^ М |
|
|
|||
|
|
|
2 |
Г |
|
|
|
|
|
|
|
X |
0,99 |
0,98 |
0,95 |
|
0.90 |
|
0,80 |
0,70 |
0,50 |
0,30 |
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
0,00016 |
0,0006 |
0,0039 |
0,016 |
0,064 |
0,148 |
0,455 |
1,07 |
|||
2 |
0,020 |
0,040 |
0,103 |
|
0,211 |
0,446 |
0,713 |
1,386 |
2,41 |
||
3 |
0,115 |
0,185 |
0,352 |
|
0,584 |
1,005 |
1,424 |
2,266 |
3,66 |
||
4 |
0,30 |
0,43 |
0,71 |
|
1,06 |
|
1,65 |
2,19 |
3,36 |
4,9 |
|
5 |
0,55 |
0,75 |
1,14 |
|
1,61 |
|
2,34 |
3,00 |
4,35 |
6,1 |
|
6 |
0,87 |
1,13 |
1,63 |
|
2,20 |
|
3,07 |
3,83 |
5,35 |
7,2 |
|
7 |
1,24 |
1,56 |
2,17 |
|
2,83 |
|
3,82 |
4,67 |
6,35 |
8,4 |
|
8 |
1,65 |
2,03 |
2,73 |
|
3,49 |
|
4,59 |
5,53 |
7,34 |
9,5 |
|
9 |
2,09 |
2,53 |
3,32 |
|
4,17 |
|
5,38 |
6,39 |
8,34 |
10,7 |
|
10 |
2,56 |
3,06 |
3,94 |
|
4,86 |
|
6,18 |
7,27 |
9,34 |
11,8 |
|
И |
3,1 |
3,6 |
4,6 |
|
5,6 |
|
7,0 |
8,1 |
10,3 |
12,9 |
|
12 |
3,6 |
4,2 |
5,2 |
|
6,3 |
|
7,8 |
9,0 |
11,3 |
14,0 |
|
13 |
4,1 |
4,8 |
5,9 |
|
7,0 |
|
8,6 |
9,9 |
12,3 |
15,1 |
|
14 |
4,7 |
5,4 |
6,6 |
|
7,8 |
|
9,5 |
10,8 |
13,3 |
16,2 |
|
15 |
5,2 |
6,0 |
7,3 |
|
8,5 |
|
10,3 |
11,7 |
14,3 |
17,3 |
|
16 |
5,8 |
6,6 |
8,0 |
|
9,3 |
|
11,2 |
12,6 |
15,3 |
18,4 |
|
17 |
6,4 |
7,3 |
8,7 |
|
10,1 |
|
12,0 |
13,5 |
16,3 |
19,5 |
|
18 |
7,0 |
7,9 |
9,4 |
|
10,9 |
|
12,9 |
14,4 |
17,3 |
20,6 |
|
19 |
7,6 |
8,6 |
10,1 |
|
11,7 |
|
13,7 |
15,4 |
18,3 |
21,7 |
|
20 |
8,3 |
9,2 |
10,9 |
|
12,4 |
|
14,6 |
16,3 |
19,3 |
22,8 |
|
X |
0,20 |
0,10 |
0,05 |
|
0,02 |
|
0,01 |
0,005 |
0,002 |
0,001 |
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
1,64 |
2,7 |
3,8 |
|
5,4 |
|
6,6 |
7,9 |
9,5 |
10,83 |
|
2 |
3,22 |
4,6 |
6,0 |
|
7,8 |
|
9,2 |
11,6 |
12,4 |
13,8 |
|
3 |
4,64 |
6,3 |
7,8 |
|
9,8 |
11,3 |
12,8 |
14,8 |
16,3 |
||
4 |
6,0 |
7,8 |
9,5 |
11,7 |
13,3 |
14,9 |
16,9 |
18,5 |
|||
5 |
7,3 |
9,2 |
11,1 |
13,4 |
15,1 |
16,3 |
18,9 |
20,5 |
|||
6 |
8,6 |
10,6 |
12,6 |
15,0 |
16,8 |
18,6 |
20,7 |
22,5 |
|||
7 |
9,8 |
12,0 |
14,1 |
16,6 |
18,5 |
20,3 |
22,6 |
24,3 |
|||
8 |
11,0 |
13,4 |
15,5 |
18,2 |
20,1 |
21,9 |
24,3 |
26,1 |
|||
9 |
12,2 |
14,7 |
16,9 |
19,7 |
21,7 |
23,6 |
26,1 |
27,9 |
|||
10 |
13,4 |
16,0 |
18,3 |
21,2 |
23,3 |
25,2 |
27,7 |
29,6 |
|||
И |
14,6 |
17,3 |
19,7 |
22,6 |
24,7 |
26,8 |
29,4 |
31,3 |
|||
12 |
15,8 |
18,5 |
21,0 |
24,1 |
26,2 |
28,3 |
31 |
32,9 |
|||
13 |
17,0 |
19,8 |
22,4 |
25,5 |
27,7 |
29,8 |
32,5 |
34,5 |
|||
14 |
18,2 |
21,1 |
23,7 |
26,9 |
29,1 |
31 |
34 |
36,1 |
|||
