
книги из ГПНТБ / Лавренченко, А. С. Лекции по математической статистике и теории случайных процессов учебное пособие
.pdfЛ е к ц и я 3 ИНТЕРВАЛЬНЫЕ СТАТИСТИЧЕСКИЕ ОЦЕНКИ
Распределения среднего и дисперсии выборки из нормальной генеральной совокупности.
Доверительные интервалы для генерального среднего нормаль ной совокупности при известной и неизвестной генеральной дисперсии.
Доверительный интервал для генеральной дисперсии нормаль ной совокупности.
Линейное ортогональное преобразование
Линейное преобразование
/ = 1 .......... п |
(1) |
/ - 1
называется ортогональным, если оно сохраняет инвариантной
форму
% + х\ + ... + хп2'
т. е. если
пп
/ 1 |
( 2 ) |
1-1 |
В «-мерном эвклидовом пространстве такое преобразование соответствует вращению системы координат относительно ее
начала. |
|
и приравняем коэффициенты |
при |
|
Если (1) подставим в (2) |
||||
Xj.xk (/, k — 1,..., п) с |
обеих сторон, то получим условие ортого |
|||
нальности |
|
1 при j = k, |
|
|
П |
|
|
||
Ъ |
а Ч а 1 к ~ |
(3 ) |
||
О при ] ф k. |
||||
1-1 |
|
|
||
Умножим /-е уравнение в (1) |
на aik, а затем просуммируем по |
|||
лученные уравнения по i (i — 1,..., п). Тогда в силу (3) найдем |
||||
х1=^аУ^* ' = ! > ■ • • > « , |
( 4) |
|||
|
П |
|
|
/=1
20
т. е. матрица обратного преобразования |
(4) |
является транспони |
|||||||
рованной матрицей преобразования (1). |
|
|
|
|
|
||||
В силу |
(2) |
обратное преобразование |
|
(4) |
также ортогонально |
||||
и, следовательно, для него |
выполняется |
условие ортогональности |
|||||||
|
|
|
| 1 |
при / |
= |
k. |
|
|
(5) |
|
|
|
\ 0 |
при j |
ф k. |
|
|
||
|
|
|
|
|
|
||||
Точно так же доказывается обратное: условие (3) |
есть следствие |
||||||||
условия (5). |
|
|
|
|
|
Пц || |
|
|
|
Из (3) |
и |
(5) следует, что в |
матрице |
|| |
ортогонального |
||||
преобразования (1) сумма |
квадратов |
элементов |
каждого |
ряда |
|||||
(столбца или строки) равна |
единице, а сумма произведений |
соот |
ветствующих элементов двухлюбых параллельных рядов с разны
ми номерами равна нулю. Поэтому |
произведение матрицы || aif || |
|||||
на транспонированную |
матрицу |
|| |
а н || |
равно единичной матрице |
||
Е т а |
|
II Щ, || • |
|| а п || = |
£ . |
|
|
|
|
|
||||
Отсюда следует, что определитель линейного ортогонального |
||||||
преобразования (1) |
равен + 1. |
|
|
|
|
|
Т е о р е м а . Любое я-е равенство |
|
|
|
|||
|
|
/I |
|
|
|
|
|
|
Ун ^ „ j X j , |
|
|
||
|
|
/-1 |
|
|
|
|
коэффициенты которого удовлетворяют условию |
|
|||||
|
|
П |
|
|
|
|
|
|
V < |
1 |
- 1 > |
|
|
|
|
/ - 1 |
|
|
|
преобразова- |
можно дополнить |
до |
некоторого |
ортогонального |
|||
ния (1). |
|
|
|
|
|
(п — 1)-го ра- |
Доказательство. Для неизвестных коэффициентов |
||||||
венства |
|
|
|
|
|
|
Уп—1— У] Чп —1, / Xj
1-1
в силу (5) |
|
п |
(6) |
ап j ап- 1, i — 0; |
|
/ - 1 |
|
П |
|
V а«2 -1, / =■1. |
(7) |
f t |
|
Линейное однородное уравнение (6) имеет ненулевое решение. Умножив это решение на подходящий множитель, удовлетворим и квадратному уравнению (7).
После этого для неизвестных коэффициентов (п ■— 2)-го равен ства в силу (5) получим два линейных однородных и одно квадрат ное уравнение. Система этих линейных уравнений имеет ненулевое-
21
рошенне. Умножив это решение на подходящий множитель, удовлет ворим п квадратному уравнению. Продолжая так далее, найдем искомое ортогональное преобразование. Теорема доказана.
В частности, если
nJ |
J = 1» • п, |
|
V n |
ТО При 1 = 1,..., п — 1 из (5) получим
У,ац = 0. |
(8) |
/-1 |
|
Распределения среднего и дисперсии выборки из нормальной совокупности
Пусть имеем выборку
Х\, |
• • • j хп |
(9) |
из нормальной генеральной совокупности X с параметрами шх и о.(. Для выборочных среднего и дисперсии
- |
|
1 |
"л |
|
X |
|
X-L, |
|
|
|
|
п —1 |
|
|
|
|
1 |
|
|
|
(l i=1 |
|
|
|
Априори величины ,v и s'2 случайные. |
Найдем их распределения. |
|||
Известно, что линейная комбинация нормальных независимых |
||||
случайных величин нормальна. Но |
по |
условию случайные вели |
чины (9) нормальны и независимы. Поэтому среднее х также нор мально, причем
т7 = М
D - — D
X
1 " |
= — ^ М \ Х \ = тх\ |
||
п / - 1 |
|||
п ,Г1 |
|
||
I VI |
1 " |
а2 |
|
п •i>1 Кг |
= l . ^ D \ x ] = -= -; |
||
па ,-ti |
п. |
о—~ |
1/ D - = |
|
|
|
|
||
X |
г х |
|
V n |
' |
|
|
|
|
|
|
|
|
|
||
Итак, х распределено |
нормально с параметрами |
|
|||||
a |
—т г. |
з = |
3Л- |
|
|
||
V n ' |
|
|
|||||
Далее имеем |
|
|
|
|
|
||
|
_ |
|
1 |
И |
_ |
|
|
1 Я |
|
|
( 10) |
||||
- ^ { x l - x f = - L ^ x i i - x \ |
|||||||
п i t 1 |
|
|
|
п i~I |
|
|
22
Над л',,..., хп произведем линейное ортогональное преобразо вание (1), для которого
»1
Уп = ) ± Т п : х1 = У п х - 1-1 У >1
Величины у I, |
|
будут |
нормальны, |
п |
для |
|
в силу (1), (8) |
и (5) |
получим |
|
|
|
|
М |_у(| = |
М |
2 |
uu xj |
V « ,7/V/[X| |
|
V « y = 0; |
|
/-1 |
|
/=1 |
|
l-i |
|
|
i |
an xj = |
Yi iill D\X\ = |
S |
У « /,= <# |
|
|
1-1 |
|
>-1 |
|
|
( 1 1)
п— 1
(12)
|
f D l r *x. |
|
|
|
(13) |
|
i=hi |
(i,J = 1, |
- , «) в силу |
(12), (1), |
(5) и (8) |
||
■• •) х„ найдем |
п |
|
п |
|
|
|
м |
п |
|
|
|
||
V aik х к V ajlx l |
= |
2 |
а'каЛМ |
= |
||
M\y,yj\ = M |
i-i |
|||||
|
|
к, l |
1 |
|
||
= M [,Y»| £ aihajk + M * \ x \ v а1Лал = |
M*\X\ V a,k V Uj, - |
|||||
*=1 |
к, |
l |
|
|
l |
1 |
£a lkajk = 0,
*-i
‘ t . e. у i, ... , |
yn— некоррелнрованны, |
а поэтому н независимы, |
так |
||||
как из |
некоррелированности |
нормальных |
величин следует их |
не |
|||
зависимость. |
имеем |
|
|
|
|
||
Из |
(Ю), |
(2) и (11) |
|
|
|
|
|
|
|
1 |
Г» |
1 |
1 |
н-1 |
(И) |
|
|
S3= — V у ) ------Уп2 = ~ |
V )’(> |
||||
откуда |
|
п |
,Г| |
пп |
п |
—1 |
|
|
|
ns |
л-1 . |
|
|
||
|
|
|
- у |
' l l |
|
|
|
|
|
|
|
|
, 3v |
|
|
т. е. случайную величину
ns*
(15)
согласно (12) и (13) представили как сумму квадратов нормальных нормированных независимых случайных величин
i = 1, |
, я - 1 . |
алг
Поэтому величина (15) для выборки (9) пз нормальной гене-
23
ральной совокупности X имеет распределение |
с п — 1 степенями |
||
свободы. Это верно и для величины |
|
|
|
(л — l)s 2 |
п - 1 |
1 l |
|
2 |
|
||
|
а,. |
|
где s2— несмещенная выборочная дисперсия.
Возможность исключения одной степени свободы у п для s2 и s2 объясняется тем, что величины
(xt — х), i = 1,. . . , п
связаны одной зависимостью
|
t |
(* /-* ) = о. |
|
i |
1 |
Так как |
у п независимы, то в силу (11) и (14) независимы |
и случайные величины х и s2.
Доверительный интервал
В лекции 1 показано, как по выборке (9) найти точечную оценку
0 ( а ь . . . , хп) неизвестного параметра 0. |
Теперь укажем, как найти |
|
точность этой оценки. |
|
|
Зная закон распределения несмещенной точечной оценки 0, |
||
можно для заданного близкого к единице числа |
\ — р найти такое |
|
ЧИСЛО 81 _ р , ЧТО |
|
|
Р ( | 0 — в | < е , . р) = |
\ - р . |
(16) |
Здесь е г _ н есть точность оценки 0, а число 1 — р называется
доверительной вероятностью, или надежностью этой оценки.
Равенство (16) означает, что интервал
0 - e 1. p < 0 < 0 + s,_„ |
(17) |
со случайными концами накрывает неизвестный параметр 0 |
с за |
данной вероятностью 1 — р. |
|
Этот интервал называется доверительным и является интерваль ной оценкой параметра 0.
Доверительный интервал для генерального среднего нормальной совокупности
Для генеральных |
среднего |
тх и |
дисперсии / Д ^ з 2 имеем |
|
выборочные оценки |
|
|
|
|
— 1 |
п |
|
Е и* - |
|
я |
1 - 1 |
п- |
||
1 t |
24
Найдем доверительный интервал для тх нормальной совокуп ности X при известном ах и доверительной вероятности 1— р.
Положим
г 1- р — «3Г = « |
У п |
|
|
( 18) |
||
|
|
|
|
|
|
|
и для нормальной случайной величины .v |
со средним /я—= тх при |
|||||
меним известную формулу |
|
|
|
|
|
|
Р { \ х — тхI < г) = |
2Ф ^ |
| — 1, |
|
(19) |
||
где Ф (х)— функция Лапласа, т. |
е. функция распределения нор |
|||||
мальной нормированной случайной величины. |
|
|
||||
Сравнив (19) с (16), при 0 = |
х, |
(-) = |
тх и e = |
n i _ P в силу |
(18) |
|
получим |
|
|
|
|
|
|
|
Ф(и) = |
1 |
- А |
) |
|
|
т. е. и есть квантиль и |
,, нормального нормированного распреде- |
|||||
|
2 |
1 |
л |
|
|
(17), |
ления, отвечающий вероятности |
—. Поэтому согласно |
|||||
(18) найдем искомый доверительный интервал |
|
|
||||
х-----„ < т г < * ф |
j - - u |
У я |
1~* |
(20) |
||
У я |
>"т |
|
|
|
Найдем доверительный интервал для тх нормальной совокуп ности X при неизвестном ах и доверительной вероятности 1 — р.
Для нормальной X величина
имеет нормальное нормированное распределение, а величина
; 1 ) ? |
(21) |
аг
х
— распределение x«_i ■Величины U и V независимы, так как неза висимы х и s2. Поэтому по определению величина
|
Т -2 |
и \ |
f |
= V n х |
(22) |
|
|
|
У |
|
V |
|
s |
имеет распределение |
Стьюдента с я — 1 |
степенями свободы. Для |
||||
нее из (16) |
при 0 = |
7, 0 |
= |
0, e i _ p= / |
в силу четности плотности |
|
вероятности |
распределения Стьюдента f(t) |
найдем |
25
P ( \ T \ < t ) = 2 \ f h ) d z - 1 — p. |
(23) |
|||
Следовательно, |
|
|
|
|
F (t) = f f (t ) d z |
= ( / (t ) d z + |
f / (t ) d z - |
- i - + |
- Ц = £ |
- 'o o |
_'<*> |
о |
2 |
2 |
Отсюда
^ ( 0 - 1
t . e. / есть квантиль / распределения Стыодента с п — 1 степе
нным свободы, отвечающий вероятности 1— Поэтому для Т при
доверительной вероятности 1 - р согласно (23) имеем интерваль ную оценку
m < * . ^
Подставив сюда выражение для Т из (22) н разрешив затем полученное неравенство относительно tnx, найдем искомый довери тельный интервал
|
|
|
х — — |
1 |
„ |
< mx < х + |
1 „, |
(24) |
|
|
|
|
У п |
]-~2 |
|
V « |
— |
|
|
для |
которого, |
в отличие от |
(20), |
случайно не |
только |
положение, |
|||
по и длина. |
интервалы |
(20) и |
(24) практически |
совпадают, |
|||||
|
При |
п > 3 0 |
|||||||
так |
как |
при п > 3 0 распределение |
Стыодента |
практически совпа |
дает с нормальным нормированным распределением. Но при п < 30 интервал (20) может быть существенно уже интервала (24). Это объясняется тем, что при его построении использовалась дополни тельная информация о значении ол.
Длина доверительного интервала А, доверительная вероятность
1— р и объем выборки |
п взаимосвязаны. Например, для (20) |
имеем |
|
Поэтому, задавшись |
значениями двух любых из трех величин |
А, 1 — р и п, можно найти неизвестную третью величину. |
Доверительный интервал для генеральной дисперсии нормальной совокупности
Для нормальной X величина (21) имеет распределение Х«-ъ
Поэтому можно найти такую пару чисел щ, v2, что |
|
p ( ^ < ( Я~ 1)52 < v ) j = \ - p . |
(25) |
26
Таких пар чисел vu v2 бесконечно много. Па практике обычно берут центральный доверительный интервал, для которого вероят
ности выхода величины (21) за интервал влево и вправо одпна-
р
ковы и равны — . При этом для н, и v2 имеем уравнения
2
Р( V < v x) = - | ;
P ( V < v 2) = l - - ^ ,
т. е. Oj и и2 есть |
квантили х„ и х2 |
распределения у* с |
п — 1 |
степенями свободы, |
отвечающие вероятностям -^-и 1---- —. |
Поэто |
му для величины (21) при доверительной вероятности 1— р соглас но (25) имеем интервальную оценку
2 |
( И - |
1)? |
2 |
'■JL ^ |
,2 |
^ |
Р • |
2 |
а- |
2 |
Разрешив эти неравенства относительно стЛ-\ найдем доверитель
ный интервал |
|
(/?— l)s* < |
_(л — 1)7* |
2
для генеральной дисперсии оЛ2 при доверительной вероятности 1—р.
27
Л е к ц и я 4. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Метод проверки статистических гипотез.
Проверка гипотезы о равенстве генеральных средних нормаль ных совокупностей.
Проверка гипотезы о равенстве генеральных дисперсий нормаль ных совокупностей.
Проверка гипотезы о законе распределения по критерию согласия х2-
Метод проверки статистических гипотез
Статистическими гипотезами называются любые гипотезы отно сительно генеральных совокупностей.
Задача проверки статистической гипотезы Н относительно гене ральной совокупности X ставится так: найти правило, позволяющее по выборке из X
.Vi, х2, .... хп |
(1) |
обоснованно решать вопрос о принятии пли отклонении гипотезы Н. Эта задача решается следующим статистическим методом. Выбирают критерий проверки, т. е. некоторую функцию от
выборки (1) |
(2) |
Z = Z(xh х2, . . ., хп), |
для априорного значения которой условные плотности вероятностей j\(Z/H) и f2 (Z/'H) относительно проверяемой гипотезы Н и конкури
рующей с ней гипотезы Н известны.
Задают уровень значимости р, т. е. столь малую вероятность р, что события, появляющиеся с этой вероятностью, можно в данной
ситуации |
считать |
практически невозможными. Обычно берут |
|
/> = 0,05; |
/> = 0,02 |
или /> = |
0,01. |
Далее по известным р, |
f\(ZfH), f2(ZlH) находят так называе |
||
мую критическую область G из условий |
|||
|
|
P ( Z e Q I H ) = p \ |
|
|
|
P ( Z c G!.H) — max. |
|
Величина |
r==P(ZGOjW) |
28
называется мощностью критерия Z. Она является доверительной вероятностью попадания значения критерия (2) в критическую область Снесли проверяемая гипотеза Н не верна, т. е. верна гипотеза Н (рис. 5).
и учтем, что события Z е G и Z е G при гипотезе Н противополож
ны. Тогда |
— _ |
_ |
|
_q =з P ( Z e QfH) = |
1— Р (Z е G/H) = 1 — г. |
Дополнение критической области G до множества всех возмож ных значений критерия Z называется доверительной областью кри
терия Z. На рис. 5 по оси 2 |
справа от критической точки 2 i _ p |
лежит критическая область, |
а слева — доверительная область, |
которая при гипотезе Н является доверительным интервалом вели чины Z, отвечающим доверительной вероятности 1— р.
Если значение критерия (2), вычисленное по выборке (1), попадет в критическую область G, то гипотезу Н отклоняют в
пользу гипотезы Н, так как попадание критерия Z в область G при гипотезе Н практически невозможно, а поэтому несовместимо с Н.
Если же значение критерия Z попадет в доверительную область, то гипотезу Н принимают, так как попадание критерия Z в эту область при гипотезе 11 практически достоверно, а поэтому совме стимо с И.
При такой проверке гипотезы Н возможны ошибки двоякого
рода. |
Н |
отклоняют, |
Ошибка 1-го рода состоит в том, что гипотезу |
||
когда она верна. Вероятность этой ошибки равна р. |
И |
|
Ошибка 2-го рода состоит в том, что гипотезу |
принимают, |
|
когда она не верна. Вероятность этой ошибки равна </= 1— г. |
||
Из рис. 5 видно, что с уменьшением р возрастает q |
и наоборот, |
29