 
        
        книги из ГПНТБ / Лавренченко, А. С. Лекции по математической статистике и теории случайных процессов учебное пособие
.pdfЛ е к ц и я 3 ИНТЕРВАЛЬНЫЕ СТАТИСТИЧЕСКИЕ ОЦЕНКИ
Распределения среднего и дисперсии выборки из нормальной генеральной совокупности.
Доверительные интервалы для генерального среднего нормаль ной совокупности при известной и неизвестной генеральной дисперсии.
Доверительный интервал для генеральной дисперсии нормаль ной совокупности.
Линейное ортогональное преобразование
Линейное преобразование
| / = 1 .......... п | (1) | 
/ - 1
называется ортогональным, если оно сохраняет инвариантной
форму
% + х\ + ... + хп2'
т. е. если
пп
| / 1 | ( 2 ) | 
| 1-1 | 
В «-мерном эвклидовом пространстве такое преобразование соответствует вращению системы координат относительно ее
| начала. | 
 | и приравняем коэффициенты | при | |
| Если (1) подставим в (2) | ||||
| Xj.xk (/, k — 1,..., п) с | обеих сторон, то получим условие ортого | |||
| нальности | 
 | 1 при j = k, | 
 | |
| П | 
 | 
 | ||
| Ъ | а Ч а 1 к ~ | (3 ) | ||
| О при ] ф k. | ||||
| 1-1 | 
 | 
 | ||
| Умножим /-е уравнение в (1) | на aik, а затем просуммируем по | |||
| лученные уравнения по i (i — 1,..., п). Тогда в силу (3) найдем | ||||
| х1=^аУ^* ' = ! > ■ • • > « , | ( 4) | |||
| 
 | П | 
 | 
 | |
/=1
20
| т. е. матрица обратного преобразования | (4) | является транспони | |||||||
| рованной матрицей преобразования (1). | 
 | 
 | 
 | 
 | 
 | ||||
| В силу | (2) | обратное преобразование | 
 | (4) | также ортогонально | ||||
| и, следовательно, для него | выполняется | условие ортогональности | |||||||
| 
 | 
 | 
 | | 1 | при / | = | k. | 
 | 
 | (5) | 
| 
 | 
 | 
 | \ 0 | при j | ф k. | 
 | 
 | ||
| 
 | 
 | 
 | 
 | 
 | 
 | ||||
| Точно так же доказывается обратное: условие (3) | есть следствие | ||||||||
| условия (5). | 
 | 
 | 
 | 
 | 
 | Пц || | 
 | 
 | |
| Из (3) | и | (5) следует, что в | матрице | || | ортогонального | ||||
| преобразования (1) сумма | квадратов | элементов | каждого | ряда | |||||
| (столбца или строки) равна | единице, а сумма произведений | соот | |||||||
ветствующих элементов двухлюбых параллельных рядов с разны
| ми номерами равна нулю. Поэтому | произведение матрицы || aif || | |||||
| на транспонированную | матрицу | || | а н || | равно единичной матрице | ||
| Е т а | 
 | II Щ, || • | || а п || = | £ . | 
 | |
| 
 | 
 | 
 | ||||
| Отсюда следует, что определитель линейного ортогонального | ||||||
| преобразования (1) | равен + 1. | 
 | 
 | 
 | 
 | |
| Т е о р е м а . Любое я-е равенство | 
 | 
 | 
 | |||
| 
 | 
 | /I | 
 | 
 | 
 | 
 | 
| 
 | 
 | Ун ^ „ j X j , | 
 | 
 | ||
| 
 | 
 | /-1 | 
 | 
 | 
 | |
| коэффициенты которого удовлетворяют условию | 
 | |||||
| 
 | 
 | П | 
 | 
 | 
 | 
 | 
| 
 | 
 | V < | 1 | - 1 > | 
 | 
 | 
| 
 | 
 | / - 1 | 
 | 
 | 
 | преобразова- | 
| можно дополнить | до | некоторого | ортогонального | |||
| ния (1). | 
 | 
 | 
 | 
 | 
 | (п — 1)-го ра- | 
| Доказательство. Для неизвестных коэффициентов | ||||||
| венства | 
 | 
 | 
 | 
 | 
 | 
 | 
Уп—1— У] Чп —1, / Xj
1-1
| в силу (5) | 
 | 
| п | (6) | 
| ап j ап- 1, i — 0; | |
| / - 1 | 
 | 
| П | 
 | 
| V а«2 -1, / =■1. | (7) | 
| f t | 
 | 
Линейное однородное уравнение (6) имеет ненулевое решение. Умножив это решение на подходящий множитель, удовлетворим и квадратному уравнению (7).
После этого для неизвестных коэффициентов (п ■— 2)-го равен ства в силу (5) получим два линейных однородных и одно квадрат ное уравнение. Система этих линейных уравнений имеет ненулевое-
21
рошенне. Умножив это решение на подходящий множитель, удовлет ворим п квадратному уравнению. Продолжая так далее, найдем искомое ортогональное преобразование. Теорема доказана.
В частности, если
| nJ | J = 1» • п, | 
| 
 | V n | 
ТО При 1 = 1,..., п — 1 из (5) получим
| У,ац = 0. | (8) | 
| /-1 | 
 | 
Распределения среднего и дисперсии выборки из нормальной совокупности
Пусть имеем выборку
| Х\, | • • • j хп | (9) | 
из нормальной генеральной совокупности X с параметрами шх и о.(. Для выборочных среднего и дисперсии
| - | 
 | 1 | "л | 
 | 
| X | 
 | X-L, | 
 | |
| 
 | 
 | п —1 | 
 | |
| 
 | 
 | 1 | 
 | 
 | 
| 
 | (l i=1 | 
 | 
 | |
| Априори величины ,v и s'2 случайные. | Найдем их распределения. | |||
| Известно, что линейная комбинация нормальных независимых | ||||
| случайных величин нормальна. Но | по | условию случайные вели | ||
чины (9) нормальны и независимы. Поэтому среднее х также нор мально, причем
т7 = М
D - — D
X
| 1 " | = — ^ М \ Х \ = тх\ | ||
| п / - 1 | |||
| п ,Г1 | 
 | ||
| I VI | 1 " | а2 | |
| п •i>1 Кг | = l . ^ D \ x ] = -= -; | ||
| па ,-ti | п. | ||
| о—~ | 1/ D - = | 
 | 
 | 
 | 
 | ||
| X | г х | 
 | V n | ' | 
 | 
 | |
| 
 | 
 | 
 | 
 | 
 | 
 | ||
| Итак, х распределено | нормально с параметрами | 
 | |||||
| a | —т г. | з = | 3Л- | 
 | 
 | ||
| V n ' | 
 | 
 | |||||
| Далее имеем | 
 | 
 | 
 | 
 | 
 | ||
| 
 | _ | 
 | 1 | И | _ | 
 | |
| 1 Я | 
 | 
 | ( 10) | ||||
| - ^ { x l - x f = - L ^ x i i - x \ | |||||||
| п i t 1 | 
 | 
 | 
 | п i~I | 
 | 
 | |
22
Над л',,..., хп произведем линейное ортогональное преобразо вание (1), для которого
»1
Уп = ) ± Т п : х1 = У п х - 1-1 У >1
| Величины у I, | 
 | будут | нормальны, | п | для | |
| в силу (1), (8) | и (5) | получим | 
 | 
 | 
 | |
| М |_у(| = | М | 2 | uu xj | V « ,7/V/[X| | 
 | V « y = 0; | 
| 
 | /-1 | 
 | /=1 | 
 | l-i | |
| 
 | i | an xj = | Yi iill D\X\ = | S | У « /,= <# | |
| 
 | 1-1 | 
 | >-1 | 
 | 
 | |
( 1 1)
п— 1
(12)
| 
 | f D l r *x. | 
 | 
 | 
 | (13) | |
| i=hi | (i,J = 1, | - , «) в силу | (12), (1), | (5) и (8) | ||
| ■• •) х„ найдем | п | 
 | п | 
 | 
 | |
| м | п | 
 | 
 | 
 | ||
| V aik х к V ajlx l | = | 2 | а'каЛМ | = | ||
| M\y,yj\ = M | i-i | |||||
| 
 | 
 | к, l | 1 | 
 | ||
| = M [,Y»| £ aihajk + M * \ x \ v а1Лал = | M*\X\ V a,k V Uj, - | |||||
| *=1 | к, | l | 
 | 
 | l | 1 | 
£a lkajk = 0,
*-i
| ‘ t . e. у i, ... , | yn— некоррелнрованны, | а поэтому н независимы, | так | ||||
| как из | некоррелированности | нормальных | величин следует их | не | |||
| зависимость. | имеем | 
 | 
 | 
 | 
 | ||
| Из | (Ю), | (2) и (11) | 
 | 
 | 
 | 
 | |
| 
 | 
 | 1 | Г» | 1 | 1 | н-1 | (И) | 
| 
 | 
 | S3= — V у ) ------Уп2 = ~ | V )’(> | ||||
| откуда | 
 | п | ,Г| | пп | п | —1 | 
 | 
| 
 | 
 | ns | л-1 . | 
 | 
 | ||
| 
 | 
 | 
 | - у | ' l l | 
 | 
 | |
| 
 | 
 | 
 | 
 | 
 | , 3v | 
 | 
 | 
т. е. случайную величину
ns*
(15)
согласно (12) и (13) представили как сумму квадратов нормальных нормированных независимых случайных величин
| i = 1, | , я - 1 . | 
алг
Поэтому величина (15) для выборки (9) пз нормальной гене-
23
| ральной совокупности X имеет распределение | с п — 1 степенями | ||
| свободы. Это верно и для величины | 
 | 
 | |
| (л — l)s 2 | п - 1 | 1 l | 
 | 
| 2 | 
 | ||
| 
 | а,. | 
 | |
где s2— несмещенная выборочная дисперсия.
Возможность исключения одной степени свободы у п для s2 и s2 объясняется тем, что величины
(xt — х), i = 1,. . . , п
связаны одной зависимостью
| 
 | t | (* /-* ) = о. | 
| 
 | i | 1 | 
| Так как | у п независимы, то в силу (11) и (14) независимы | |
и случайные величины х и s2.
Доверительный интервал
В лекции 1 показано, как по выборке (9) найти точечную оценку
| 0 ( а ь . . . , хп) неизвестного параметра 0. | Теперь укажем, как найти | |
| точность этой оценки. | 
 | 
 | 
| Зная закон распределения несмещенной точечной оценки 0, | ||
| можно для заданного близкого к единице числа | \ — р найти такое | |
| ЧИСЛО 81 _ р , ЧТО | 
 | 
 | 
| Р ( | 0 — в | < е , . р) = | \ - р . | (16) | 
Здесь е г _ н есть точность оценки 0, а число 1 — р называется
доверительной вероятностью, или надежностью этой оценки.
Равенство (16) означает, что интервал
| 0 - e 1. p < 0 < 0 + s,_„ | (17) | 
| со случайными концами накрывает неизвестный параметр 0 | с за | 
| данной вероятностью 1 — р. | 
 | 
Этот интервал называется доверительным и является интерваль ной оценкой параметра 0.
Доверительный интервал для генерального среднего нормальной совокупности
| Для генеральных | среднего | тх и | дисперсии / Д ^ з 2 имеем | |
| выборочные оценки | 
 | 
 | 
 | |
| — 1 | п | 
 | Е и* - | |
| я | 1 - 1 | п- | ||
| 1 t | 
24
Найдем доверительный интервал для тх нормальной совокуп ности X при известном ах и доверительной вероятности 1— р.
Положим
| г 1- р — «3Г = « | У п | 
 | 
 | ( 18) | ||
| 
 | 
 | 
 | 
 | 
 | 
 | |
| и для нормальной случайной величины .v | со средним /я—= тх при | |||||
| меним известную формулу | 
 | 
 | 
 | 
 | 
 | |
| Р { \ х — тхI < г) = | 2Ф ^ | | — 1, | 
 | (19) | ||
| где Ф (х)— функция Лапласа, т. | е. функция распределения нор | |||||
| мальной нормированной случайной величины. | 
 | 
 | ||||
| Сравнив (19) с (16), при 0 = | х, | (-) = | тх и e = | n i _ P в силу | (18) | |
| получим | 
 | 
 | 
 | 
 | 
 | 
 | 
| 
 | Ф(и) = | 1 | - А | ) | 
 | 
 | 
| т. е. и есть квантиль и | ,, нормального нормированного распреде- | |||||
| 
 | 2 | 1 | л | 
 | 
 | (17), | 
| ления, отвечающий вероятности | —. Поэтому согласно | |||||
| (18) найдем искомый доверительный интервал | 
 | 
 | ||||
| х-----„ < т г < * ф | j - - u | У я | 1~* | (20) | ||
| У я | >"т | 
 | 
 | 
 | ||
Найдем доверительный интервал для тх нормальной совокуп ности X при неизвестном ах и доверительной вероятности 1 — р.
Для нормальной X величина
имеет нормальное нормированное распределение, а величина
| ; 1 ) ? | (21) | 
аг
х
— распределение x«_i ■Величины U и V независимы, так как неза висимы х и s2. Поэтому по определению величина
| 
 | Т -2 | и \ | f | = V n х | (22) | |
| 
 | 
 | У | 
 | V | 
 | s | 
| имеет распределение | Стьюдента с я — 1 | степенями свободы. Для | ||||
| нее из (16) | при 0 = | 7, 0 | = | 0, e i _ p= / | в силу четности плотности | |
| вероятности | распределения Стьюдента f(t) | найдем | ||||
25
| P ( \ T \ < t ) = 2 \ f h ) d z - 1 — p. | (23) | |||
| Следовательно, | 
 | 
 | 
 | 
 | 
| F (t) = f f (t ) d z | = ( / (t ) d z + | f / (t ) d z - | - i - + | - Ц = £ | 
| - 'o o | _'<*> | о | 2 | 2 | 
Отсюда
^ ( 0 - 1
t . e. / есть квантиль / распределения Стыодента с п — 1 степе
нным свободы, отвечающий вероятности 1— Поэтому для Т при
доверительной вероятности 1 - р согласно (23) имеем интерваль ную оценку
m < * . ^
Подставив сюда выражение для Т из (22) н разрешив затем полученное неравенство относительно tnx, найдем искомый довери тельный интервал
| 
 | 
 | 
 | х — — | 1 | „ | < mx < х + | 1 „, | (24) | |
| 
 | 
 | 
 | У п | ]-~2 | 
 | V « | — | 
 | |
| для | которого, | в отличие от | (20), | случайно не | только | положение, | |||
| по и длина. | интервалы | (20) и | (24) практически | совпадают, | |||||
| 
 | При | п > 3 0 | |||||||
| так | как | при п > 3 0 распределение | Стыодента | практически совпа | |||||
дает с нормальным нормированным распределением. Но при п < 30 интервал (20) может быть существенно уже интервала (24). Это объясняется тем, что при его построении использовалась дополни тельная информация о значении ол.
Длина доверительного интервала А, доверительная вероятность
| 1— р и объем выборки | п взаимосвязаны. Например, для (20) | 
| имеем | 
 | 
| Поэтому, задавшись | значениями двух любых из трех величин | 
| А, 1 — р и п, можно найти неизвестную третью величину. | |
Доверительный интервал для генеральной дисперсии нормальной совокупности
Для нормальной X величина (21) имеет распределение Х«-ъ
| Поэтому можно найти такую пару чисел щ, v2, что | 
 | 
| p ( ^ < ( Я~ 1)52 < v ) j = \ - p . | (25) | 
26
Таких пар чисел vu v2 бесконечно много. Па практике обычно берут центральный доверительный интервал, для которого вероят
ности выхода величины (21) за интервал влево и вправо одпна-
р
ковы и равны — . При этом для н, и v2 имеем уравнения
2
Р( V < v x) = - | ;
P ( V < v 2) = l - - ^ ,
| т. е. Oj и и2 есть | квантили х„ и х2 | распределения у* с | п — 1 | 
| степенями свободы, | отвечающие вероятностям -^-и 1---- —. | Поэто | |
му для величины (21) при доверительной вероятности 1— р соглас но (25) имеем интервальную оценку
| 2 | ( И - | 1)? | 2 | 
| '■JL ^ | ,2 | ^ | Р • | 
| 2 | а- | 2 | |
Разрешив эти неравенства относительно стЛ-\ найдем доверитель
| ный интервал | 
 | 
| (/?— l)s* < | _(л — 1)7* | 
2
для генеральной дисперсии оЛ2 при доверительной вероятности 1—р.
27
Л е к ц и я 4. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Метод проверки статистических гипотез.
Проверка гипотезы о равенстве генеральных средних нормаль ных совокупностей.
Проверка гипотезы о равенстве генеральных дисперсий нормаль ных совокупностей.
Проверка гипотезы о законе распределения по критерию согласия х2-
Метод проверки статистических гипотез
Статистическими гипотезами называются любые гипотезы отно сительно генеральных совокупностей.
Задача проверки статистической гипотезы Н относительно гене ральной совокупности X ставится так: найти правило, позволяющее по выборке из X
| .Vi, х2, .... хп | (1) | 
обоснованно решать вопрос о принятии пли отклонении гипотезы Н. Эта задача решается следующим статистическим методом. Выбирают критерий проверки, т. е. некоторую функцию от
| выборки (1) | (2) | 
| Z = Z(xh х2, . . ., хп), | 
для априорного значения которой условные плотности вероятностей j\(Z/H) и f2 (Z/'H) относительно проверяемой гипотезы Н и конкури
рующей с ней гипотезы Н известны.
Задают уровень значимости р, т. е. столь малую вероятность р, что события, появляющиеся с этой вероятностью, можно в данной
| ситуации | считать | практически невозможными. Обычно берут | |
| /> = 0,05; | /> = 0,02 | или /> = | 0,01. | 
| Далее по известным р, | f\(ZfH), f2(ZlH) находят так называе | ||
| мую критическую область G из условий | |||
| 
 | 
 | P ( Z e Q I H ) = p \ | |
| 
 | 
 | P ( Z c G!.H) — max. | |
| Величина | r==P(ZGOjW) | ||
28
называется мощностью критерия Z. Она является доверительной вероятностью попадания значения критерия (2) в критическую область Снесли проверяемая гипотеза Н не верна, т. е. верна гипотеза Н (рис. 5).
и учтем, что события Z е G и Z е G при гипотезе Н противополож
| ны. Тогда | — _ | _ | 
| 
 | _q =з P ( Z e QfH) = | 1— Р (Z е G/H) = 1 — г. | 
Дополнение критической области G до множества всех возмож ных значений критерия Z называется доверительной областью кри
| терия Z. На рис. 5 по оси 2 | справа от критической точки 2 i _ p | 
| лежит критическая область, | а слева — доверительная область, | 
которая при гипотезе Н является доверительным интервалом вели чины Z, отвечающим доверительной вероятности 1— р.
Если значение критерия (2), вычисленное по выборке (1), попадет в критическую область G, то гипотезу Н отклоняют в
пользу гипотезы Н, так как попадание критерия Z в область G при гипотезе Н практически невозможно, а поэтому несовместимо с Н.
Если же значение критерия Z попадет в доверительную область, то гипотезу Н принимают, так как попадание критерия Z в эту область при гипотезе 11 практически достоверно, а поэтому совме стимо с И.
При такой проверке гипотезы Н возможны ошибки двоякого
| рода. | Н | отклоняют, | 
| Ошибка 1-го рода состоит в том, что гипотезу | ||
| когда она верна. Вероятность этой ошибки равна р. | И | 
 | 
| Ошибка 2-го рода состоит в том, что гипотезу | принимают, | |
| когда она не верна. Вероятность этой ошибки равна </= 1— г. | ||
| Из рис. 5 видно, что с уменьшением р возрастает q | и наоборот, | |
29
