Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Лавренченко, А. С. Лекции по математической статистике и теории случайных процессов учебное пособие

.pdf
Скачиваний:
26
Добавлен:
19.10.2023
Размер:
4.94 Mб
Скачать

Л е к ц и я 3 ИНТЕРВАЛЬНЫЕ СТАТИСТИЧЕСКИЕ ОЦЕНКИ

Распределения среднего и дисперсии выборки из нормальной генеральной совокупности.

Доверительные интервалы для генерального среднего нормаль­ ной совокупности при известной и неизвестной генеральной дисперсии.

Доверительный интервал для генеральной дисперсии нормаль­ ной совокупности.

Линейное ортогональное преобразование

Линейное преобразование

/ = 1 .......... п

(1)

/ - 1

называется ортогональным, если оно сохраняет инвариантной

форму

% + х\ + ... + хп2'

т. е. если

пп

/ 1

( 2 )

1-1

В «-мерном эвклидовом пространстве такое преобразование соответствует вращению системы координат относительно ее

начала.

 

и приравняем коэффициенты

при

Если (1) подставим в (2)

Xj.xk (/, k — 1,..., п) с

обеих сторон, то получим условие ортого­

нальности

 

1 при j = k,

 

П

 

 

Ъ

а Ч а 1 к ~

(3 )

О при ] ф k.

1-1

 

 

Умножим /-е уравнение в (1)

на aik, а затем просуммируем по­

лученные уравнения по i (i — 1,..., п). Тогда в силу (3) найдем

х1=^аУ^* ' = ! > ■ • • > « ,

( 4)

 

П

 

 

/=1

20

т. е. матрица обратного преобразования

(4)

является транспони­

рованной матрицей преобразования (1).

 

 

 

 

 

В силу

(2)

обратное преобразование

 

(4)

также ортогонально

и, следовательно, для него

выполняется

условие ортогональности

 

 

 

| 1

при /

=

k.

 

 

(5)

 

 

 

\ 0

при j

ф k.

 

 

 

 

 

 

 

 

Точно так же доказывается обратное: условие (3)

есть следствие

условия (5).

 

 

 

 

 

Пц ||

 

 

Из (3)

и

(5) следует, что в

матрице

||

ортогонального

преобразования (1) сумма

квадратов

элементов

каждого

ряда

(столбца или строки) равна

единице, а сумма произведений

соот­

ветствующих элементов двухлюбых параллельных рядов с разны­

ми номерами равна нулю. Поэтому

произведение матрицы || aif ||

на транспонированную

матрицу

||

а н ||

равно единичной матрице

Е т а

 

II Щ, || •

|| а п || =

£ .

 

 

 

 

Отсюда следует, что определитель линейного ортогонального

преобразования (1)

равен + 1.

 

 

 

 

Т е о р е м а . Любое я-е равенство

 

 

 

 

 

/I

 

 

 

 

 

 

Ун ^ „ j X j ,

 

 

 

 

/-1

 

 

 

коэффициенты которого удовлетворяют условию

 

 

 

П

 

 

 

 

 

 

V <

1

- 1 >

 

 

 

 

/ - 1

 

 

 

преобразова-

можно дополнить

до

некоторого

ортогонального

ния (1).

 

 

 

 

 

(п — 1)-го ра-

Доказательство. Для неизвестных коэффициентов

венства

 

 

 

 

 

 

Уп—1— У] Чп 1, / Xj

1-1

в силу (5)

 

п

(6)

ап j ап- 1, i — 0;

/ - 1

 

П

 

V а«2 -1, / =■1.

(7)

f t

 

Линейное однородное уравнение (6) имеет ненулевое решение. Умножив это решение на подходящий множитель, удовлетворим и квадратному уравнению (7).

После этого для неизвестных коэффициентов (п ■— 2)-го равен­ ства в силу (5) получим два линейных однородных и одно квадрат­ ное уравнение. Система этих линейных уравнений имеет ненулевое-

21

рошенне. Умножив это решение на подходящий множитель, удовлет­ ворим п квадратному уравнению. Продолжая так далее, найдем искомое ортогональное преобразование. Теорема доказана.

В частности, если

nJ

J = 1» • п,

 

V n

ТО При 1 = 1,..., п — 1 из (5) получим

У,ац = 0.

(8)

/-1

 

Распределения среднего и дисперсии выборки из нормальной совокупности

Пусть имеем выборку

Х\,

• • • j хп

(9)

из нормальной генеральной совокупности X с параметрами шх и о.(. Для выборочных среднего и дисперсии

-

 

1

 

X

 

X-L,

 

 

 

п —1

 

 

 

1

 

 

 

(l i=1

 

 

Априори величины ,v и s'2 случайные.

Найдем их распределения.

Известно, что линейная комбинация нормальных независимых

случайных величин нормальна. Но

по

условию случайные вели­

чины (9) нормальны и независимы. Поэтому среднее х также нор­ мально, причем

т7 = М

D - — D

X

1 "

= — ^ М \ Х \ = тх\

п / - 1

п 1

 

I VI

1 "

а2

п i>1 Кг

= l . ^ D \ x ] = -= -;

па ,-ti

п.

о—~

1/ D - =

 

 

 

 

X

г х

 

V n

'

 

 

 

 

 

 

 

 

Итак, х распределено

нормально с параметрами

 

a

т г.

з =

3Л-

 

 

V n '

 

 

Далее имеем

 

 

 

 

 

 

_

 

1

И

_

 

1 Я

 

 

( 10)

- ^ { x l - x f = - L ^ x i i - x \

п i t 1

 

 

 

п i~I

 

 

22

Над л',,..., хп произведем линейное ортогональное преобразо­ вание (1), для которого

»1

Уп = ) ± Т п : х1 = У п х - 1-1 У >1

Величины у I,

 

будут

нормальны,

п

для

в силу (1), (8)

и (5)

получим

 

 

 

М |_у(| =

М

2

uu xj

V « ,7/V/[X|

 

V « y = 0;

 

/-1

 

/=1

 

l-i

 

i

an xj =

Yi iill D\X\ =

S

У « /,= <#

 

1-1

 

>-1

 

 

( 1 1)

п— 1

(12)

 

f D l r *x.

 

 

 

(13)

i=hi

(i,J = 1,

- , «) в силу

(12), (1),

(5) и (8)

■• •) х„ найдем

п

 

п

 

 

м

п

 

 

 

V aik х к V ajlx l

=

2

а'каЛМ

=

M\y,yj\ = M

i-i

 

 

к, l

1

 

= M [,Y»| £ aihajk + M * \ x \ v а1Лал =

M*\X\ V a,k V Uj, -

*=1

к,

l

 

 

l

1

£a lkajk = 0,

*-i

t . e. у i, ... ,

yn— некоррелнрованны,

а поэтому н независимы,

так

как из

некоррелированности

нормальных

величин следует их

не­

зависимость.

имеем

 

 

 

 

Из

(Ю),

(2) и (11)

 

 

 

 

 

 

1

Г»

1

1

н-1

(И)

 

 

S3= — V у ) ------Уп2 = ~

V )’(>

откуда

 

п

,Г|

пп

п

—1

 

 

 

ns

л-1 .

 

 

 

 

 

- у

' l l

 

 

 

 

 

 

 

, 3v

 

 

т. е. случайную величину

ns*

(15)

согласно (12) и (13) представили как сумму квадратов нормальных нормированных независимых случайных величин

i = 1,

, я - 1 .

алг

Поэтому величина (15) для выборки (9) пз нормальной гене-

23

ральной совокупности X имеет распределение

с п — 1 степенями

свободы. Это верно и для величины

 

 

— l)s 2

п - 1

1 l

 

2

 

 

а,.

 

где s2— несмещенная выборочная дисперсия.

Возможность исключения одной степени свободы у п для s2 и s2 объясняется тем, что величины

(xt х), i = 1,. . . , п

связаны одной зависимостью

 

t

(* /-* ) = о.

 

i

1

Так как

у п независимы, то в силу (11) и (14) независимы

и случайные величины х и s2.

Доверительный интервал

В лекции 1 показано, как по выборке (9) найти точечную оценку

0 ( а ь . . . , хп) неизвестного параметра 0.

Теперь укажем, как найти

точность этой оценки.

 

 

Зная закон распределения несмещенной точечной оценки 0,

можно для заданного близкого к единице числа

\ — р найти такое

ЧИСЛО 81 _ р , ЧТО

 

 

Р ( | 0 — в | < е , . р) =

\ - р .

(16)

Здесь е г _ н есть точность оценки 0, а число 1 — р называется

доверительной вероятностью, или надежностью этой оценки.

Равенство (16) означает, что интервал

0 - e 1. p < 0 < 0 + s,_„

(17)

со случайными концами накрывает неизвестный параметр 0

с за­

данной вероятностью 1 — р.

 

Этот интервал называется доверительным и является интерваль­ ной оценкой параметра 0.

Доверительный интервал для генерального среднего нормальной совокупности

Для генеральных

среднего

тх и

дисперсии / Д ^ з 2 имеем

выборочные оценки

 

 

 

— 1

п

 

Е и* -

я

1 - 1

п-

1 t

24

Найдем доверительный интервал для тх нормальной совокуп­ ности X при известном ах и доверительной вероятности 1— р.

Положим

г 1- р — «3Г = «

У п

 

 

( 18)

 

 

 

 

 

 

и для нормальной случайной величины .v

со средним /я—= тх при­

меним известную формулу

 

 

 

 

 

Р { \ х тхI < г) =

2Ф ^

| — 1,

 

(19)

где Ф (х)— функция Лапласа, т.

е. функция распределения нор­

мальной нормированной случайной величины.

 

 

Сравнив (19) с (16), при 0 =

х,

(-) =

тх и e =

n i _ P в силу

(18)

получим

 

 

 

 

 

 

 

Ф(и) =

1

- А

)

 

 

т. е. и есть квантиль и

,, нормального нормированного распреде-

 

2

1

л

 

 

(17),

ления, отвечающий вероятности

—. Поэтому согласно

(18) найдем искомый доверительный интервал

 

 

х-----„ < т г < * ф

j - - u

У я

1~*

(20)

У я

>"т

 

 

 

Найдем доверительный интервал для тх нормальной совокуп­ ности X при неизвестном ах и доверительной вероятности 1 — р.

Для нормальной X величина

имеет нормальное нормированное распределение, а величина

; 1 ) ?

(21)

аг

х

— распределение x«_i Величины U и V независимы, так как неза­ висимы х и s2. Поэтому по определению величина

 

Т -2

и \

f

= V n х

(22)

 

 

У

 

V

 

s

имеет распределение

Стьюдента с я — 1

степенями свободы. Для

нее из (16)

при 0 =

7, 0

=

0, e i _ p= /

в силу четности плотности

вероятности

распределения Стьюдента f(t)

найдем

25

P ( \ T \ < t ) = 2 \ f h ) d z - 1 — p.

(23)

Следовательно,

 

 

 

 

F (t) = f f (t ) d z

= ( / (t ) d z +

f / (t ) d z -

- i - +

- Ц = £

- 'o o

_'<*>

о

2

2

Отсюда

^ ( 0 - 1

t . e. / есть квантиль / распределения Стыодента с п — 1 степе­

нным свободы, отвечающий вероятности 1— Поэтому для Т при

доверительной вероятности 1 - р согласно (23) имеем интерваль­ ную оценку

m < * . ^

Подставив сюда выражение для Т из (22) н разрешив затем полученное неравенство относительно tnx, найдем искомый довери­ тельный интервал

 

 

 

х

1

< mx < х +

1 „,

(24)

 

 

 

У п

]-~2

 

V «

 

для

которого,

в отличие от

(20),

случайно не

только

положение,

по и длина.

интервалы

(20) и

(24) практически

совпадают,

 

При

п > 3 0

так

как

при п > 3 0 распределение

Стыодента

практически совпа­

дает с нормальным нормированным распределением. Но при п < 30 интервал (20) может быть существенно уже интервала (24). Это объясняется тем, что при его построении использовалась дополни­ тельная информация о значении ол.

Длина доверительного интервала А, доверительная вероятность

1— р и объем выборки

п взаимосвязаны. Например, для (20)

имеем

 

Поэтому, задавшись

значениями двух любых из трех величин

А, 1 — р и п, можно найти неизвестную третью величину.

Доверительный интервал для генеральной дисперсии нормальной совокупности

Для нормальной X величина (21) имеет распределение Х«-ъ

Поэтому можно найти такую пару чисел щ, v2, что

 

p ( ^ < ( Я~ 1)52 < v ) j = \ - p .

(25)

26

Таких пар чисел vu v2 бесконечно много. Па практике обычно берут центральный доверительный интервал, для которого вероят­

ности выхода величины (21) за интервал влево и вправо одпна-

р

ковы и равны — . При этом для н, и v2 имеем уравнения

2

Р( V < v x) = - | ;

P ( V < v 2) = l - - ^ ,

т. е. Oj и и2 есть

квантили х„ и х2

распределения у* с

п — 1

степенями свободы,

отвечающие вероятностям -^-и 1---- —.

Поэто­

му для величины (21) при доверительной вероятности 1— р соглас­ но (25) имеем интервальную оценку

2

( И -

1)?

2

'■JL ^

,2

^

Р •

2

а-

2

Разрешив эти неравенства относительно стЛ-\ найдем доверитель­

ный интервал

 

(/?— l)s* <

_(л — 1)7*

2

для генеральной дисперсии оЛ2 при доверительной вероятности 1—р.

27

Л е к ц и я 4. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Метод проверки статистических гипотез.

Проверка гипотезы о равенстве генеральных средних нормаль­ ных совокупностей.

Проверка гипотезы о равенстве генеральных дисперсий нормаль­ ных совокупностей.

Проверка гипотезы о законе распределения по критерию согласия х2-

Метод проверки статистических гипотез

Статистическими гипотезами называются любые гипотезы отно­ сительно генеральных совокупностей.

Задача проверки статистической гипотезы Н относительно гене­ ральной совокупности X ставится так: найти правило, позволяющее по выборке из X

.Vi, х2, .... хп

(1)

обоснованно решать вопрос о принятии пли отклонении гипотезы Н. Эта задача решается следующим статистическим методом. Выбирают критерий проверки, т. е. некоторую функцию от

выборки (1)

(2)

Z = Z(xh х2, . . ., хп),

для априорного значения которой условные плотности вероятностей j\(Z/H) и f2 (Z/'H) относительно проверяемой гипотезы Н и конкури­

рующей с ней гипотезы Н известны.

Задают уровень значимости р, т. е. столь малую вероятность р, что события, появляющиеся с этой вероятностью, можно в данной

ситуации

считать

практически невозможными. Обычно берут

/> = 0,05;

/> = 0,02

или /> =

0,01.

Далее по известным р,

f\(ZfH), f2(ZlH) находят так называе­

мую критическую область G из условий

 

 

P ( Z e Q I H ) = p \

 

 

P ( Z c G!.H) — max.

Величина

r==P(ZGOjW)

28

называется мощностью критерия Z. Она является доверительной вероятностью попадания значения критерия (2) в критическую область Снесли проверяемая гипотеза Н не верна, т. е. верна гипотеза Н (рис. 5).

и учтем, что события Z е G и Z е G при гипотезе Н противополож­

ны. Тогда

— _

_

 

_q P ( Z e QfH) =

1— Р (Z е G/H) = 1 — г.

Дополнение критической области G до множества всех возмож­ ных значений критерия Z называется доверительной областью кри­

терия Z. На рис. 5 по оси 2

справа от критической точки 2 i _ p

лежит критическая область,

а слева — доверительная область,

которая при гипотезе Н является доверительным интервалом вели­ чины Z, отвечающим доверительной вероятности 1— р.

Если значение критерия (2), вычисленное по выборке (1), попадет в критическую область G, то гипотезу Н отклоняют в

пользу гипотезы Н, так как попадание критерия Z в область G при гипотезе Н практически невозможно, а поэтому несовместимо с Н.

Если же значение критерия Z попадет в доверительную область, то гипотезу Н принимают, так как попадание критерия Z в эту область при гипотезе 11 практически достоверно, а поэтому совме­ стимо с И.

При такой проверке гипотезы Н возможны ошибки двоякого

рода.

Н

отклоняют,

Ошибка 1-го рода состоит в том, что гипотезу

когда она верна. Вероятность этой ошибки равна р.

И

 

Ошибка 2-го рода состоит в том, что гипотезу

принимают,

когда она не верна. Вероятность этой ошибки равна </= 1— г.

Из рис. 5 видно, что с уменьшением р возрастает q

и наоборот,

29

Соседние файлы в папке книги из ГПНТБ