Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистические методы анализа и обработки наблюдений

..pdf
Скачиваний:
11
Добавлен:
15.11.2022
Размер:
10.29 Mб
Скачать

6.3. СРАВНЕНИЕ ДИСПЕРСИЙ

131

лучаем окончательную доверительную оценку генерального стандарта:

/ Y k

/ Yk

(6.7)

Y k + P n U i- p / 2

Yk $пих-р/2

 

Если частичные выборки имеют различные объемы пь то можно снова пользоваться оценкой (6.7), но величина I определится теперь равенством

2w ‘yn,

/= .£=.J___ !_

где числа уп = ——также приведены в таблице VI При­

ложения.

6.3. Сравнение дисперсий. Одной из важнейших задач статистической обработки наблюдений является сравнение двух или нескольких выборочных дисперсий. Основной выясняемый вопрос при этом — можно ли считать сравни­ ваемые выборочные дисперсии оценками одной и той же генеральной дисперсии. С такой задачей, в частности, при­ ходится сталкиваться при вычислении дисперсии по «те­ кущим измерениям».

Начнем со сравнения двух дисперсий sj и s\, имеющих соответственно и /2 степеней свободы. Будем считать, что первая выборка сделана из генеральной совокупности с дисперсией о\у а вторая — из генеральной совокупности с дисперсией а\. Выдвигается нулевая гипотеза (п. 5.4) — гипотеза о равенстве o\=ol. Для того чтобы отвергнуть эту гипотезу, нужно доказать значимость расхождения между s? и s2 при выбранном уровне значимости р. В качестве кри­ терия значимости обычно используется так называемое

распределение Фишера.

Распределением Фишера (или F-распределением) назы­ вается распределение случайной величины:

5*

132

§6. ОЦЕНКА РЕЗУЛЬТАТОВ НАБ ЛЮДЕНИЙ

 

 

Это

распределение зависит

только

от

Д

и /2,

при этом

/ (/х, / 2) = F J

,,

На рис. 23 приведены графики плотности

/'-распределения

при сочетаниях (Д, /2)=(10,4) и (10,50).

 

 

 

 

 

 

Как и в случае х2-распреде-

 

 

 

 

 

 

ления, плотность

рассмат­

 

 

 

 

 

 

ривается

лишь

на

поло­

 

 

 

 

 

 

жительной

полуоси,

т. е.

 

 

 

 

 

 

при

0 ^ / < о о .

Кривые

 

 

 

 

 

 

имеют асимметричную фор­

 

 

 

 

 

 

му. В таблице VII Прило­

 

 

 

 

 

 

жения даны квантили / \

 

 

 

 

 

 

для

некоторых

наиболее

 

 

 

 

 

 

употребительных

уровней

 

 

 

 

 

 

значимости

и различных

 

 

 

 

 

 

комбинаций /х и /2. При

 

 

 

 

 

 

нахождении

квантилей

ших в таблицу,

используется

для значений р, не вошед­

очевидное соотношение

 

 

 

 

 

¥ р

f*> = Fx_p (h, М

 

 

 

 

Например, /

0)95 (4,3) =

9,1;

/ 0 05 (3,4) -

=

0,11.

 

С

помощью

/ ’-распределения можно

находить довери-

тельные оценки

 

 

°i

Р

 

доверительная

для отношения —

Если

 

 

 

 

 

 

°2

 

 

 

 

 

вероятность равна 1—р, то имеем двустороннюю оценку

 

 

1 — Р/ 2

(/1. /«)

 

 

~ Р /

2 (/>. /о

 

 

 

 

 

 

 

 

 

 

 

или

односторонние оценки

 

 

 

 

 

 

 

f l c i l p

I f

n

2 ^

,

 

1

 

 

 

_ 2 ^

. 2

 

- p ( / 2 > / l ) >

 

 

 

 

 

»

«

 

 

 

 

sl F i - p ( f i ' f i )

 

Вернемся

к

рассмотрению нулевой гипотезы,

согласно

 

a 2

 

 

 

 

 

s 2

 

 

 

которой —^ = 1 . В этом случае

/ ’- - — и, следовательно,

п -

с

2

й2

/ ’-распределение может быть использовано непосредственно

6.3. СРАВНЕНИЕ ДИСПЕРСИЙ

133

для оценки отношения —

С вероятностью

 

1—р должно

 

S 2

 

 

 

 

 

 

выполняться двустороннее неравенство

 

 

 

 

1

 

 

Р / 2

(/1, /:

( 6 . 8 )

F l-p/2 if*’ fl)

st

 

 

 

 

 

 

или одно из односторонних неравенств

 

 

 

~~2 ^

^ 1 - р (/1> /г) > ~ ^

- р

 

77

Г )

 

s i

F

S-

 

-И/2’

Не­

вероятность

любого

противоположного

 

неравенства

равна уровню значимости р. Значит, согласно принципу значимости (п. 5.3) противоположные неравенства невоз­ можны, если справедлива нулевая гипотеза. Иными сло­

вами,

противоположные неравенства образуют критиче-

скую

S“

область проверяемой гипотезы, и если отношение —Е

 

sl

на самом деле попадает в эту область, то различие между дисперсиями следует признать значимым.

Сформулируем получившиеся критерии значимости. При этом для удобства изложения будем обозначать через si большую из сравниваемых дисперсий. Если большей вы­ борочной дисперсии заведомо не может соответствовать меньшая генеральная, т. е. если неравенство aJ<CaS заве­

домо невозможно,

то

нужно

применять

односторонний

критерии, сравнивая

 

 

*1

 

отношение — с полученными выше

односторонними доверительными оценками.

Нулевая ги-

 

 

 

 

о

 

 

потеза

отвергается,

если

— >

Ft__ (/lt /2),

где значение

 

 

 

 

s2“

 

 

 

/о) берется из таблицы VII Приложения.

При

неизвестном

соотношении между о\ и о; нужно

применять двусторонний критерий, т. е. проверять, не нарушается ли установленное выше двустороннее нера­ венство (6.8). При этом левая часть неравенства (6.8) всегда выполнена, так как для] небольших р (а принятый уро­ вень значимости не может быть большим) обязательно

134

§6.

ОЦЕНКА РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ

 

1

1

а .

—р---- -— (j—f j

<- 1»в то время

как — > 1 по условию.

Поэтому нарушиться может только правая часть неравен­

ства (6.8). Следовательно, при двустороннем критерии

зна-

чимости отношение

р

s i

сравнивается только со значе­

г = —

нием F1^p/2 (/+ /2)

(также

взятым из таблицы VII

Прило-

жения), и нулевая

 

гипотеза

отвергается,

если

si

 

>

^ Fi—p/2. (/1» /г)*

 

 

 

 

 

 

 

П р и м е р . При

изучении

стабильности

температуры

в термостате получены данные 21,2; 21,8; 21,3; 21,0;

21,4;

21,3. К стабилизатору температуры применено некоторое усовершенствование, после чего (на другом режиме) полу­ чены данные: 37,7; 37,6; 37,6; 37,4. Можно ли при уров­ не значимости р=0,05 считать усовершенствование эффек­ тивным?

Эффективность стабилизаторов температуры, очевидно, зависит отдаваемой ими дисперсии температур. Таким обра­ зом, задача состоит в том, чтобы сравнить генеральные дис­ персии данных выборок температур. Вычисляем выбороч­ ные дисперсии, уменьшив для удобства вычислений все данные на 21 в первом случае и на 37,5 — во втором:

--- .

0,22 + 0,82 + 0,32 + 0,42 -f 0,32 —

 

 

Sl “ 5

 

 

 

(0,2 + Д 8 + 0,3 + 0,4 +

0,3)2 = | ( l , 0 2 - l

) =

0,07.

si = 1

[0,2J+ 0,1!+0,12+0,12-

i!2+ 0,1 + 0,1— 0,1)а

 

 

 

= 1 (0 ,0 7 —^

' )

= 0,016.

Отсюда

 

 

 

 

 

р _

° ’07

— 4 A

 

 

 

 

0,016

 

 

Числа степеней свободы /^=5, /2= 3. Усовершенствование может лишь уменьшить дисперсию, поэтому применяем од­ носторонний критерий значимости. По таблице VII Приложс-

6.3. СРАВ НЕНИ Е ДИСПЕРСИЙ

135

5а

ния находим F0 95(5,3)=9,0. Мы видим, что — = 4,4 < 9,0.

S2

 

Ь 2

Следовательно, данные наблюдений не позволяют отверг­ нуть нулевую гипотезу и считать усовершенствование эф­ фективным.

Критерий Фишера можно использовать для сравнения дисперсий и в том случае, когда одна из дисперсий является генеральной. В этом случае ее число степеней свободы счи­ тается равным с». Например, сравнивая выборочную дис­ персию s j= 0,46, имеющую /^=4 степеней свободы, с гене­ ральной дисперсией 02=0,28, мы в качестве критического значения должны взять из таблицы VII Приложения ве­ личину /^ ,95(4, оо)=2,4. Мы видим, что

S2

0,46

= 1,64 <2,4.

J_

о22

0,28

 

Следовательно, различие между выборочной и генеральной дисперсиями не является значимым.

Распределение F с бесконечным числом степеней сво­ боды можно использовать для получения доверительных оценок генеральной дисперсии по выборке объема п. Так, при доверительной вероятности 1—р справедлива двусто­ ронняя оценка:

< о 2<

Ррп (/1. 00)

(fx = n - \ ) .

F I - P / 2 ( / 1 - 0 0 )

 

К сожалению, полученная оценка не дает ничего нового по

сравнению с оценками

п. 6.2, ибо справедливо тождество

 

 

F (f 1, ~ ) = х2 (М

 

 

 

 

Л

 

Рассмотрим

теперь

вопрос о сравнении нескольких дис­

персий

s2, sf,

. . ., s%,

имеющих числа степеней

свободы

/1» /2*

•> fk

Требуется выяснить, являются ли

числа s2

оценками.одной и той же генеральной дисперсии. Сразу же

напрашивается мысль использовать

/•'-распределение —

сравнить, например, сначала s2 и Sg,

затем

и s9 и т. д

Однако такой способ сравнения может привести к ошибоч­ ному выводу — сравнивая в один прием лишь две диспер­ сии, мы лишаем себя всей информации остальных дисперсий.

136§6. ОЦЕНКА РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ

Аведь то, что невозможно на двух случайных объектах

(выборках), может стать вполне возможным на большем их числе (чем больше проводится испытаний, тем более редкие события могут произойти).

Кроме того, незначимые различия, накапливаясь от пары к паре, могут стать вполне значимыми, хотя мы этого не заметим. Разумеется, такой ошибки можно избежать, сравнивая сразу самую большую и самую маленькую дис­ персию — если уж они различаются незначимо, то и между промежуточными дисперсиями различий нет. Но и этот вывод справедлив, только если все дисперсии определены по выборкам одинаковых объемов.

Таким образом, с помощью /-'-критерия удается сравни­ вать несколько дисперсий только в случае одинаковых чисел степеней свободы у сравниваемых дисперсий. При этом вы­ явить можно только незначимость различий; если же этот критерий показывает, что наибольшая и наименьшая дис­ персия различаются значимо, то по отношению ко всем остальным дисперсиям в совокупности вывод о значимом различии может быть неверен. Мы снова сталкиваемся с необходимостью использовать при сравнении полную ин­ формацию о всех заданных дисперсиях. Такое квалифи­ цированное сравнение проводится с помощью критерия

Бартлета.

средневзвешенную дисперсию

Определим вначале

2

/,■?

 

.2 _!=_!_

f = L h -

 

I .

Вычислим величины

8 = 2,303 (/ lg ss- 2i=/1, l g s ’<).

/ k

C = i + __ !___ ( V 1 _ ±

Бартлет показал, что в случае, когда все s2 соответствуют одной генеральной дисперсии, отношение В распределено

приближенно, как X2 с k—1 степенями свободы, независимо

 

б.З. С РАВ НЕНИ Е ДИСПЕРСИЙ

137

от

лишь бы все

Это значит, что гипотезаgо равен-

стве

генеральных

дисперсий принимается, если

^ % \-р

при заданном уровне значимости р; в противном случае различие между дисперсиями sj, s*, s| нужно считать значимым.

Нетрудно видеть, что всегда С>1. Поэтому вначале вычисляют только В и сравнивают его с Х?_р. Если окажет­

ся, что В^Х1_р, то нулевую гипотезу (гипотезу о равенстве g

дисперсий) нужно принять, ибо и подавно

< В s^XJ_p.

Если же 5>Xi_p, то С придется вычислить, применяя затем критерий Бартлета полностью.

Формулы для вычисления В и С несколько упрощаются, если все /,• равны между собой. Однако в этом случае суще­ ствует более удобный (и более точный) критерий Кохрана. Кохран предложил рассматривать отношение максималь­ ной дисперсии к сумме всех остальных,

max sf

е= sj-l-s’ + . . . 4 s j ’

инашел распределение величины g. Оказалось, что это распределение зависит только от k и от числа f степеней свободы, по которым определена каждая дисперсия sf.

Втаблице VIII Приложения приведены квантили gl_p для р = 0,05 и 0,01. Если найденное по заданным дисперсиям значение g окажется больше, ч ем ^ .^ (для выбранного уров­ ня значимости), то нулевую гипотезу нужно отбросить и расхождение между дисперсиями считать значимым.

Рассмотрим следующий пример, связанный с обработ­ кой «текущих измерений» (наиболее типичный случай ис­ пользования критерия Бартлета). С помощью мостика из­ меряются электрические сопротивления нескольких про­ водников. У одних проводников сопротивление мало, у других велико; естественно опасаться, что на разных уров­ нях сопротивлений мостик обладает разной точностью. Поэтому дисперсии, полученные на разных проводниках, необходимо сравнить.

Данные измерений приведены в таблице 6.1. В этой

же таблице приведена часть расчетов для величин В и С.

138

§6. ОЦЕНКА РЕЗУЛЬТАТОВ

НАБЛЮДЕНИЙ

 

 

 

 

 

 

Т а б л и ц а 6.1

Номер

Кол-во

Диспер­

 

les?

к lg s?

1

проводни­

степеней

сия,

Ч 2

ка.

свободы,

■?

 

 

fi

i

fi

 

 

 

 

1

8

0,17

13,36

1,2304

7,8432

0,1250

2

12

0,40

4,80

1,6021

5,2252

0,0833

3

16

0,38

6,08

1,5798

7,2768

0,0625

4

16

0,62

9,92

Т,7924

4,6784

0,0625

5

10

0,54

5,40

1,7324

3,3240

0,1000

Суммы

62

27,56

24,3478 0,4333

Приведем остальные расчеты:

s2 =

 

= 0,444,

lg s2 = 1,6474,

 

f\g s2 =

62-1,6474 = 22,1388, у = 0,0161,

В =

2,303 (22,1368 — 24,3478) = 2,303

• 1,791 = 4,125,

п

, .

0,4333 —0,0161

. лос-

 

С==1 +

3 ( 5 - 1 )

= 1’035'

 

По таблице IV Приложения находим, что при четырех

степенях свободы х2 95=9,5. Мы видим, что В < х 9 95 и, зна­

чит, на уровне значимости р = 0,05 гипотезу о равенстве дисперсий нужно принять. Величина С нам не понадоби­ лась, ее вычисление приведено лишь для иллюстрации.

Критерий Бартлета позволяет в разобранном примере утверждать, что генеральная дисперсия измерений на мо­ стике не зависит от измеряемого сопротивления. Следова­ тельно, для оценки этой дисперсии могут быть использова­ ны все 67 измерений. В качестве оценки а2 нужно взять средневзвешенную дисперсию s2, которая у нас уже вы­ числена и равна 0,444. Этой дисперсии соответствуют 62 сте­ пени свободы, в силу чего можно считать, что o2= s 2; ошиб­ ка такой замены при 62 степенях свободы весьма невелика.

6.4. Сравнение средних. Не менее важной, чем сравне­ ние дисперсий, является задача о сравнении средних. На­ пример, проводя наблюдения одного и того же объекта в

6.4 СРАВНЕНИЕ СРЕДНИХ

139

течение длительного времени, мы должны проверять, ос­ тается ли при этом неизменным истинное значение изме­ ряемой величины. Другие примеры сравнения средних приводились в п. 5.4.

Пусть

заданы

две случайные выборки: xlt х2,

., хп

и Уъ Уч>

•» Уп^

взятые из нормально распределенных ге­

неральных совокупностей. Пусть генеральное среднее и генеральная дисперсия первой совокупности равны aj и

а?, второй — а2 и о\. Тогда среднее х первой выборки есть нормально распределенная случайная величина с парамет­

рами аг и — , среднее у второй выборки

есть нормально

п\

величина

с

параметрами а2

распределенная случайная

2

случайную

величину

_ _

и — (п. 4.4). Рассмотрим

6=ху.

п2

 

 

 

 

На основании свойств математического ожидания и дис­

персии (п. 2.3) находим, что

 

 

 

 

 

 

 

2

2

Мб = М7—Мг/~= а га 2,

D6 = Dx + D y = — + —

 

 

 

П \

П 2

Более того, распределение величины б также является нор­ мальным в силу линейности нормального распределения (п. 3.3), поэтому Мб и D6 будут параметрами этого распре­ деления. Это позволяет дать оценку разности аха2 с помощью квантилей стандартного нормального распреде­ ления так, как это было сделано в п. 6.1. При доверитель­ ной вероятности 1—р мы получим двустороннюю довери­ тельную оценку: •

- .

,

Г а\

о\

 

 

 

Х

У Wl-p/2

| /

~

~ ^=5 а \

а 2

 

 

 

 

 

 

 

у + и ^ р/гу

^ - + - ^

или

односторонние оценки:

 

 

 

 

 

 

-

-

1 /~ а\

°1

 

а , - а 2> х - у - и1_р у — + - ^

140 §6. ОЦЕНКА РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ

Если высказывается гипотеза ах= а2 (нулевая гипотеза), то полученные оценки могут служить критериями проверки этой гипотезы. Действительно, если нулевая гипотеза вер­ на, то должны выполняться (с вероятностью 1—р) все за­ писанные выше неравенства, где вместо аха2 стоит нуль. Нарушение каждого такого неравенства имеет вероят­ ность р, в силу чего оно является значимым (неслучайным)

событием. Таким образом, гипотеза

отвергается, если

выполнено неравенство

 

при двустороннем критерии или неравенство

при одностороннем критерии. Напомним, что односторон­ ний критерий применяется тогда, когда заранее известно,

что большему выборочному среднему или у) не может соответствовать меньшее генеральное среднее.

Указанные критерии просты и надежны, но они требуют знания а2 и а2, что не всегда возможно, особенно при обра­ ботке малых выборок. Если генеральные дисперсии а? и неизвестны и можно оперировать только выборочными дис­ персиями s? и s2, то приходится обращаться к распределе­ нию Стьюдента.

Предположим вначале, что а*=о2=о. Это равенство можно проверять по заданным st и s2 с помощью изложен­ ного в предыдущем пункте критерия Фишера. В этом слу­ чае генеральную дисперсию а2 можно оценивать средне­ взвешенной дисперсией

(Л| — l) s 2-f (/i2 — l ) s 2

пj + п2— 2

Число степеней свободы у s2 равно f= n x-\-n2—2. Дисперсия величины б имеет теперь простой вид

2 1

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]