Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2003_-_Gmurman__TV_i_MS

.pdf
Скачиваний:
21
Добавлен:
27.03.2015
Размер:
16.8 Mб
Скачать

н а б л ю д е н 11 й (и сп ы т а н и й) н а к а ж Д о м у р о в н е

о Д и н а к о в о

и равно

q.

 

 

Пусть наблюдалось

n =

pq значений

X,j признака Х,

где i - номер испытания (i =-=- 1, 2, "', q),

/ - номер уровня

фактора (j = 1,

2, "', р).

Результаты

наблюдений при­

ведены в табл. 30.

 

 

 

Введем, по

определению,

 

 

 

р

q

 

 

Sобщ= ~ ~ (Xfj-X)2

 

 

 

J =1 t= 1

 

(общая сумма квадратов отклонений наблюдаемых значе­

ний от общей средней Х),

р

SФакт = q ~ (ХГРJ-Х)2

1 = 1

(факторная сумма квадратов отклонений групповых сред­

них от общей средней, которая характеризует рассеяние

«между группами»),

 

Q

-

SOCT =

",'

~ (X/1-ХгР1)' +

q

I == 1

q

 

+ ~ (Х/а гР2)Z + ... + ~ (Xfp-ХгрР)Z

'=1

i=1

(остаточн.ая сумма квадратов отклонений наблюдаемых значений группы от своей групповой средней, которая

характеризует рассеяние «внутри групп»).

Практически остаточную сумму находят по равенству (см. § 3, следствие)

 

 

 

SOCT =

SОбщSфакт'

 

 

Элементарными

преобразованиями можно получить

формулы,

более удобные для расчетов:

 

 

 

 

Sобщ=

PJ-

[(:±

RJ)IJ(pq)J,

(*)

 

 

 

i=1

 

1",,1

 

 

 

 

 

SФакт=[C~ Ri}q] - [C~ RJ)'f (pq)].

(**)

 

q

 

 

 

 

 

 

 

где Pj =

~ Х~J-сумма

квадратов

значений

признака

на

 

i= 1

q

 

 

 

 

 

 

 

 

 

 

 

 

 

уровне

.Fj

; RJ= ~ X,J-сумма

значений

признака

на

 

 

1= 1

 

 

 

 

 

уровне

FJ

 

 

 

 

 

 

351

3 а м е ч а н и е. Для упрощения вычислений ВЫЧJlтают из каждого

наблюдаемого значения одно и то же число С, примерно равное

общей средней. Если уменьшенные значения Yij=)',ij-C, то

Q

где Qj= ~ У~/-сумма квадратов уменьшеиных значений признака

;= 1

 

 

 

Q

 

 

на

уровне

Fj ; T j =

~ YI'j-сумма

уменьшенных

знаtJений признака

на

уровне

Fj

i= \

 

 

 

 

 

 

Для вывода формул (***) и (*.....) достаточио подставить Хц = Yij+C

 

 

.

Q

q

q

В соотношение (*) и Rj = ~ Хи= ~ (Vi/+C)

. ~!Iij+qC=Tj+qC

;=\

;=1

;=1

всоотношение (**).

по я с н е н ия. 1. Убедимся, что SФакт характеризует

воздействие фактора Р. Допуст,Им, что фактор оказывает

существенное влияние на Х. Тогда группа наблюдаемых значений признака на одном определенном уровне, вообще говоря, отличается от групп наблюдений на других уров­

нях. С.педовательно, различаются и групповые средние,

причем они тем больше рассеяны вокруг общей средней, чем большим окажется воздействие фактора. Отсюда сле­

дует, что для оценки воздействия фактора целесообразно составить сумму квадратов отклонений групповых сред­ них от общей средней (отклонение возводят в квадрат,

чтобы исключить погашение положительных и отрица-

-тельных отклонений). Умножив эту сумму на q, получим

Sфакт' Итак, SФакт характеризует воздействие фактора.

2. Убедимся, что SOCT отражает влияние случайных причин. Казалось бы, наблюдения одной группы не

должны различаться. Однако, поскольку на Х, кроме

фактора Р, воздейству~т и случайные причины наблюде­

ния одной и той же группы, вообще говоря, различны

и, значит, рассеяны вокруг своей групповой средней. Отсюда следует, что для оценки влияния случайных при­

чин целесообразно составить ~YMMy квадратов отклонений наблюдаемых значений каждой группы от своей групповой

средней, т. е. Socт. Итак, SOCT характеризует воздействие

случайных причин.

352

3. Убедимся, что Sобщ отражает влияние и фактора и

случайных причин. Будем рассматривать вс.е наблюдения как единую совокупность. Наблюдаемые значения при­

знака различны вследствие воздействия фактора и случай~

ных причин. Для оценки этого воздействия целесообразно

составить сумму квадратов отклонений наблюдаеу.,·IЫХ зна­

чений от общей средней, т. е. SОбщ'

Итак, Sобщ характеризует влияние фактора и случай­

ных причин.

Приведем пример, который наглядно показывает, что

факторная сумма отражает влияние фактора, а остаточ­

ная -влияние случайных причин.

Пример. Двумя приборами произведены по два измерения физи­ ческой величины, истинный размер которой равен х. Рассматривая

вкачестве фактора систематнческую ошибку С, а в качестве его

уровней - систематические ошибки С1 и С2 соответственно первого

н втор()го прибора. показать, что Sфакт определяется систематиче­ скими, а Sост-случайными ошибками измереинЙ.

Реш е н н е. Введем обозначения: 0;1, 0;2 - случайные ошибки

первого и второго измерений первым прибором; ~1' ~2-случайные

ошибки первого и второго измерений вторым прибором.

Тогда наблюдаемые значения результатов измерений соответст­

веино равны (первый индекс при х указывает номер измеРt!ниSJ,

а второй - номер прибора):

ха =Х+С1+0;1, Х'I =х+С} +0;2; Х12=Х+С, +~1. Х'2=Х+С'+ ~2'

Среднне значения измерений первым и вторым приборами соот­

ветственно равны:

Хгр 1 =Х+С1 + [(0;1 +(2 )/2] =Х+С1+0;,

Хгр 2 =Х +С,+ [Фl+ ~2)/2] = Х+С2+ (J.

Общая средняя

х= (Хгр 1 +Хгр 2)/2 =х+ (С} +С2)/2]+ [(о; +(J)/2J,

факториая сумма

Sфакт = гр }-х)1!+гр 2-;)2.

Подставив величины, заключенные в скобках, после элементарных преобразовании получим

SФакт = [(С}-С2)2/2] +(C}-C1 ) (0;- (J) +[(0;- ~)2/2].

Мы видим, что SФакт определяется главным образом, первым слагаемым (поскольку случайные ошибки измерений малы) и. следо­ вательно, действительно отражает влияние фактора С.

Остаточная сумма

SOCT= (Xll-Xrp })2+ (Х21-ХГР })2 + (Хl1- ХГР 2)' + (XI2Xrp ,)2.

Подставив величины, заключеиные в скобках, получим

SOCT = [(о;} - 0;)2 +(О;а - 0;)') +((l}l-I})' +(~I- ~)2).

23

273()

353

Мы видим, что SOCT определяется случайными ошибками измере­

ний и, следовательно, действительно отражает влияние случайиых

причин.

3 а м е ч а н и е. То, что SOCT порождается случайными причинами,

следует также из равенства (см. § 3, следствие)

SOCT =

Sобщ -

Sфакт'

 

Действительно, Sобщ является результатом

воздействия фактора

и случайиых причин; вычитая SФакт,

мы исключаем влияние фактора.

Следовательно, «оставшаяся

часть:.

отражает

влияние случайных

причин.

§3. Связь между общей, факторноА

иостаточной суммами

 

Покажем,

что

 

 

 

 

 

SОбщ =

SФакт + SOCT'

 

ДЛЯ

упрощения

вывода

ограничимся двумя

уровнями

=

2) и двумя испытаниями на

каждом уровне (q = 2).

Результаты испытаний представим

в виде табл.

31.

Т а б л и ц а 31

Номер

испытания

t

I

2

-

Хгрj

Тогда

Уровни фактора

I

I

F,

I

F.

 

 

 

X1l

 

X12

 

Хн

 

Х22

 

-

 

-

 

Хгр 1

 

Хгр 2

Sобщ = l1-Х)' + (X 21 -X)2 + (X12 -X)2 + 22-х)2.

Вычтем и прибавим к каждому наблюдаемому значению

на первом уровне групповую среднюю ХГРl' а на вто­

РОМ-Хгр2' Выполнив возведение в квадрат и учитывая, что сумма всех удвоенных произведений равна нулю

(рекомендуем читателю убедиться в этом самостоятельно),

получим

SОбщ = 2 [(xrp1 -X)2 + гр2 -х)2] + [(xl1 - Xrp1)2+

+(~21-ХГРl)2 +(xlz-Xrp2)' + (Х22-ХГР2)'] =

=SФакr + Socr.

354

Итак,

Sобщ = SФакт + SOCT'

С Л е Д с т в и е. Из полученного, равенства вытекает

важное следствие:

SOCT = Sо6щSФакт'

Отсюда видно, что нет надобности непосредственно вы­

числять остаточную сумму: достаточно найти общую и

факторную суммы, а затем их разность.

§ 4. Общая, факторная и остаточная дисперсии

Разделив суммы квадратов отклонений на соот­

ветствующее число степеней свободы, получим общую,

факторную и остаточную дисперсии:

2

SОбщ

2

SФакт

~

SOCT

Sобщ =

pq _ l'Sфакт =

р _ l'Socт =

р (q - 1~ ,

где р-число уровней фактора; q-число наблюдений на

каждом уровне; рq-l-число степеней свободы общей

дисперсии; р-l-число степеней свободы факторной

дисперсии; р(q--l)-число степеней свободы остаточной

дисперсии.

Если нулевая гипотеза о равенстве средних справед­

лива, то все эти дисперсии являются несмещенными

оценками генеральной дисперсии. Например, учитывая,

что объем выборки n = pq, заключаем, что

:1 Sобщ Sобщ

S06щ=pq-l = n - i

-исправленная выборочная дисперсия, которая, как известио, являет­

ся несме[Ценной оценкой генеральной дисперсии.

3 а м е ч а и и е. Число степеией свободы р (q-l) остаточной

дисперсии равно разностн между числами степенеil свободы об[Цей и

факторной дисперсий. Действительно,

(pq-l)-(p-I)=pq-p=p(q-l).

§ 5. Сравнение нескольких средних методом

дисперсионного анализа

Вернемся к задаче, поставленной в § 1: прове­

рить при заданном уровне значимости нулевую гипотезу

о равенстве нескольких (р> 2) средних нормальных со­ вокупностей с неизвестными, но одинаковыми дисперси~

2,*

355

ями. Покажем, что решение этой задачи сводится к срав­

нению факторной и остаточной дисперсий по критерию

Фишера-Снедекора (см. гл. XIX, § 8).

1. Пусть нулевая гипотеза о равенстве нескольких

средних (далее будем называть их групповыми) пра­

вильна. В этом случае факторная и остаточная дисперсии являются несмещенными оценками неизвестной генераль­ ной дисперсии (см. § 4) и, следовательно, различаются

незначимо. Если сравнить эти оценки по критерию Р, то очевидно, критерий укажет, что нулевую гипотезу о

равенстве факторной и остаточной дисперсий следует

принять.

Таким образом, если гипотеза о равенстве групповых

средних правильна, то верна и гипотеза о равенстве фак­

торной и остаточной дисперсий.

2. Пусть нулевая гипотеза о равенстве групповых средних ложна. В этом случае с возрастанием расхожде­

ния между групповыми средними увеличивается фактор-

ная дисперсия, а вместе с неи- и отношение F на6л = Sфакт~ /SостI '

В итоге РНа6Л окажется больше Ркр и, следовательно, гипотеза о равенстве дисперсий будет отвергнута.

Таким образом, если гипотеза о равенстве групповых

средних ложна, то ложна и гипотеза о равенстве фак­

торной и остаточной дисперсий.

Легко доказать от противного справедливость обрат­ ных утверждений: из правильности (ложности) гипотезы

одисперсиях следует правильность (ложность) гипотезы

осредних.

Итак, для того чтобы проверить нулевую гипотезу о равенстве групповых средних нормальных совокупностей

с одинаковыми дисперсиями, достаточно nрове!'ить по

критерию F нулевую гипотезу о равенстве факторной и

осrrшточной дисперсий. В этом и состоит метод диспер­

сионного анализа.

3 а м е ч а н и е 1. Если факториая дисперсия окажется меньше

остаточной, то уже отсюда следует справедливость гипотезы о равен­

стве групповых средних и, зиачит, нет надобиости прибегать к кри­

терию Р,

3 а м е ч а н и е 2. Если нет увереииости в справедливости пред­

положения о равенстве дисперсий рассматриваемых р совокупностей,

То ЭТО предположение следует проверить

предварительно, напрнмер

по критерию Кочрена.

 

Прнмер. Произведено по 4 испытания

иа кажлом нз трех уров­

ней. Результаты испытаиий приведеиы в

табл. 32. Методом диспер­

сиониого анализа при уровне значимоСТИ 0,05 проверить нулевую

356

Таблица 32

Номер

испытания

L

1

2

3

4

-

Хг'р}

I

I

Уровни Фактора Р)

Р,

I

Р.

I

Р.

 

 

51

 

52

 

42

52

 

54

 

44

56

 

56

 

50

57

 

58

 

52

54

 

55

 

47

гипОТЕЗУ о равенстве групповых средних. Предполагается, что выборки извлечены из нормальных совокупностей с одинаковыми дисперсиями.

Реш е н и е. Для упрощения

расчета

вычтем С = 52 из каждого

иаблюдаемого

зиачения:

Yij = х,'} -

52.

Составим

расчетную табл. 33.

Пользуясь

таблицей

и

учитывая,

что

число

уровней фактора

р = 3, число

испытаний

на

каждом уровне

q =

4,

найдем общую и

факторную суммы квадратов отклонеиий

(см.

§ 2, формулы (***)

 

 

 

 

 

 

 

 

 

ТаБJlнцаЗ3

Номер

 

УРО8НИ фактора Fj

 

 

 

исnытання

 

 

 

 

 

 

 

 

 

.-

 

",

 

!I(.

I !/~а

1

-1

1

2

О

О

3

4

16

4

5

25

4

 

 

QJ= ~ u:/

 

42

L= I

 

I

T j = ~Yjl

8

I

2

64

тJ

 

I

Р.

 

I

Р.

ИтоговыJl

 

столбец

I !liz

 

I Jljз

I

 

I

2

~

!l{2

Ч'3

О

 

О,

-10

 

100

2

 

4

- 8

 

64

4

 

16

-2

 

4

6

 

36

О

 

О

 

 

56

 

 

168 ~QI=266

12

 

 

-20

I~T,=O

 

 

 

144

I

 

I400

I

I~тj=б08

357

и (****»:

SОБЩ=.~Qj- [( ~ Tj)~1(pq>] =266-0=266;

J= 1

J= 1

 

Sфакт=r t

TiIQ]-[(' t T j )2

(pQ»=(608/4)-0= 152.

1... 1

 

,1= 1

J

Найдем остаточную сумму квадратов отклонений:

SOCT = SоБЩ-Sфакт= 266-152= 114.

Найдем факторную и остаточную дисперсии:

Sфакт = Sфакт/(Р-

1) = 152/(3 -1) =

76;

S~T = SOCy/(p(q-l» =

114/3 (4-1) = 114/9 = 12,67.

Сравиим факторную и остаточную дисперсии по

критерию F (см.

гл. XIX, § 8), для чего найдем наблюдаемое значеиие критерия:

Fнаб:n.=S2факт/Soc~ т=76/12,67 = 6.

Учитывая, Ч'Ю число степеней свободы числителя k 1 = 2, а зиа­

менатео1Я k 2 = 9 и уровень зиачИмости а = 0,05, по таблице приложе­

ния 7 находнм критическую точку:

Fкр(О,05; 2; 9) = 4,26.

Так как Fнабл> Fкр-нулевую гипотезу о равеистве групповых

средних отвергаем. Другими словами, груrшовые средние св целом»

различаются значимо.

Если требуется сравнить средиие попарно, то

следует воспользоваться критерием Стьюдента.

3 а м е ч а н и е З.

Если наблюдаемые значения Хij-десятичные

дроби с одннм знаком после запятой, то целесообразно перейти к

числам Yij= 10Xjj-C, где С-примерно среднее зиачение чисел 10xjj'

В итоге получим сравнительно небольшие ц е л ы е числа. Хотя

при

этом факторная

и остаточная дисперсия увеличиваются в

102 раз,

их

отношеиие не

изменится. Например, если Хl1= 12,1,

X 21= 12,2,

Ха1 = 12,6, 10, приняв Yij= 10'Хij-12З, получим: Y1l = 121-123 = -2, У21= 122-123=-1, Уаl= 126-123=3.

Аналогично поступают, если после запятой имеется k знаков:

Уц= IOkX(/-С'

§ 6. Неодинаковое число испытаний

на различных уровнях

Выше число испытаний на различных уровнях

предполагалось одинаковым. Пусть число испытаний на

различных уровнях, вообще говuря, различно, а именно:

произведено q1 испытаний на уровне

Р1, q2 испытаний -

на уровне Р2•••• qp испытаний-на

уровне Рр• В этом

358

случае общую сумму квадратов отклонений находят по

формуле

SОбщ =

} + Р. + ... + Рр]- [(Rt

+R, + ... +Rp)'/n].

 

 

q.

 

 

 

 

 

 

где

P 1 =

~ X~l-CYMMa квадратов

наблюдавшихся

значе­

 

 

'= 1

ннй признака на уровне Р1;

 

 

 

 

 

 

Р,=

~ Xla-сумма квадратов

наблюдавшихся значе­

 

 

t::; 1

 

 

 

 

 

 

 

 

 

ний

признака

на

уровне

Р.;

 

• •

 

 

Чр

 

 

 

 

 

 

 

Рр =

~ xlp -

сумма квадратов

наблюдавшихся значе­

 

 

,::: I

ний признака на уровне Fр;

 

 

 

 

 

 

 

'1.

 

q.

 

 

qР

 

R 1 =

~ Xiit

R.·

~ Xi,.

"',

Яр=

~X/p-CYMMЫ

 

 

,;;;; I

 

,::;: 1

 

 

';;;; 1

 

наблюдавшихся значений признака соответственно на уров­

нях F 1" F а' ... , Fр;

n=ql+qz+ ... +qр-общее число испытаний (объем

выборки).

Если для упрощения вычислений И3 каждого наблю­

давшегося ~начения Хu вычитали одно и то же число С

и приняли Yij =x/j-C, rn

SОбщ=[Ql+Q.+ ... +Qp]-[(T1 +T.+ ... + Тр)l/n].

 

q.

q.

 

где

Ql = ~ Yll' Q. =

~ Y~•• ...•

 

 

,= 1

'=q1

 

 

q~

р

 

Т, =

~ У/а. "', Тр = ~ Yip'

 

 

1;:.1

'=1

 

Факторную сумму

квадратов отклонений

находят по

.формуле

 

 

 

Sфакт = [(R:;ql) + (R:!q.) + ... + (R~/qp)]­

 

-[R1 + R, + ... + Rp)z/n];

 

если значения признака были уменьшены (Yij =

Xij-C), то

 

SФакт =

[(Т~/Чl) + (T:!q.) + ...

 

 

...+ (T~qp)]-[(Tl + Та + ... + тр)'/n].

359

Остальные вычисления производят, как и в случае

одинакового числа испытаний:

SOCT = Sобщ-Sфаку>

S~aKT = Sфакт/(р-l), S~T= SOCT/(n-p),

Пример. Произведено 10 испытаний, из них 4 на первом уровне

фактора, 4- на втором и 2 - на третрем. Результаты испытаний прн­

ведены в табл. 34. Методом дисперсионного анализа при уровне зна­ чимости 0,01 проверить нулевую гипотезу о равенстве групповых средних. Предполагается, что выборки извлечены из нормальных

совокупностей с одииаковыми дисперсиями.

 

 

 

 

 

 

Таблица 34

Номер

испытания

 

 

. Уровни фактора Р!

 

i

I

Р,

 

Р.

Р.

 

1

 

40

 

62

92

 

2

 

44

 

80

76

 

3

 

48

 

71

 

 

4

 

36

 

91

 

-

 

 

42

I

76

84

Х"р!

 

 

 

Реш е н и е. Для

упрощения

расчета вычтем С = 64 из каждого

наблюдаемого

значения:

Yij=Xjj-64. Составим расчетную табл. 35.

Используя табл. 35, найдем общую и факторную суммы квадратов

отклоиений:

Sобщ = ~ Qj-[(~ т,)2/n ] =3253- [(-27)2/IO] = = 3253-72,9 = 3180,1;

Sфакт= [(T~/ql) +(T:/q2) +(T=/qs)]- [(~ Tj )2/n] =

= (7744/4) +(441 /4) +(l600/2)l-72,90 = 2846,25-72,90 = 2773,35.

Найдем остаточную сумму квадратов отклонений:

SOCT = Sобщ -SФакт =3180,10-2773,35=406,75.

Найдем факториую и остаточную дисперсии:

~

SФакт!(Р -

1) =

2773,35/(3 -

1) =

2773,35/2 = 1387;

Sфакт =

S~T= SOCT/(n- р)=

406,75/( 1о-

3) =

406,75/7 = 58.

Сравним

факторную

и

остаточную дисперсии по критерию F

(см. гл. XIX, § 8), для

чего

найдем

иаблюдаемое значение критерия:

 

F наба= S;aKTI S~T =

[387/58 = 23,9.

З6О