Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие

.pdf
Скачиваний:
150
Добавлен:
25.10.2023
Размер:
16.09 Mб
Скачать

определяют по обычным рабочим формулам:

Dy == 2х2

(2*)2

( а д 2

(2х)2

N

щ

N

 

Dz — Dy Dx.

3. Неисправленные факториальные суммы квадратов откло­ нений рассчитываются по следующим рабочим формулам:

n '

ѵ _ 2

( Ъ х а в ) 2

(2/гА)2\

X --

ZJXAB

f

а

 

 

ab

D'B =

a ^ M B - {^ ~ - )

и D'AB = D'X - D ' A - D b.

2ж • Расшифровка формул: х АВ = — - — средняя из суммы вариант,

Пі

заключенных в отдельных клетках дисперсионной таблицы;

hA = ------ — средняя из суммы частных средних

по градациям

b

 

 

 

 

 

 

фактора A ;hB = ——

— средняя из сумм

частных

средних по

 

а

 

 

 

 

 

градациям фактора В; а — число градаций

по фактору А; Ь

число градаций по фактору

В; х — варианты комплекса; х А

средняя по градациям фактора А; х в — средняя

по

градациям

фактора В; щ — количество

вариант в клетках

дисперсионной

таблицы;

N — общее число вариант, составляющих

дисперсион­

ный комплекс.

некорректированные

суммы

квадратов, умно­

4.

Определив

жают их на величину поправки e= DxlD'x и получают исправлен­ ные суммы квадратов отклонений, для которых сохраняется ра­ венство

Dx — DA -f- DB 4~ Dab.

5. Наконец устанавливают числа степеней свободы, рассчи­ тывают дисперсии и заканчивают анализ по обычной схеме двух­ факторного дисперсионного комплекса.

Применим эту схему к соответствующему примеру. Прове­ рялась эффективность новой методики обучения в младших и старших классах общеобразовательной школы. Знания учащихся оценивались в баллах. Количество набранных баллов подсчиты­ валось в начале, в середине и в конце учебной четверти отдельно по каждому классу. Результаты эксперимента оказались следую­ щие (табл. 111).

297

Т а б л и ц а 111

 

Успеваемость, выраженная числом баллов

 

Учет результатов

 

 

 

 

опыта

младшие классы

средняя

старшие классы

средняя

 

В

начале четверти . .

3

2

4

3

5

9

4

6

3

6

В

середине

четверти

3

7

11

7

7

4

2

8

4,8

В

конце

четверти . .

2

4

6

4

2

7

 

6

 

5

Средние

по

классам

 

4,67

 

 

 

5,27

 

 

 

Необходимо выяснить, существует ли зависимость между ис­ пытываемым методом и возрастными особенностями учащихся, влияет ли на эту связь физическое состояние детей, которое пред­ полагается неодинаковым, меняющимся на протяжении учебной четверти. Судя по средним показателям, такая связь не исключа­ ется. Однако выборочные средние — величины случайные; суще­ ствуют ли достоверные различия между их генеральными пара­ метрами, поможет установить дисперсионный анализ.

Обозначим через А успеваемость учащихся на протяжении учебной четверти, а через В — успеваемость в разных классах. Из табл. 111 видно, что фактор А имеет три градации, т. е. а 3, а фактор В — две градации, т. е. 6 = 2. Общее число вариант сос­

тавляет JV= 21. Сумма

всех вариант

комплекса

2х = 3 + 2+ 4 + ...

 

 

105

5,0. Сумма квадратов ва­

... + 6 = 105. Общая средняя X = =

риант комплекса:

2х2 = 32 + 22 + 42 + ... + 62 = 635,

откуда общая

сумма квадратов отклонений

 

 

DY = 2х2 —

(2х)2

1052

525 = 128.

ѵ /

= 635 --------- = 635 -

 

N

21

 

 

Чтобы определить сумму квадратов отклонений по градациям факторов А и В, т. е. Dx , необходимо сначала рассчитать вспомо-

„ (2*і) 2

гательную величину 2 ------ —. Для этого просуммируем вари-

т

анты каждой клетки табл. 111 и затем результаты возведем а квадрат:

2 х і=

3 +

2 +

4 =

9;

(2х,)2 =

92 =

81

 

3

4 +

+

7 +

11 = 21 =

212 =

441

5 +

2 +

6 =

12

=

12г =

144

9 +

4 +

6 =

24

=

242 =

576

7 + 4 +

2 +

8 +

3 =

24

=

242 =

576

 

2 +

7 +

6 =

15

=

152 =

225

298

Относя эти величины к числу вариант, находящихся в каждой клетке табл. 111 и суммируя результаты, получаем искомую ве­ личину:

(2хА2

81

441

144

576

576

225

556,2,

 

 

 

 

 

 

=

откуда 77^ = 556,2 — 525,0 = 31,2.

можно получить и

по общей

Заметим, что этот результат

формуле межгрупповой

суммы

квадратов

отклонений: Dx —

= 2[щ (+— х )2] = 3(3—5)2 + 3(7—5)2 +

3(4—5)2 +

4(6—5)2 +

+ 5(4,8—5)2 + 3 (5—5) 2=12+12 + 3 + 4 + 0,2 + 0 = 31,2.

 

Остаточная

сумма

квадратов

отклонений: Dz = DyDx =

= 128—31,2 = 96,8.

Переходим к расчету факториальных (неисправленных) сумм квадратов отклонений. Сначала найдем ИхAB, которая равна ■сумме всех частных средних, полученных для каждой клетки дис­

персионной таблицы.

Эти

средние приведены в табл. 111 (см.

средние по градациям

фактора А). 2ждв = 3 + 7+ 4+ 6 + 4,8 + 5 =

= 29,8, а

также

2х 2ав = 32 + 72 + 42 + ... + 52= 158, откуда

Dx =

Их A2 B

{ИхA B ) 2

29,

158— 1 4 6 = 12.

 

 

ab

Х З

 

Чтобы определить значения D'A и D'B, нужно сначала найти вели­ чины частных средних по градациям факторов А и В. По факто­ ру В они уже определены ів табл. 111 (см. нижнюю строку), имен-

но:

хв,

3 + 7 + 4

 

 

хвг

6 +

4,8 +

5

5,27.

Таким

— = '------

3--------

= 4,67 и — =

--------------

3

=

 

а

 

 

 

а

_

 

6

 

 

X Аг

же

образом

находим

величины

Ха I

3 I

4,5;

— ;— =

— ---- =

 

Ь

 

7 + 4,8

_

 

4 +

5

Ь

 

2

/2 * в

 

 

 

 

 

 

= И к в =

 

---- -----

=

5,9 и і а Л =

— — =4,5, откуда И ------

 

)

=

4,67 +

5,27 = 9,94

и

2 кв = 4,672 + 5,272 =

49,58.

А

также

V

 

] =

а = 4,5 +

5„9 +

4,5 =

14,9

и HhA =

4,52 +

5,92 +

' о

 

 

 

 

 

 

 

 

 

 

 

 

+

4,52 — 75,31. Рассчитав эти

величины, переходим

к

определе­

нию факториальных сумм квадратов:

 

 

 

 

 

 

 

 

 

 

 

 

'

 

 

а

'

 

 

 

 

 

 

 

=

/

14 Q2 \

 

 

 

74,0) =

2,62,

 

 

 

 

2 (75,31------

 

— j = 2(75,31 -

 

 

299

Показатели

X

Пі

И х ;

( S * i ) 2

( S ^ i ) 2

П;

2 X ;

Щ

m

"X A

X A b

( - Y

[ b )

X B

X ß

а 1

l £ < to

*

 

 

 

 

 

 

 

Т а б л и ц а 1 1 2 '

 

A ,

 

A a

 

■^з

 

 

 

В ,

в*

В ,

в г

в ,

Вг

 

Сумма

 

 

 

3 2 4

5 9 6

3 7

7 4 2

2 4

2 7

 

й = 3

 

4

11

8 3

6

6

 

Ь=

2

3

4

3

5

3

3

 

2 п г = 7V = 2 1

9

2 4

21

24

12

15

 

2л: . =

105

81

5 76

441

576

144

225

 

 

27

144

147

1 1 5 ,2

 

 

 

(2Х;)2

 

48

75

 

2 - — — = 5 5 6 ,2

 

 

 

 

 

 

 

Пі

 

29

158

179

142

56

89

 

2 л:2 =

653

3

6

7

4 ,8

4

5

 

И х АВ = 2 9 , 8

9

36

49

23

16

25

 

2 л:Л 5 =

158

3 + 6 = 9

7 + 4 , 8 = 1 1 , 8

4 + 5 = 9

1

-

 

 

4,5

 

5 ,9

4 ,5

 

2 й л =

1 4 ,9

<

 

 

 

 

 

 

 

 

2 0 ,2 5

 

3 4 ,8 1

2 0 ,2 5

 

2 Л 2л = 7 5 , 3 1

#1=3+7+4=14

 

# 2 = 6 + 4 , 8 4

5 = 1 5 , 8

 

 

 

4,67

 

5 ,2 7

 

 

 

Hhß = 9 , 9 4

 

21,81

 

2 7 , 7 7

 

 

 

2 й | = 4 9 , 5 8

300

(ZhB ) 2

DB = a

 

 

b

 

 

 

=

3 ( 4 9 ,5 8 - ^ ! ) :

3(49,58-49,40) = 0,54,

D'AB = D'x - D A — DB =

12,0 -

2,62 -

0,54 =

8,84.

Находим величину поправки: e =

Dx

31,2

2,6. Исправ­

 

 

 

D'X

12,0

 

ляем некорректированные суммы квадратов

отклонений: DA —

= 2,62 X 2,6 = 6,81; DB= 0,54 X 2,6 = 1,40

и DAB= 8,84 X 2,6 = 22,99.

Проверим

точность расчета:

DA +DB + DAB= DX = 6,81 + 1,40 +

+ 22,99 = 31,2. Вычисления проведены совершенно точно.

Прежде чем перейти к установлению степеней свободы и оп­ ределению дисперсий, сведем проделанные расчеты в таблицу для того, чтобы показать более удобную форму расчета вспомо­ гательных величин, необходимых для определения сумм квадра­ тов отклонений (табл. 112).

Определяем числа

степеней

свободы:

KY N—1=21 —1=20.

К х = а Ь — 1=6—1 = 5,

К А = а —

1=3—1=2,

К В = Ь ~ 1=2—1 =

1,

Кав = Ка Х К в = 2 х \= 2 и KZ = Nab —21—6 = 15. Находим

дис­

персии:

 

 

 

 

 

 

 

 

 

 

 

 

 

2

31,2

2

 

6,81

3,41;

 

 

 

 

Од :

5

=

6,24;

<т1 =

—^— =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

1,40

1,40;

оІв =

^

- =

11,5

 

 

 

 

ов

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

96’8

«„г

 

 

 

 

 

 

 

 

Gz = — — =

6,45.

 

 

 

 

 

 

 

 

 

15

 

 

 

 

 

 

 

Сводим полученные результаты в таблицу

дисперсионного

ана­

лиза (табл.

113).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а

113

Источники вариации

Степени

Сумма

 

Средний

Г Ф

 

Fst

 

свободы

квадратов

 

квадрат

Р = 0,05

 

 

 

 

отклонений

 

О 2)

 

 

 

 

По градациям фак­

 

5

31,2

 

6,24

 

 

 

 

торов . . . . . .

 

 

< 1

 

 

 

По фактору А . . .

 

2

 

6,81

 

3,41

< 1

 

 

 

По фактору

В . .

 

1

 

1,40

 

1,40

< 1

 

3,7

 

Совместная

AB . .

 

2

22,99

 

11,50

1,8

 

 

Остаточная . . . .

 

15

96,80

 

6,45

1

 

 

О б щ а я ......................

 

20

128,0

 

 

 

'

 

— .

 

301

По обоим факторам и их взаимодействию что не по­ зволяет отвергнуть нулевую гипотезу. Приходится констатиро­ вать, что1независимое и совместное влияние факторов (возраста и физического состояния учащихся) на результативный признак (успеваемость учащихся) оказывается статистически недосто­ верным. Следовательно, оценить эффективность нового метода обучения можно независимо от влияния этих факторов на успе­ ваемость учащихся. Для этого необходимо сравнить результаты испытания разных методов обучения.

ДИСПЕРСИОННЫЙ АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ

Дисперсионный анализ качественных признаков проводится по тем же схемам, которые применяются и в отношении количе­ ственных признаков. Разница заключается лишь в том, что коли­ чественные признаки характеризуются средними показателями — общей и частными средними арифметическими, тогда как качест­ венные признаки выражаются долями (т. е. относительными частотами) или в процентах от общего числа наблюдений. Как и комплексы, организуемые по количественным признакам, диспер­ сионные комплексы качественных признаков состоят из отдельных градаций, число которых может быть различным, различными бывают и числа вариант в отдельных градациях комплекса. По­ этому, как и в отношении количественных признаков, дисперси­ онные комплексы качественных признаков могут быть не только ортогональными, т. е. равномерными и пропорциональными, но и неортогональными. Как те, так и другие делятся на однофактор­ ные и многофакторные комплексы.

Однофакторные комплексы

Дисперсионный анализ однофакторных комплексов качествен­ ных признаков проводится в общем по той же схеме, которая бы­ ла описана выше применительно к анализу однофакторных комп­ лексов количественных признаков. Рабочие формулы для определения степеней свободы и расчета сумм квадратов откло­

нений— общей

( D Y ), межгрупповой (Dx ) и

остаточной (Dz) —

в зависимости

от того, в каких единицах

меры учитывается

результативный признак — относительной частотой или в процен­ тах от общего числа наблюдений, приводятся в следующей свод­

ке (табл .114).

т 2

,

_

'

m

Так

как

тр = т — =

— , межгрупповую

или факториальную

пп

сумму квадратов отклонений можно выразить следующей фор­ мулой:

302

Здесь т — число вариант, обладающих данным признаком;

т

р = ——'Относительная частота или доля вариант, имеющих дан-

п

ный признак; р% — доля вариант данного признака, выраженная

в процентах от общего числа наблюдений

(N); а — число града­

ций фактора А;

п — число наблюдений

в

отдельных

градациях

фактора А; N — общее число наблюдений, или объем дисперси­

онного комплекса.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а 114

 

 

 

Результативный

признак выражен в

 

 

Источники варьиро­

 

долях единицы

 

 

 

процентах

 

 

 

 

 

 

 

 

 

 

 

вания

Суммы квадратов

С тепе­

 

Суммы квадратов

 

Степени

 

 

 

 

ни сво­

 

 

 

 

отклонений

 

 

отклонений

 

свободы

 

 

боды

 

 

 

 

 

 

 

 

 

 

 

 

 

Общее варьи­

п

V

<2т)2

N — 1

 

 

 

( 2 о % ) 2

 

D y == Y p % -— ■

-

1 0 0 а — 1

рование

D y

I m

N

 

 

 

 

 

Y

1 0 0 а

 

 

Межгрупповое . .

D x — 'Zmp

( 2 / и ) 2

а1

^

 

Л р %)2

( ^ % ) 2

 

-— —

*

а — 1.

 

 

 

N

 

 

^ 1 0 0

1 0 0 а

 

Остаточное . . .

D z

— I m

I m p

N — а

 

D z = D y —

D x

 

1 0 0 а — а

Рассмотрим следующий пример. В связи с миксовирусной инфекцией у детей измерялся уровень эритроцитарных аутоанти­ тел. Данные, характеризующие изменчивость уровня Г-агглюти- нина в зависимости от возраста детей, сведены в табл. 115. Нужно установить, достоверны или случайны различия, наблю­ даемые между здоровыми детьми и реконвалесцентами по титру Т-антител.

Т а б л и ц а 115

 

 

Возраст

детей в годах

 

 

П оказатели

3

4 -

5

6—7

8 - 9

2

Всего обследовано . .

9

13

20

9

17

12

Из них здоровых . .

4

4

6

2

12

8

Реконвалесцентов

5

9

14

7

5

4

Чтобы определить суммы квадратов отклонений, необходимо

т. 2

сначала рассчитать вспомогательные величины Em и — . Рае-

гг

чет показан в табл. 116.

зоз

Т а б л и ц а 1 1 6

 

Возраст

детей (градации

 

комплекса)

 

П оказатели

 

 

5

6 - 7

Сумма

2

3

4

8 - 9

п

9

 

13

20

9

 

17

12

80

т

5

 

9

14

7

 

5

4

44

m2

25

81

196

49

 

25

16

m 2

2,78

6,23

9,80

5,45

 

1,47

1,33

27,06

п

 

 

 

 

 

 

 

 

 

 

Определяем суммы квадратов отклонений:

 

 

 

общую — Dy =

 

(2m )2

442

44 — 24,2 = 19,8,

2 т — ------— =

44------- =

 

 

 

N

 

80

 

 

 

 

факториальную — Dx = 2 ( тп )>

(2 т)'“

 

 

 

N

=

27,1 — 24,2 =

2,9,

остаточную

D?

D y - D x =

19,8 -2,9

16,9.

 

Находим степени

свободы:

KY = N—1 = 80—1=79,

kx= a-

-1 = 6 —1 =5 и K z =

N — а = 80—6 = 74.

 

 

 

 

Определяем значения дисперсий:

 

 

 

 

 

 

 

2

Dx

2,9

0,58

 

 

 

 

 

а*

Кх

5

 

 

 

 

 

 

 

 

 

 

 

d z

Dz

16,9

0,23.

 

 

 

 

—- =

----- =

 

 

 

 

 

 

K" z

74

 

 

 

 

т -

 

 

 

2

0,58

 

 

достоверности

0 Х

Стандартное

Критерии

Fgg =

 

= 2,5.

 

 

 

 

 

а2

0,23

 

 

 

 

 

 

 

z

 

 

 

 

значение этого показателя ^Po.os= 2,3 и .Fo,oi = 3,3

(см. табл. VII).

Нулевая гипотеза опровергается с вероятностью

Р = 0,95. Сила

влияния миксовирусной инфекции на уровень 7’-агглютинина ока-

залась

незначительной,

.

2

Dx

2,9

0,146, или

равной

цх =

---- =

-------

 

 

 

 

 

Dy

19,8

 

14,6%. Ошибка репрезентативности этого показателя:

Щці

/1

2. Я— 1

= (1 -0,146)

6 - 1

4,27

— (1

'Пэс)~іЛ

 

 

= 0,058.

ж

 

N — а

 

8 0 - 6

"74"

Критерий достоверности

0,146

2,5.

Для

Кі = 5, К2 = 74

 

=

 

 

 

0,058

 

 

 

304

и Р = 0,05 в табл. VII приложений находим Fst = 2,3. Итак, с ве­ роятностью Р = 0,95 можно утверждать, что разница между здорОЕыми детьми и реконвалесцентами по титру Г-антител досто­ верна, хотя сила влияния инфекции не очень велика.

Возьмем другой пример. По данным Г. А. Скворцовой (1956), двигательная активность синиц разных видов характеризуется следующими показателями (табл. 117).

 

 

 

 

 

Т а б л и ц а 117

 

 

 

Вилы синиц

 

 

Показатель активности

 

 

 

 

Сумма

большая

лазоревка

московка

длиннохвостая

прыжков

 

 

 

 

 

Среднее число

п р ы ж ­

 

 

 

 

 

ков за один час .

. . .

2527

3690

5465

2401

14 083

Необходимо оценить достоверность различий, наблюдаемых в двигательной активности у синиц, принадлежащих к разным сис­ тематическим видам. Для этого выразим видовые показатели в процентах от общей суммы прыжков (14 083) и подвергнем эти данные дисперсионному анализу. Как и в предыдущих случаях,

предварительно рассчитаем величины (р°/о)2 и 2 (2о%, )2 не­

обходимые для определения сумм квадратов отклонений. Расчет показан в табл. 118.

Определяем суммы квадратов отклонений:

 

 

общую — Dy =

2р%

(2р% )2

 

1002

 

 

 

100а

 

100 —

 

 

 

 

 

 

 

 

 

4 X 1ÖÖ

 

 

 

 

=

100 -

25 =

75,0

 

 

факториальную — Dx = 2

(.Р% )2

(2р% )2

= 28,1 -25,0 = 3,1,

 

 

 

 

 

100

 

100а”

 

остаточную — Dz = Dy — Dx = 75,0 — 3,1 = 71,9.

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а 118

 

 

 

 

 

Виды синиц

 

 

 

Показатели

большая

лазоревка

московка

 

длиннохвос­

Сумма

 

 

 

тая

 

р %

18

 

26

 

 

39

 

17

100

%)2

324

676

 

 

1521

 

289

(р%)2

3 ,2 4

6 ,7 6

15,21

 

2 ,8 9

2 8 ,1 0

100

 

 

 

 

 

 

 

 

 

 

305

Сводим полученные данные в таблицу дисперсионного анали­ за (табл. 119).

Вариация

Степени

Сумма

Средний

РФ

квадратов

квадрат

свободы

 

 

отклонений

О 2)

 

Т а б л и ц а

119

ъ 1 о о

ъ 1

О о

Факториальная . . .

3

3,1

1,03

5,7

2,6

3,8

 

Остаточная ..................

396

71,9

0,18

1

*

О б щ а я ..........................

399

75,0

.__

Так как Тф> F st, нулевая гипотеза отвергается: разница в двигательной активности синиц оказывается статистически досто­ верной. Однако сила влияния видовой принадлежности синиц на их двигательную активность весьма мала, она выражается пока­ зателем:

А,

3,1

= 0,043,

или 4,3 %

с

ошибкой

пцг

т]х = -г— =

——

D

75,0

 

 

 

 

 

 

 

2

а

1

(1 -0,043) 400-

1

1,914

=

0,007.

(1 -Л * )

100а — а

 

~396

Критерий

0,043

6,17 >

То,оі = 3,8 для ki = 3 и k2 = 396.

о Ш

=

 

 

 

 

 

 

 

 

Двухфакторные равномерные комплексы

Обработка двухфакторных ортогональных комплексов качест­ венных признаков осуществляется по той же схеме, которая при­ меняется при дисперсионном анализе двухфакторных равномер­ ных и пропорциональных комплексов количественных признаков. Суммы квадратов отклонений вычисляются по следующим рабо­ чим формулам:

й

 

(2т)*

,

 

,

(по

сочетанию

общая —

DY = 2 т ---- ------— ;

факториальная

 

 

 

N

 

 

 

 

 

градаций

 

т*

( 2 т ) 2

 

 

 

факторов) — Dx = 2 -

 

остаточная —

Dz = Пт ■

т 2

 

(2mA)2

(2 т у

2 — ; факториальная А DA = 2

n A

N

 

 

п

 

 

 

 

, ( 2 т в)2

( 2 т ) 2

и взаимо-

факториальная В DB = 2’

 

N

 

 

пв

 

 

 

 

действия ABDAB— DXDADB.

306