Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие

.pdf
Скачиваний:
55
Добавлен:
25.10.2023
Размер:
16.09 Mб
Скачать

Ошибка средней разности, определяемая по формуле 61, рав­ няется:

 

md =

1 / 1 / 2,03

0,52

\

-------

 

 

 

|/ — [ —— -

J = 1/0,018 = 0,13 а.

Критерий

іф =

0 5

Для

Я = 0,05

и

k = 6 —1=5 по

'—-— = 3,85.

 

 

0,13

 

 

 

 

 

табл. V находим tst= 2,57. Видно, что

 

Также и довери­

тельная

граница tmd = 2,57x0,13= 0,33

заметно

ниже средней

разницы

(0,5), наблюдаемой в посевах

ржи

по

апрельскому и

черному пару. Следовательно, имеются

достаточные основания

отвергнуть нулевую гипотезу и признать эту разницу статисти­ чески достоверной.

Итак, применив два разных способа обработки одного и того же материала, мы пришли к прямо противоположным выводам. Очевидно, вторая оценка результатов опыта является более эф­ фективной, потому что она опирается на правильно выбранный способ анализа опытных данных. Несомненно, что на протяже­ нии шестилетнего испытания посевов ржи по черному и апрель­ скому пару условия выращивания растений не были одинако­ выми: они колебались по годам опыта. А это значит, что перед нами величины сопряженные и сравнивать их нужно попарно, т. е. по средней разности сопряженных вариант.

. Приведенный пример служит наглядным подтверждением, того, о чем говорилось выше: статистические методы нельзя при­ менять огульно, не сообразуясь с содержанием материала, к которому они применяются. Если выбранные методы обработки не соответствуют содержанию описываемых с их помощью фак­ тических данных, они могут оказать исследователю плохую услугу.

В качестве следующего примера подвергнем полной обработ­ ке результаты испытания на урожайность ячменя и овса в усло­ виях нечерноземной полосы Российской Федерации, приведен­ ные в табл. 2. Расчет необходимых значений показан в табл. 31.

Разница между средним урожаем ячменя и овса на протя­

жении

семилетних испытаний составила: 8,54—7,57 = 0,97

ц/га.

Находим ошибку этой разности:

 

 

 

 

 

md

 

 

0,53

ц/га.

 

Критерий іф =

0,97 = 1,83. Для

уровня

значимости Я = 0,05 и

 

 

сУкГ

 

 

 

 

числа

степеней

свободы &= 7—1 = 6 критерий

tst= 2,45

(см.

табл.

V приложений). Поскольку

t$<C.tsu

нулевая гипотеза со­

110

храняется; преимущество по урожайности ячменя перед овсом

остается недоказанным.

Сравнение результатов опыта с контролем или одного вари­ анта опыта с другим можно провести также и по средней раз­ ности между парными значениями сравниваемых величин, отно­

ся ее к выборочной ошибке.

Т а б л и ц а 31

Урожай ціга

Годы

 

 

Разница

d 2

d —d

{ d - d ?

ячмень

овес

(d)

 

 

 

 

 

1928

7 , 7

8 , 2 6

— 0 ,5 6

0 ,3 1

- 1 , 5 4

2 ,3 7

1929

9 , 0

7 , 2 2

1 ,7 8

3 ,1 7

0 ,8 0

0 , 6 4

1930

9 , 4

8 , 4 3

0 ,9 7

0 , 9 4

0 ,0 1

0 ,0 0

1931

7 , 4

5 , 5 7

1 ,8 3

3 ,3 5

0 ,8 5

0 ,7 2

1932

7 , 4

6 , 3 5

1 ,0 5

1 ,1 0

0 , 0 7

0 ,0 0

1933

1 0 ,9

8 , 0 0

2 , 9 0

8 ,4 1

1 ,9 2

3 ,6 9

1934

8 , 0

9 , 1 3

- 1 , 1 3

1 ,2 8

- 2 , 1 1

4 , 4 5

Сумма

+ 6 , 8 4

1 8 ,5 6

1 1 ,8 7

Среднее

8 , 5 4

7 ,5 7

0 , 9 8

Так, в рассматриваемом примере средняя арифметическая, вы­ численная по общей сумме парных различий (с учетом знаков!), равняется:

d — fy— = 0,977 = 0,98 (см. табл. 31).

п7

Выборочная ошибка этой разницы определяется по формуле

md —

і /

S j i - i y

= у

1Г87 =

= 0 ,5 3 Ч/га.

к Р”теР

 

1

п ( п — 1)

'

7 X 6

 

 

 

Іф

0,98 =

1,83.

Получился тот же результат, что и выше.

 

0,53

 

 

 

 

 

 

В качестве критерия достоверности средней разности может

служить также и отношение t — ~\/п,

где <7 = — 2<7і,

 

а Оа =

 

 

 

 

 

Od

п

 

 

 

 

2

(di — J ) 2, которые оцениваются по таблице

Стью-

дента.

Способ парных сравнений позволяет оценивать достоверность наблюдаемых различий также и по доверительному интервалу.

111

Если доверительный интервал, построенный по средней разности между парными вариантами и ошибкой этой разности, имеет нижнюю границу с положительным знаком, это указывает на достоверность разницы между генеральными параметрами срав­ ниваемых выборочных показателей. Если же нижняя граница доверительного интервала оказывается с отрицательным знаком, это свидетельство недостоверности наблюдаемых различий. В отношении рассматриваемого примера доверительный интер­ вал для Р = 0,05 и k = 6 оказывается следующим: d±tm.a = 0,98± ±2,45x0,53 = 0,98± 1,30 или от —0,32 до +2,28. Нижняя граница доверительного интервала имеет отрицательный знак (—0,32). что указывает на недостоверность разницы, наблюдаемой между урожайностью ячменя и овса.

СРАВНЕНИЕ ДИСПЕРСИЙ. ^-РАСПРЕДЕЛЕНИЕ ФИШЕРА

Описанные способы оценки генеральных параметров по вы­ борочным средним в принципе применимы и для установления доверительных границ показателей вариации. Среднеквадрати­ ческие ошибки выборочных — о и Сѵ — определяются по сле­ дующим формулам:

Шп

а2

=

а

(63)

----

----- \

 

2п

 

ф2п

ГПсѵ

СѴ2

СѴ

(64)

2п

 

]/2п

 

 

 

Критерием достоверности различий между средними квадратическими отклонениями служит отношение

оі — 02

Уо^/Пі + 0 2/ « 2

Например, выборка из урожая фасоли на делянке п = 200 семян

59,3 характеризуется а = 59,3 мг с ошибкой та = :==— = 2,96 мг.

Доверительные границы генерального параметра для Р=0,05 и соответственно /=1,96:

нижняя=59,3— 1,96 X 2,96 = 53,8

мг

верхняя = 5 9 ,3 + 1,96 X 2,96= 65,1

мг

Однако этот способ оценки генеральных параметров приме­ ним лишь к выборкам достаточно большого объема, распреде­ ляемых по нормальному закону. На малых выборках он оказы­ вается неточным. В поисках лучшего способа оценки Р. А. Фи-

112

шер установил, что если вместо разности оі — о2 взять разность натуральных логарифмов In оі—ln 0 2, где 0 і > 02, то эта величи­ на, обозначенная им через Z, распределяется нормально не только при больших, но и на среднего объема выборках. При вычислении Z вместо натуральных можно пользоваться десятич­ ными логарифмами по формулам: Z = 2,3O26(lg0t — lg Ст2), или

о

02

Z = 2,3026 lg — , а также

Z == 1,1513 lg ^ -. В дальнейшем вмес-

02

0|

то логарифма отношений были взяты самые отношения и не средних квадратических отклонений, а дисперсий; в честь Фише­ ра их принято обозначать заглавной буквой F:

2

 

F = Оі

(65)

Этот показатель получил название критерия Фишера. Соответ­ ственно были переработаны и таблицы Фишера применительно к функции это критерия, что значительно упрощает расчеты.

Критерий F функционально связан с вероятностью, он имеет непрерывную функцию распределения и зависит только от чисел степеней свободы: ki = rii — 1 и k2 = n2— 1 сравниваемых Диспер­ сий. Характерным для F оказывается то, что он полностью опре­ деляется выборочными дисперсиями и не зависит от генеральных параметров, так как предполагается, что обе дисперсии из одной и той же генеральной совокупности. Поэтому при k— >-оо отно-

шение 0 і/о2 -> 1. График плотности вероятности F распределения для ki и k2 и критических границ F\ и F2 приводится на рис. 12. Видно, что распределение F асимметрично.

Ф)

Рис. 12. График плотности вероятности F-pacnpe- деления для типичных значений k\ и k2 числа сте­ пеней свободы и критические границы F, и F2 (по Смирнову и Дунину-Барковскому, 1965)

113

Закономерность

функции

F =

— для двух уровней значи-

 

2

 

 

 

а2

 

 

 

2

мости Рі = 0,05 и ^ 2 = 0,01 и соответствующих степеней свободы ■ki и &2 табулирована в виде критических (стандартных) значе­ ний критерия F (см. приложения табл. VII). В этой таблице сте­

пени свободы для большей дисперсии берутся

по горизонтали

(верхняя

строка), а по вертикали

(первая

граф а)— степени

свободы

для меньшей

дисперсии.

При определении величины

критерия F числителем

берется обычно большая дисперсия. По­

этому критерий F может быть равен единице или больше ее. Чем значительней разница между дисперсиями, тем больше будет и величина критерия F, и, наоборот, чем меньше окажется рас­ хождение между дисперсиями, тем меньше будет и величина F. Нулевая гипотеза исходит из признания равенства дисперсий. Если эмпирические значения критерия Фишера (/>) меньше теоретических, указанных в таблице (Fst) для соответствующего уровня значимости и степеней свободы k\ и k2, они рассматри­ ваются как.случайные. Если же F $ ^ F si, нулевая гипотеза от­ вергается, разница между сравниваемыми величинами признает­ ся статистически достоверной.

Например, сравниваются две выборки по весу семян фасоли: одна из посевного материала — «1 = 100 и оі = 58,3 мг и другая из

урожая—«2 = 200 и 02 = 59,3 мг. Критерий Fst =

(59,3)2

3516

 

=

= 1,03. По таблице Фишера для Р = 0,05

и &i=200—1= 199'

и k2 = 100 — 1=99 находим Fst = 1,31 (см. табл. VII приложений). Так как /><CPsi, нулевая гипотеза сохраняется; расхождения между выборками по данному признаку оказываются статисти­ чески недостоверными.

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ОЦЕНОК

Критерии Стьюдента (t) и Фишера (F) связаны с опреде­ ленными формами нормального распределения; их применение имеет в виду оценку расхождений-между генеральными пара­ метрами на основании выборочных показателей сравниваемых совокупностей. Поэтому они называются параметрическими кри­ териями. Их разрешающая мощность велика лишь при условии,, что сравниваемые совокупности распределяются по нормальному закону или не сильно отклоняются от него.

В практике же встречаются не только нормальные, но и иного вида распределения, о которых исследователю мало что извест­ но. В таких случаях применение параметрических критериев не гарантирует от возможных ошибок. Поэтому для оценки рас­ хождений между выборками, наряду с указанными критериями,, используются и другие, вспомогательные критерии, основанные

114

на сравнении не самих вариант, а их порядковых чисел в ран­ жированном ряду. Критерии, основанные на этом принципе, на­ зываются порядковыми. Применение порядковых критериев не связано с определенной формой распределения; они не нуждают­ ся в вычислении средней арифметической и среднего квадрати­ ческого отклонения и других параметров, поэтому и получили название непараметрических критериев.

Непараметрические, или порядковые, критерии просты по своей конструкции; они не требуют большой вычислительной ра­ боты, что выгодно отличает их от критериев параметрических. При всем этом преимущество остается на стороне критериев па­ раметрических, обладающих большей статистической мощно­ стью, лучшей разрешающей возможностью, чем у критериев непараметрических. Поэтому во всех случаях, когда распределе­ ния практически не отклоняются от нормального закона, реко­ мендуется использовать критерии параметрические. Там же, где возникает сомнение в точности выводов, которые делаются па основании использования параметрических критериев, когда форма распределения остается недостаточно ясной, уместно ис­ пользовать и непараметрические критерии различия. Всесторон­ ний контроль над правильностью выводов никогда не мешает. Если же обработка выборочного материала разными способами дает один и тот же результат, это гарантия того, что выводы по­ лучаются правильные.

Существует несколько непараметрических критериев разли­ чий, неодинаковых по своей конструкции и мощности. Мы рас­ смотрим лишь два из них, наиболее простых и удобных в работе, особенно при сравнительной оценке малочисленных выборок.

Критерий Т Уайта

Одним из критериев, применяемых для установления досто­ верности различий, наблюдаемых при сравнении двух независи­ мых распределений, является непараметрический критерий Т •Уайта, который в равной мере применим к выборкам равновели­ кого и неодинакового объема. Сущность методики, лежащей в основе применения этого критерия, следующая. Все варианты сравниваемых совокупностей ранжируют в один общий ряд и находят их ранги. Затем ранги суммируют — отдельно по каж­ дой выборке. Если сравниваемые выборки совершенно не отли­ чаются одна от другой, то и суммы их рангов должны быть равны между собой. В противном случае такого равенства на­ блюдаться не будет. И чем значительнее расхождение между выборками, тем больше разница между суммами их рангов. А так как указанные различия могут быть случайными, они оце­ ниваются с помощью критерия Уайта по специальной таблице, рассчитанной для выборочных наблюдений разного объема и

115

двух порогов доверительной вероятности — Р = 0,95

и

Р = 0,99;

эта таблица приводится в приложениях под № IX.

 

из двух

Для оценки критерия

Т всегда берется м е н ь ш а я

сумм рангов, которая и

сравнивается с табличным

(стандарт­

ным) значением этого критерия для щ и п2, т. е. объемов срав­ ниваемых совокупностей и принятого порога доверительной ве­ роятности. Если Т^>Тф, это указывает на достоверность на­ блюдаемой разности и нулевая гипотеза отвергается. Если же табличное число (Tst) меньше или равно фактической величине критерия Тф, нулевая гипотеза сохраняется; разница между вы­ борками признается статистически недостоверной. Напомним, что ранги — это числа натурального ряда, которыми обознача­ ются члены ранжированных совокупностей, причем одинаковым

(повторяющимся)

значениям

этих

совокупностей

соответству­

ет один и тот же

средний

ранг.

Общая сумма

всех рангов

где п — суммарное число наблюдений.

Использование критерия Т Уайта проще усвоить из соответ­ ствующего примера. Так, по данным Г. Е. Бодренкова (1963), длина тела личинок щелкуна, обитающих в посевах озимой ржи и проса, выраженная в мм, варьирует следующим образом:

в посевах ржи:

7

10

14

15

12

16

12: JCI =- 12,3

м м

в посевах проса:

11

12

16

13

18

15;

JC2 = 1 4 ,2

м м

На основании этих проб создается впечатление о более круп­ ных размерах личинок щелкунов, обитающих на просе. Прове­ рим это предположение с помощью критерия Т Уайта. Ранжи­ руем всю совокупность наблюдений:

длина личинок:

7

10

11

12

12 12

13

14

15

15

16

16

18

ранги:

1

2

3

5

5

5

7

8

9,5

9,5

11,5

11,5

13

Находим суммы рангов

 

 

 

 

 

 

 

 

 

 

 

 

для ряда ржи:

 

 

1+ 2+8+ 9,5+5+ 11,5+5 = 42

 

 

 

для ряда проса:

 

 

3+5+11,5 + 7+13+9,5=49

 

 

 

И т о г о . . . 91

Видно, что суммы рангов отличаются друг от друга. Чтобы опре­ делить достоверность различий, меньшую сумму (Гф= 42) срав­ ниваем с табличным числом критерия Tst для «і = 7 и п2 = 6 , ко­ торое равно 27. Так как 7'8< = 27<7’ф = 42, следует заключить, что различия, наблюдаемые в размерах личинок щелкуна, обитаю­ щих в посевах озимой ржи и проса, носят случайный характер, т. е. они статистически недостоверны.

116

Критерий Вилкоксона ( Z ) для сопряженных пар

В тех случаях, когда сравниваемые выборки коррелированія друг с другом, т. е. представлены рядами сопряженных попарно вариант, для оценки достоверности различий применяются соот­ ветствующие непараметрические критерии. Одним из таких критериев, обладающим достоточной мощностью, является кри­ терий Z Вилкоксона для сопряженных пар. Методика его ис­ пользования сводится к следующему. Сначала находят разности между парными вариантами сопряженных рядов; при этом учи­ тываются знаки разностей. Затем эти разности ранжируют и определяют их ранги. Ранги суммируют отдельно с положитель­ ными и отрицательными знаками. Причем, если разность между парными вариантами равна нулю, она в расчет не принимается, т. е. исключается, и число наблюдений (п) соответственно умень­ шается.

Меньшая сумма рангов, независимо от знака, сравнивается с числом, указанным в специальной таблице для взятого уровня значимости и числа парных наблюдений, которое не должно быть меньше 6. Если табличное (стандартное) значение крите­ рия Z превышает его фактическое значение, т. е. меньшую сумму рангов, это указывает на достоверность наблюдаемых различий. В противном случае нулевая гипотеза сохраняется и различия, наблюдаемые между рядами сопряженных вариант, признаются статистически недостоверными. Таблица значений критерия Вил­ коксона для разных уровней значимости (Р ) и числа наблюде­ ний (п) приведена в приложениях под № X. Например, методом серийных испытаний изучалась степень зараженности яблок двумя разновидностями грибка А и В, вызывающего загнива­ ние яблочной ткани. Результаты десяти испытаний (проб) ока­ зались следующими (табл. 32).

 

 

 

 

 

 

 

 

 

Т а б л и ц а

32

 

 

 

Количество

загнившей ткани в г по сериям опыта

 

Разновидности грибка

1

2

3

4

5

6

7

8

9

10

 

 

Разновидность А . .

5,9

4,9

3,6

8,8

7,4

5,7

6,0

6,3

9,4

9,1

»

В . .

4,7

5,1

3,7

7,4

6,1

4,2

5,0

7,1

6,3

8,0

Разница

(d) . . . .

1,2

- 0 , 2

- 0 , 1

1,4

1,3

1,5

1,0

- 0 , 8

3,1

1,1

ранжируем разность:

-0,1

—0,2

- 0 ,8

1,0

1,1

1,2

1,3

1,4

1,5 3,1

находим ранги:

1

2

3

4

5

6

7

8 9

10

 

 

 

 

 

 

 

 

 

117

Суммируем ранги

 

1+ 2+3 = 6

 

с отрицательными знаками:

 

с положительными знаками:

4+ 5+ 6 + 7 + 8 + 9 + 10=49

 

 

 

 

И т о г о . . .

55

Проверяем расчет: п { п + 1)

10X11

55.

 

Меньшую сумму рангов

(Z —6)

 

сравниваем с

табличным

числом критерия

Z0,o5 для

п=10, которое равно 8. Так как

Z st > Z ^ y нулевая

гипотеза

опровергается; следует

заключить,

что грибок А достоверно обладает большим вредоносным дей­ ствием, чем грибок В.

Оценка расхождений между рядами по критерию Стьюдента приводит к такому же выводу, что видно из следующего расче­

та. Средние арифметические сравниваемых

рядов равны: х\ —

= 6,71 г

(грибок Л)

и *2 = 5,76 г

(грибок В).

Разность х \ — *2 =

= £> = 6,71 — 5,76 = 0,95

г. Сумма

квадратов

отклонений

отдель­

ных значений разности

от их средней арифметической

Z(d

d )2 = 6,65 (расчет

предлагается

проделать

читателю),

откуда

средняя

ошибка разности средних

 

 

l l Z ( d - d y

і /

6,65

=

1/0,074 = 0,27.

 

md = '

п(п — 1)

'

Т0 Х9

 

Критерий достоверности

 

0,95

 

 

ÖX7 = 3,5.

 

 

Стандартное значение критерия Стьюдента для уровня значи­ мости Р = 0,05 равно 2,26 (см. табл. V приложений), откуда сле­ дует заключить о достоверности наблюдаемых различий. Сов­ падение результатов обработки одного и того же материала раз­ ными способами дает большую уверенность в правильности сделанного вывода.

В заключение применим критерий Вилкоксона к оценке раз­ ницы, полученной при испытании урожайности ячменя и овса в нечерноземной полосе Российской Федерации. Соответствую­ щие данные приведены в табл. 32. Разницу между парными значениями вариант, что приведена в одной из граф табл. 32, ранжируем, указывая для каждого значения его ранг с соответ­ ствующим этому значению знаком:

разность (d):

—0,56

0,97

Г,05

—1,13

1,78

1,83 2,90

ранги:

— 1

2

3 -

4

5

6 7

Суммируем ранги, взятые отдельно с отрицательными и по­ ложительными знаками:

1+ —4= —5

2 + 3 + 5 + 6 + 7 = 24

118

Берем меньшую сумму рангов (Z = 5), не обращая внимания на ее знак, и сравниваем, как это делали выше, с табличным чис­ лом критерия Z Вилкоксона для Р = 0,05 и п = 7, которое равно 3.

Так как

табличное значение критерия Zst — 2><.Z$= b,

нулевая

гипотеза

сохраняется; разница в урожайности ячменя

и овса

оказывается статистически недостоверной. Напомним, что к это­ му выводу мы пришли, когда сравнивали данные опыта с по­ мощью параметрического критерия t Стьюдента.