книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие
.pdfОшибка средней разности, определяемая по формуле 61, рав няется:
|
md = |
1 / 1 / 2,03 |
0,52 |
\ |
------- |
|
|
|
|/ — [ —— - |
J = 1/0,018 = 0,13 а. |
|||||
Критерий |
іф = |
0 5 |
Для |
Я = 0,05 |
и |
k = 6 —1=5 по |
|
'—-— = 3,85. |
|||||||
|
|
0,13 |
|
|
|
|
|
табл. V находим tst= 2,57. Видно, что |
|
Также и довери |
|||||
тельная |
граница tmd = 2,57x0,13= 0,33 |
заметно |
ниже средней |
||||
разницы |
(0,5), наблюдаемой в посевах |
ржи |
по |
апрельскому и |
|||
черному пару. Следовательно, имеются |
достаточные основания |
отвергнуть нулевую гипотезу и признать эту разницу статисти чески достоверной.
Итак, применив два разных способа обработки одного и того же материала, мы пришли к прямо противоположным выводам. Очевидно, вторая оценка результатов опыта является более эф фективной, потому что она опирается на правильно выбранный способ анализа опытных данных. Несомненно, что на протяже нии шестилетнего испытания посевов ржи по черному и апрель скому пару условия выращивания растений не были одинако выми: они колебались по годам опыта. А это значит, что перед нами величины сопряженные и сравнивать их нужно попарно, т. е. по средней разности сопряженных вариант.
. Приведенный пример служит наглядным подтверждением, того, о чем говорилось выше: статистические методы нельзя при менять огульно, не сообразуясь с содержанием материала, к которому они применяются. Если выбранные методы обработки не соответствуют содержанию описываемых с их помощью фак тических данных, они могут оказать исследователю плохую услугу.
В качестве следующего примера подвергнем полной обработ ке результаты испытания на урожайность ячменя и овса в усло виях нечерноземной полосы Российской Федерации, приведен ные в табл. 2. Расчет необходимых значений показан в табл. 31.
Разница между средним урожаем ячменя и овса на протя
жении |
семилетних испытаний составила: 8,54—7,57 = 0,97 |
ц/га. |
||||
Находим ошибку этой разности: |
|
|
|
|
||
|
md |
|
|
0,53 |
ц/га. |
|
Критерий іф = |
0,97 = 1,83. Для |
уровня |
значимости Я = 0,05 и |
|||
|
|
сУкГ |
|
|
|
|
числа |
степеней |
свободы &= 7—1 = 6 критерий |
tst= 2,45 |
(см. |
||
табл. |
V приложений). Поскольку |
t$<C.tsu |
нулевая гипотеза со |
110
храняется; преимущество по урожайности ячменя перед овсом
остается недоказанным.
Сравнение результатов опыта с контролем или одного вари анта опыта с другим можно провести также и по средней раз ности между парными значениями сравниваемых величин, отно
ся ее к выборочной ошибке.
Т а б л и ц а 31
Урожай ціга
Годы |
|
|
Разница |
d 2 |
d —d |
{ d - d ? |
ячмень |
овес |
(d) |
||||
|
|
|
|
|
||
1928 |
7 , 7 |
8 , 2 6 |
— 0 ,5 6 |
0 ,3 1 |
- 1 , 5 4 |
2 ,3 7 |
1929 |
9 , 0 |
7 , 2 2 |
1 ,7 8 |
3 ,1 7 |
0 ,8 0 |
0 , 6 4 |
1930 |
9 , 4 |
8 , 4 3 |
0 ,9 7 |
0 , 9 4 |
0 ,0 1 |
0 ,0 0 |
1931 |
7 , 4 |
5 , 5 7 |
1 ,8 3 |
3 ,3 5 |
0 ,8 5 |
0 ,7 2 |
1932 |
7 , 4 |
6 , 3 5 |
1 ,0 5 |
1 ,1 0 |
0 , 0 7 |
0 ,0 0 |
1933 |
1 0 ,9 |
8 , 0 0 |
2 , 9 0 |
8 ,4 1 |
1 ,9 2 |
3 ,6 9 |
1934 |
8 , 0 |
9 , 1 3 |
- 1 , 1 3 |
1 ,2 8 |
- 2 , 1 1 |
4 , 4 5 |
Сумма |
— |
— |
+ 6 , 8 4 |
1 8 ,5 6 |
— |
1 1 ,8 7 |
Среднее |
8 , 5 4 |
7 ,5 7 |
0 , 9 8 |
— |
— |
— |
Так, в рассматриваемом примере средняя арифметическая, вы численная по общей сумме парных различий (с учетом знаков!), равняется:
d — fy— = 0,977 = 0,98 (см. табл. 31).
п7
Выборочная ошибка этой разницы определяется по формуле
md — |
і / |
S j i - i y |
= у |
1Г87 = |
= 0 ,5 3 Ч/га. |
к Р”теР |
||
|
1 |
п ( п — 1) |
' |
7 X 6 |
|
|
|
|
Іф |
0,98 = |
1,83. |
Получился тот же результат, что и выше. |
|||||
|
0,53 |
|
|
|
|
|
|
|
В качестве критерия достоверности средней разности может |
||||||||
служить также и отношение t — — ~\/п, |
где <7 = — 2<7і, |
|
а Оа = |
|||||
|
|
|
|
|
Od |
п |
|
|
|
|
2 |
(di — J ) 2, которые оцениваются по таблице |
Стью- |
дента.
Способ парных сравнений позволяет оценивать достоверность наблюдаемых различий также и по доверительному интервалу.
111
Если доверительный интервал, построенный по средней разности между парными вариантами и ошибкой этой разности, имеет нижнюю границу с положительным знаком, это указывает на достоверность разницы между генеральными параметрами срав ниваемых выборочных показателей. Если же нижняя граница доверительного интервала оказывается с отрицательным знаком, это свидетельство недостоверности наблюдаемых различий. В отношении рассматриваемого примера доверительный интер вал для Р = 0,05 и k = 6 оказывается следующим: d±tm.a = 0,98± ±2,45x0,53 = 0,98± 1,30 или от —0,32 до +2,28. Нижняя граница доверительного интервала имеет отрицательный знак (—0,32). что указывает на недостоверность разницы, наблюдаемой между урожайностью ячменя и овса.
СРАВНЕНИЕ ДИСПЕРСИЙ. ^-РАСПРЕДЕЛЕНИЕ ФИШЕРА
Описанные способы оценки генеральных параметров по вы борочным средним в принципе применимы и для установления доверительных границ показателей вариации. Среднеквадрати ческие ошибки выборочных — о и Сѵ — определяются по сле дующим формулам:
Шп |
а2 |
= |
а |
(63) |
---- |
----- \ |
|||
|
2п |
|
ф2п |
■ |
ГПсѵ |
СѴ2 |
СѴ |
(64) |
|
2п |
|
]/2п |
||
|
|
|
Критерием достоверности различий между средними квадратическими отклонениями служит отношение
оі — 02
Уо^/Пі + 0 2/ « 2
Например, выборка из урожая фасоли на делянке п = 200 семян
59,3 характеризуется а = 59,3 мг с ошибкой та = :==— = 2,96 мг.
Доверительные границы генерального параметра для Р=0,05 и соответственно /=1,96:
нижняя=59,3— 1,96 X 2,96 = 53,8 |
мг |
верхняя = 5 9 ,3 + 1,96 X 2,96= 65,1 |
мг |
Однако этот способ оценки генеральных параметров приме ним лишь к выборкам достаточно большого объема, распреде ляемых по нормальному закону. На малых выборках он оказы вается неточным. В поисках лучшего способа оценки Р. А. Фи-
112
шер установил, что если вместо разности оі — о2 взять разность натуральных логарифмов In оі—ln 0 2, где 0 і > 02, то эта величи на, обозначенная им через Z, распределяется нормально не только при больших, но и на среднего объема выборках. При вычислении Z вместо натуральных можно пользоваться десятич ными логарифмами по формулам: Z = 2,3O26(lg0t — lg Ст2), или
о |
02 |
Z = 2,3026 lg — , а также |
Z == 1,1513 lg ^ -. В дальнейшем вмес- |
02 |
0| |
то логарифма отношений были взяты самые отношения и не средних квадратических отклонений, а дисперсий; в честь Фише ра их принято обозначать заглавной буквой F:
2 |
|
F = Оі |
(65) |
Этот показатель получил название критерия Фишера. Соответ ственно были переработаны и таблицы Фишера применительно к функции это критерия, что значительно упрощает расчеты.
Критерий F функционально связан с вероятностью, он имеет непрерывную функцию распределения и зависит только от чисел степеней свободы: ki = rii — 1 и k2 = n2— 1 сравниваемых Диспер сий. Характерным для F оказывается то, что он полностью опре деляется выборочными дисперсиями и не зависит от генеральных параметров, так как предполагается, что обе дисперсии из одной и той же генеральной совокупности. Поэтому при k— >-оо отно-
шение 0 і/о2 -> 1. График плотности вероятности F распределения для ki и k2 и критических границ F\ и F2 приводится на рис. 12. Видно, что распределение F асимметрично.
Ф)
Рис. 12. График плотности вероятности F-pacnpe- деления для типичных значений k\ и k2 числа сте пеней свободы и критические границы F, и F2 (по Смирнову и Дунину-Барковскому, 1965)
113
Закономерность |
функции |
F = |
— для двух уровней значи- |
|
2 |
||
|
|
|
а2 |
|
|
|
2 |
мости Рі = 0,05 и ^ 2 = 0,01 и соответствующих степеней свободы ■ki и &2 табулирована в виде критических (стандартных) значе ний критерия F (см. приложения табл. VII). В этой таблице сте
пени свободы для большей дисперсии берутся |
по горизонтали |
|||
(верхняя |
строка), а по вертикали |
(первая |
граф а)— степени |
|
свободы |
для меньшей |
дисперсии. |
При определении величины |
|
критерия F числителем |
берется обычно большая дисперсия. По |
этому критерий F может быть равен единице или больше ее. Чем значительней разница между дисперсиями, тем больше будет и величина критерия F, и, наоборот, чем меньше окажется рас хождение между дисперсиями, тем меньше будет и величина F. Нулевая гипотеза исходит из признания равенства дисперсий. Если эмпирические значения критерия Фишера (/>) меньше теоретических, указанных в таблице (Fst) для соответствующего уровня значимости и степеней свободы k\ и k2, они рассматри ваются как.случайные. Если же F $ ^ F si, нулевая гипотеза от вергается, разница между сравниваемыми величинами признает ся статистически достоверной.
Например, сравниваются две выборки по весу семян фасоли: одна из посевного материала — «1 = 100 и оі = 58,3 мг и другая из
урожая—«2 = 200 и 02 = 59,3 мг. Критерий Fst = |
(59,3)2 |
3516 |
|
= |
|
= 1,03. По таблице Фишера для Р = 0,05 |
и &i=200—1= 199' |
и k2 = 100 — 1=99 находим Fst = 1,31 (см. табл. VII приложений). Так как /><CPsi, нулевая гипотеза сохраняется; расхождения между выборками по данному признаку оказываются статисти чески недостоверными.
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ОЦЕНОК
Критерии Стьюдента (t) и Фишера (F) связаны с опреде ленными формами нормального распределения; их применение имеет в виду оценку расхождений-между генеральными пара метрами на основании выборочных показателей сравниваемых совокупностей. Поэтому они называются параметрическими кри териями. Их разрешающая мощность велика лишь при условии,, что сравниваемые совокупности распределяются по нормальному закону или не сильно отклоняются от него.
В практике же встречаются не только нормальные, но и иного вида распределения, о которых исследователю мало что извест но. В таких случаях применение параметрических критериев не гарантирует от возможных ошибок. Поэтому для оценки рас хождений между выборками, наряду с указанными критериями,, используются и другие, вспомогательные критерии, основанные
114
на сравнении не самих вариант, а их порядковых чисел в ран жированном ряду. Критерии, основанные на этом принципе, на зываются порядковыми. Применение порядковых критериев не связано с определенной формой распределения; они не нуждают ся в вычислении средней арифметической и среднего квадрати ческого отклонения и других параметров, поэтому и получили название непараметрических критериев.
Непараметрические, или порядковые, критерии просты по своей конструкции; они не требуют большой вычислительной ра боты, что выгодно отличает их от критериев параметрических. При всем этом преимущество остается на стороне критериев па раметрических, обладающих большей статистической мощно стью, лучшей разрешающей возможностью, чем у критериев непараметрических. Поэтому во всех случаях, когда распределе ния практически не отклоняются от нормального закона, реко мендуется использовать критерии параметрические. Там же, где возникает сомнение в точности выводов, которые делаются па основании использования параметрических критериев, когда форма распределения остается недостаточно ясной, уместно ис пользовать и непараметрические критерии различия. Всесторон ний контроль над правильностью выводов никогда не мешает. Если же обработка выборочного материала разными способами дает один и тот же результат, это гарантия того, что выводы по лучаются правильные.
Существует несколько непараметрических критериев разли чий, неодинаковых по своей конструкции и мощности. Мы рас смотрим лишь два из них, наиболее простых и удобных в работе, особенно при сравнительной оценке малочисленных выборок.
Критерий Т Уайта
Одним из критериев, применяемых для установления досто верности различий, наблюдаемых при сравнении двух независи мых распределений, является непараметрический критерий Т •Уайта, который в равной мере применим к выборкам равновели кого и неодинакового объема. Сущность методики, лежащей в основе применения этого критерия, следующая. Все варианты сравниваемых совокупностей ранжируют в один общий ряд и находят их ранги. Затем ранги суммируют — отдельно по каж дой выборке. Если сравниваемые выборки совершенно не отли чаются одна от другой, то и суммы их рангов должны быть равны между собой. В противном случае такого равенства на блюдаться не будет. И чем значительнее расхождение между выборками, тем больше разница между суммами их рангов. А так как указанные различия могут быть случайными, они оце ниваются с помощью критерия Уайта по специальной таблице, рассчитанной для выборочных наблюдений разного объема и
115
двух порогов доверительной вероятности — Р = 0,95 |
и |
Р = 0,99; |
|
эта таблица приводится в приложениях под № IX. |
|
из двух |
|
Для оценки критерия |
Т всегда берется м е н ь ш а я |
||
сумм рангов, которая и |
сравнивается с табличным |
(стандарт |
ным) значением этого критерия для щ и п2, т. е. объемов срав ниваемых совокупностей и принятого порога доверительной ве роятности. Если Т^>Тф, это указывает на достоверность на блюдаемой разности и нулевая гипотеза отвергается. Если же табличное число (Tst) меньше или равно фактической величине критерия Тф, нулевая гипотеза сохраняется; разница между вы борками признается статистически недостоверной. Напомним, что ранги — это числа натурального ряда, которыми обознача ются члены ранжированных совокупностей, причем одинаковым
(повторяющимся) |
значениям |
этих |
совокупностей |
соответству |
ет один и тот же |
средний |
ранг. |
Общая сумма |
всех рангов |
где п — суммарное число наблюдений.
Использование критерия Т Уайта проще усвоить из соответ ствующего примера. Так, по данным Г. Е. Бодренкова (1963), длина тела личинок щелкуна, обитающих в посевах озимой ржи и проса, выраженная в мм, варьирует следующим образом:
в посевах ржи: |
7 |
10 |
14 |
15 |
12 |
16 |
12: JCI =- 12,3 |
м м |
в посевах проса: |
11 |
12 |
16 |
13 |
18 |
15; |
JC2 = 1 4 ,2 |
м м |
На основании этих проб создается впечатление о более круп ных размерах личинок щелкунов, обитающих на просе. Прове рим это предположение с помощью критерия Т Уайта. Ранжи руем всю совокупность наблюдений:
длина личинок: |
7 |
10 |
11 |
12 |
12 12 |
13 |
14 |
15 |
15 |
16 |
16 |
18 |
|
ранги: |
1 |
2 |
3 |
5 |
5 |
5 |
7 |
8 |
9,5 |
9,5 |
11,5 |
11,5 |
13 |
Находим суммы рангов |
|
|
|
|
|
|
|
|
|
|
|
|
|
для ряда ржи: |
|
|
1+ 2+8+ 9,5+5+ 11,5+5 = 42 |
|
|
|
|||||||
для ряда проса: |
|
|
3+5+11,5 + 7+13+9,5=49 |
|
|
|
И т о г о . . . 91
Видно, что суммы рангов отличаются друг от друга. Чтобы опре делить достоверность различий, меньшую сумму (Гф= 42) срав ниваем с табличным числом критерия Tst для «і = 7 и п2 = 6 , ко торое равно 27. Так как 7'8< = 27<7’ф = 42, следует заключить, что различия, наблюдаемые в размерах личинок щелкуна, обитаю щих в посевах озимой ржи и проса, носят случайный характер, т. е. они статистически недостоверны.
116
Критерий Вилкоксона ( Z ) для сопряженных пар
В тех случаях, когда сравниваемые выборки коррелированія друг с другом, т. е. представлены рядами сопряженных попарно вариант, для оценки достоверности различий применяются соот ветствующие непараметрические критерии. Одним из таких критериев, обладающим достоточной мощностью, является кри терий Z Вилкоксона для сопряженных пар. Методика его ис пользования сводится к следующему. Сначала находят разности между парными вариантами сопряженных рядов; при этом учи тываются знаки разностей. Затем эти разности ранжируют и определяют их ранги. Ранги суммируют отдельно с положитель ными и отрицательными знаками. Причем, если разность между парными вариантами равна нулю, она в расчет не принимается, т. е. исключается, и число наблюдений (п) соответственно умень шается.
Меньшая сумма рангов, независимо от знака, сравнивается с числом, указанным в специальной таблице для взятого уровня значимости и числа парных наблюдений, которое не должно быть меньше 6. Если табличное (стандартное) значение крите рия Z превышает его фактическое значение, т. е. меньшую сумму рангов, это указывает на достоверность наблюдаемых различий. В противном случае нулевая гипотеза сохраняется и различия, наблюдаемые между рядами сопряженных вариант, признаются статистически недостоверными. Таблица значений критерия Вил коксона для разных уровней значимости (Р ) и числа наблюде ний (п) приведена в приложениях под № X. Например, методом серийных испытаний изучалась степень зараженности яблок двумя разновидностями грибка А и В, вызывающего загнива ние яблочной ткани. Результаты десяти испытаний (проб) ока зались следующими (табл. 32).
|
|
|
|
|
|
|
|
|
Т а б л и ц а |
32 |
|
|
|
|
Количество |
загнившей ткани в г по сериям опыта |
|
||||||
Разновидности грибка |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
|
|
||||||||||
Разновидность А . . |
5,9 |
4,9 |
3,6 |
8,8 |
7,4 |
5,7 |
6,0 |
6,3 |
9,4 |
9,1 |
|
» |
В . . |
4,7 |
5,1 |
3,7 |
7,4 |
6,1 |
4,2 |
5,0 |
7,1 |
6,3 |
8,0 |
Разница |
(d) . . . . |
1,2 |
- 0 , 2 |
- 0 , 1 |
1,4 |
1,3 |
1,5 |
1,0 |
- 0 , 8 |
3,1 |
1,1 |
ранжируем разность: |
-0,1 |
—0,2 |
- 0 ,8 |
1,0 |
1,1 |
1,2 |
1,3 |
1,4 |
1,5 3,1 |
находим ранги: |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 9 |
10 |
|
|
|
|
|
|
|
|
|
117 |
Суммируем ранги |
|
1+ 2+3 = 6 |
|
||
с отрицательными знаками: |
|
||||
с положительными знаками: |
4+ 5+ 6 + 7 + 8 + 9 + 10=49 |
||||
|
|
|
|
И т о г о . . . |
55 |
Проверяем расчет: п { п + 1) |
10X11 |
55. |
|
||
Меньшую сумму рангов |
(Z —6) |
|
сравниваем с |
табличным |
|
числом критерия |
Z0,o5 для |
п=10, которое равно 8. Так как |
|||
Z st > Z ^ y нулевая |
гипотеза |
опровергается; следует |
заключить, |
что грибок А достоверно обладает большим вредоносным дей ствием, чем грибок В.
Оценка расхождений между рядами по критерию Стьюдента приводит к такому же выводу, что видно из следующего расче
та. Средние арифметические сравниваемых |
рядов равны: х\ — |
||||||
= 6,71 г |
(грибок Л) |
и *2 = 5,76 г |
(грибок В). |
Разность х \ — *2 = |
|||
= £> = 6,71 — 5,76 = 0,95 |
г. Сумма |
квадратов |
отклонений |
отдель |
|||
ных значений разности |
от их средней арифметической |
Z(d — |
|||||
—d )2 = 6,65 (расчет |
предлагается |
проделать |
читателю), |
откуда |
|||
средняя |
ошибка разности средних |
|
|
||||
l l Z ( d - d y |
і / |
6,65 |
= |
1/0,074 = 0,27. |
|
||
md = ' |
п(п — 1) |
' |
Т0 Х9 |
|
|||
Критерий достоверности |
|
0,95 |
|
|
|||
ÖX7 = 3,5. |
|
|
Стандартное значение критерия Стьюдента для уровня значи мости Р = 0,05 равно 2,26 (см. табл. V приложений), откуда сле дует заключить о достоверности наблюдаемых различий. Сов падение результатов обработки одного и того же материала раз ными способами дает большую уверенность в правильности сделанного вывода.
В заключение применим критерий Вилкоксона к оценке раз ницы, полученной при испытании урожайности ячменя и овса в нечерноземной полосе Российской Федерации. Соответствую щие данные приведены в табл. 32. Разницу между парными значениями вариант, что приведена в одной из граф табл. 32, ранжируем, указывая для каждого значения его ранг с соответ ствующим этому значению знаком:
разность (d): |
—0,56 |
0,97 |
Г,05 |
—1,13 |
1,78 |
1,83 2,90 |
ранги: |
— 1 |
2 |
3 - |
4 |
5 |
6 7 |
Суммируем ранги, взятые отдельно с отрицательными и по ложительными знаками:
—1+ —4= —5
2 + 3 + 5 + 6 + 7 = 24
118
Берем меньшую сумму рангов (Z = 5), не обращая внимания на ее знак, и сравниваем, как это делали выше, с табличным чис лом критерия Z Вилкоксона для Р = 0,05 и п = 7, которое равно 3.
Так как |
табличное значение критерия Zst — 2><.Z$= b, |
нулевая |
гипотеза |
сохраняется; разница в урожайности ячменя |
и овса |
оказывается статистически недостоверной. Напомним, что к это му выводу мы пришли, когда сравнивали данные опыта с по мощью параметрического критерия t Стьюдента.