Персии, о которых говорилось выше (см. четвертую и пятую гла вы). Опираясь па эти свойства, дробные и многозначные числа можно переобразовать в числа немногозначные следующим об разом:
1. Каждую варианту комплекса уменьшить на одно и то же произвольно взятое число А. Обычно берется число, близкое к величине минимальной варианты комплекса.
2. Каждую варианту комплекса можно разделить на одно и то же подходящее число К, например, на 10, 100 и т. д.
3.Каждую варианту комплекса можно умножить на одно и то же положительное число К, что позволит избавиться от дро бей. Например, умножая числа 0,11, 0,16,' 0,31 на К = 100, полу чаем целые числа 11, 16, 31, с которыми удобней оперировать, проводя дисперсионный анализ.
4.Возможны и двойные преобразования многозначных и
дробных чисел, что достигается делением или умножением раз ности X—А на другое, произвольно взятое одно и то же число К.
Так как преобразование исходных чисел сказывается на ко нечных результатах дисперсионного анализа, суммы квадратов отклонений и среднеарифметическую комплекса приходится ис правлять. Как это делать и в каких случаях какие исправления вносить в указанные величины, показывает следующая сводка (табл. 95).
|
|
|
|
|
Т а б л и ц а 95 |
|
|
і. Какие исправления нужно внести в конечные результаты |
|
Способы преобразования |
|
расчет средней арифметической |
|
чисел |
суммы квадратов отклоне |
|
|
ний (D) |
|
(JT) |
|
X — А |
Поправка |
не нужна |
Прибавить число А |
|
( х —А) К |
Разделить на К2 |
Разделить на К и приба |
|
х —А |
|
|
вить А |
|
К и приба |
|
Умножить на К2 |
Умножить |
на |
|
К |
вить А |
|
|
|
Разделить на К2 |
на |
К |
|
х Х К |
Разделить |
|
х / К |
Умножить на К2 |
Умножить на К |
|
Когда вносятся |
поправки |
в суммы квадратов (D), исправлять |
дисперсии (а2) и другие показатели, кроме средней (х), не нужно. Продемонстрируем способы упрощения дробных чисел на при мере испытания различных доз минеральных удобрений, вноси мых под посевы озимой ржи, который рассматривался выше (см. табл. 92). Минимальная варианта этого комплекса равна 7,5. Уменьшим каждую варианту выборки на А = 7. Получим следую щие значения: 8,0—7=1,0; 8,2—7 = 1,2; 11,0—7= 4,0 и т. д. Что бы освободиться от дробей, умножим полученные числа на К — = 10. В результате получим двухзначные числа: 10, 12, 40 и т. д., на них и рассчитаем вспомогательные значения, нужные для оп ределения сумм квадратов отклонений. Расчет показан в табл. 96.
Т а б л и ц а 96
Градации фактора А (дозы удобрений)
|
Показатели |
1 |
|
|
2 |
3 |
|
|
|
|
|
Урожай на |
10 |
14 |
12 |
20 |
40 |
|
участках |
20 |
16 |
30 |
30 |
60 |
|
(X) |
|
|
22 |
30 |
50 |
|
па |
4 |
|
|
6 |
3 |
|
Ъхі |
60 |
|
|
144 |
150 |
|
ѴХі) 2 |
3600 |
20 736 |
22 500 |
|
( 2 * і ) 2 |
900 |
3 456 |
7 500 |
|
пА |
|
|
|
|
|
|
|
Ъх\ |
952 |
|
3 728 |
7 700 |
4 |
Сумма |
|
5 |
a = 4 |
15 |
2 |
ХпА = ТУ — 15 |
20 |
ОС I н |
400 |
|
200 |
па |
|
250 |
2*2 = 12 630 |
Находим суммы квадратов отклонений, уменьшая конечный результат в К2 раз, т. е. делим его на 100, поскольку варианты увеличивались в 10 раз:
Dy = |
2л:2 ■ (Sx)2 |
12 630' |
3742 |
|
N |
|
15 |
- |
12 630 -9325 |
3305 = |
33,05, |
(2хг)2 |
(Ех)* |
|
|
DX |
= 12 0 56 -9325 = 2731 = 27,31, |
пА |
N |
|
|
Dz = 2 л:2------12 630 - 12 056 = 574 = |
5,74. |
|
Па |
|
|
Сравнивая полученные результаты с теми, которые были по лучены раньше, убеждаемся в полном их совпадении. Дальней шие расчеты отпадают, так как они проделаны выше.
Рассмотрим следующий пример. На одной из опытных стан ций испытывалась урожайность шести местных сортов пшеницы. Опыт проводился в четырехкратной повторности по каждому сорту. Результаты оказались следующие (табл. 97).
|
|
|
|
|
Т а б л и ц а 9? |
|
|
Урожай {щга) по повторностям |
|
|
Хе сортов |
|
|
|
|
Средний |
1 |
2 |
3 |
4 |
урожай |
|
|
І-Й |
26,1 |
29,2 |
30,0 |
27,3 |
28,2 |
2-й |
25,0 |
24,3 |
28,5 |
29,0 |
26,7 |
3-й |
27,2 |
26,4 |
31,0 |
26,4 |
27,8 |
4-й |
23,6 |
27,2 |
25,2 |
. 24,8 |
25,2 |
5-й |
30,0 |
33,0 |
36,0 |
29,8 |
32,2 |
6-й |
23,0 |
26,0 |
26,0 |
24,8 |
25,0 |
Данные, приведенные в табл. 97, показывают, что сорта по-раз ному реагируют на одинаковые условия выращивания. Подверг нем эти данные дисперсионному анализу, а предварительно пре образуем многозначные числа следующим образом. Минималь ная варианта комплекса равна 23,0. Уменьшим каждую варианту на Л =22, а затем уменьшим результаты на /С = 10, что освободит от дробей. Преобразованные таким способом значения признака
|
сводим |
в |
таблицу и |
подвергаем дисперсионному анализу |
|
(табл.98). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а 98 |
|
|
|
|
Градации фактора А (сорта пшеницы) |
|
|
|
|
Показатели |
1 |
2 |
3 |
4 |
5 |
6 |
Сумма |
|
|
|
|
|
|
|
Урожай |
|
по |
41 |
30 |
52 |
16 |
80 |
10 |
|
|
|
повтор- |
72 |
23 |
44 |
52 |
ПО |
40 |
а = 6 |
|
ностям |
(20 |
80 |
65 |
90 |
32 |
140 |
40 |
|
|
|
|
|
|
|
53 |
70 |
44 |
28 |
78 |
28 |
|
|
|
па |
|
|
4 |
4 |
4 |
4 |
4 |
4 |
N = |
24 |
|
І Х і |
|
|
246 |
188 |
230 |
128 |
408 |
118 |
Тлг = |
1 318 |
|
( В Д |
|
|
60 516 |
35 344 |
52 900 |
16 384 |
166 464 |
13924 |
— |
|
(Тдг,)2 |
15 129 |
8 836 |
13 225 |
4 096 |
41 616 |
3 481 |
(SX/)2 |
|
|
|
|
|
2-— — = 86 383 |
|
па |
|
|
|
|
|
|
|
|
ПА |
|
|
Ъх) |
|
|
16 074 |
10554 |
14676 |
4 768 |
44184 |
4084 |
2*2 = |
94 340 |
Рассчитываем суммы квадратов отклонений:
Dy = |
2х2 |
(2*)* |
= |
94 340 ■ |
13182 |
ѵ |
’ |
24 |
|
|
|
N |
|
|
|
= |
94 340 - |
72413,5 = |
21926,5 = |
219,27, |
Пх = |
|
( E x * ) 2 |
(Ex)2 |
86 383 - |
72413,5 = |
2 —---- - — - - |
L |
= |
|
|
пА |
|
N |
|
|
|
|
|
|
= |
13970,5 = |
139,71, |
|
„ |
|
(Ех*)2 |
94 340 - |
86 383 = 7957 = 79,57. |
D~ = y,x2- 2 |
-v— — = |
|
|
п |
|
|
|
|
|
|
Определяем числа степеней свободы: |
24 — 1 = 23, |
общей дисперсии — Ку = |
N — 1 = |
межгрупповой дисперсии — Кх — а — 1 = 6 — 1 = 5 , внутригрупповой дисперсии — Kz = N — а = 24 — 6 = 18.
Находим величины дисперсий и сводим результаты дисперсион ного анализа в итоговую таблицу (табл. 99).
Т а б л и ц а 99
Источники вариации |
Степени |
Сумма |
Средний |
|
|
свободы |
квадратов |
квадрат |
РФ |
|
|
отклонений |
<°а) |
Р - |
Факториальная (меж- |
5 |
139,7 |
27,9 |
6,3 |
2,8 |
4,2 |
сортовая) ................. |
Остаточная .................. |
18 |
79,6 |
4,4 |
1 |
— |
— |
Общая . , . . . . . . . . |
23 |
219,3 |
— |
— |
|
— |
Поскольку F$>Fst д л я первого и второго уровней значимости, нулевая гипотеза отвергается с вероятностью Р = 0,99; разница между сортами по их урожайности в вышей степени достоверна.
Сравнение средних показателей дисперсионного комплекса
Дисперсионный анализ сразу охватывает весь комплекс на блюдений и позволяет оценить достоверность или случайность различий, наблюдаемых между групповыми средними, в этом за ключается его преимущество перед так называемым дробным методом анализа выборочных данных, когда достоверность раз ницы оценивается между отдельно взятыми парами средних по казателей. В то же время рассмотренные схемы дисперсионного анализа не дают представления о конкретных средних показате лях, о достоверном преимуществе одного или нескольких из них. Поэтому в завершение дисперсионного анализа исследователь,
когда этого требует опыт, должен оценить достоверность разли чий, наблюдаемых между средними арифметическими дисперси онного комплекса. Это можно сделать с помощью критериев Фишера (F) или Стьюдента (/), рассмотренных в предыдущих главах. Для оценки разности между двумя средними х\—х 2 = D в дисперсионном комплексе критерий Фишера определяется по следующей формуле:
_ D * |
т Х п г |
D о2 |
пі 4- п2’ |
Z |
|
где oz2— остаточная дисперсия. При одинаковых числах вариант в градациях комплекса, в сравниваемых группах, т. е. при п\ — = п2, эта формула упрощается:
Z
Числа степеней свободы равны: Кі = \ и Ki = Kz\ причем Кі берет
ся по горизонтали, |
а К2— по вертикали таблицы Фишера |
(табл. VII приложений). |
Оценим по критерию Фишера урожайность отдельных сортов |
пшеницы с их общей |
урожайностью по шести сортам. Средние |
арифметические |
по урожайности |
каждого сорта |
приведены в |
табл. 97. Общая средняя по шести сортам равняется: |
|
х = Л + ^ |
= 22 + |
= |
22 + 5,5 = 27,5 |
ц/га. |
Находим разность между групповыми (сортовыми), средними и общей средней всего комплекса:
№ сортов: |
1 |
2 |
3 |
4 |
5 |
6 |
х1 — x=D |
+ 0 ,7 |
- 0 ,8 |
+ 0 ,3 |
—2,3 |
+ 4 ,7 |
—2,5 |
Бросается в глаза большая прибавка урожая по сравнению с об щей средней пятого сорта. Определим достоверность этой раз ности. Имеем: хі = 32,2—х —27,5 —4,7 ціга, откуда Д2 = 4,72 = 22,1, оу2 = 4,4 ціга. Так как в группах комплекса содержится одинако вое количество вариант (п = 4), критерий Фишера рассчитаем по второй формуле:
22,1
По табл. VII для /Сі = 1 и К2 = Кг= 18 и Р = 0,01 находим Fst — = 8,3. Видно, что F<fr>Fst, следовательно, нулевая гипотеза не со храняется; пятый сорт достоверно превосходит по урожайности средний урожай по всем шести испытанным сортам этой куль туры.
Оценим ту же разность по критерию Стьюдента, который, как известно, определяется отношением разности к ее средней ошибке и оценивается по таблице Стьюдента (табл. V приложений) по числу степеней свободы К = Кг—1 и принятому уровню значимо сти (Р). Применительно к дисперсионному комплексу средняя ошибка разности между средними арифметическими определяет ся по формуле
где т~ — выборочная ошибка частной средней (ж»), определив-
XI
мая по формуле
Если число наблюдений в отдельных группах комплекса не одинаковое, выборочная ошибка разности между средними опре деляется по следующей формуле:
ГПг>= Ох
где о / —- остаточная дисперсия, а /іі и п2— количества вариант в сравниваемых группах.
Применительно к рассматриваемому примеру выборочная ошибка групповых средних по урожайности разных сортов пше ницы равняется:
Ошибка разности между средней урожайностью пятого сорта и общей урожайностью испытанных шести сортов пшеницы (D — = 4,7 ц/га) определяется следующим образом:
mD = ф2 X 1Л = У2,2 = 1,5 ц/га.
Критерий Стьюдента t = —— = 3,1. По табл. V приложений для
К=Кг—1 = 18—1 = 17 и Р = 0,01 находим tst = 2,9. В данном слу чае £ф>4<, что опровергает нулевую гипотезу и дает основание подтвердить ранее сделанный вывод о достоверном преимущест ве пятого сорта по сравнению со средней урожайностью по шести испытанным сортам пшеницы.
Оценка силы влияния факторов на результативный признак
Дисперсионный анализ позволяет устанавливать не только достоверность, но и силу влияния регулируемых и нерегулируе мых в опыте факторов на результативный признак. Сила влияния фактора определяется как доля факториальной вариации в об щем варьировании признака. В качестве показателя силы влия ния, обозначаемого символом цх2, Плохинский (1964, 1966) пред ложил использовать отношение факториальной суммы квадратов (Де) к общей сумме квадратов (Dy) дисперсионного комплекса, т. е.
2 |
Dx |
2 |
, Dz |
4 x = |
7 r - , |
ИЛИ ц х = |
1 — — . |
|
L)y |
|
D y |
Этот показатель получается, если каждый член равенства Dy=D x+D z, выполняемого в любом дисперсионном комплексе, разделить на Dy:
А* |
Dz |
Dx |
D z |
2 |
7 T- + |
j r - = 1, откуда |
Dy |
Du |
T|x • |
U y |
U y |
|
Критерием достоверности выборочного показателя т]ж2 берется отношение его к ошибке, которая определяется по следующей приближенной формуле (Плохинский, 1970):
|
тцх = (1 — Цх) .. |
|
где а — число градаций фактора А (в нашей |
символике), N — |
объем дисперсионного комплекса. |
|
Нулевая гипотеза отвергается, если |
st |
для Г/С, = |
а - 1 1 |
|
ІК 2 = |
N — a>’ |
|
причем значение К\ находят в верхней строке, а /Сг — в первом столбце таблицы Фишера (табл. VII приложений).
Так, для только что рассмотренного примера сила влияния сорта на урожайность пшеницы, определяемая по методу Плохинского, выражается следующей величиной:
2 |
Dx |
|
139,71 |
|
|
Т]ж |
А,, |
|
0,636, или 63,6%. |
|
|
"219,27 |
|
|
Ошибка этого показателя |
2 |
................ .. 6 ' 1 |
0 101 |
|
|
|
тг\х = |
(1 — 0,636) 24 — 6 |
, . |
Критерий Рф = 0,636 |
6,3. По табл. VII приложений |
для |
0,101 |
|
|
К і= 5 и /(2=18 и 1% уровня значимости находим /% = 4,2. |
По |
скольку F0 > F st; нулевая гипотеза не сохраняется; степень влия ния сортности на урожайность пшеницы оказывается достовер ной и весьма высокой.
Кроме метода Плохинского существуют и другие способы оп ределения силы влияния, в частности, достаточно точная оценка этого параметра получается при использовании формулы
Т]х2 = 1
Dy ' ' N — а ’
где -----------—'Поправочный коэффициент (на смещенность выбо-
N — а
рочного показателя ч\ х 2 от генерального параметра).
Так, в отношении рассмотренного примера показатель силы влияния, определяемый по этой формуле, оказывается следую щим:
79,59 |
24 — 1 |
219,27 Х |
1 — 0,463 = 0,537, или 53,7%. |
24 — 6 |
Видно, что второй метод дает заниженный результат по сравне нию с методом Плохинского. В чем же дело? Ответ на этот вопрос дают специальные исследования (Урбах, 1968; Гинзбург, 1969 и др.), авторы которых указывают на математическую несостоя тельность метода Плохинского. Однако, вопреки этим указаниям, формулой Плохинского продолжают пользоваться, а ее автор (Плохинский, 1970) не соглашается с доводами своих противни ков. Таким образом, вопрос этот остается дискуссионным и, повидимому, требует доработки.
ДИСПЕРСИОННЫЙ АНАЛИЗ ДВУХФАКТОРНЫХ ОРТОГОНАЛЬНЫХ КОМПЛЕКСОВ
В двухфакторных дисперсионных комплексах, градации кото рых содержат одинаковые или пропорциональные числа вариант, выполняется равенство DX = DA+ DB + DAB, где DA и DB— суммы квадратов отклонений, отражающие -влияние контролируемых факторов А и В и их совместное действие (AB) на результатив ный признак. Обработка таких комплексов ничем принципиаль но не отличается от описанных выше схем. Но поскольку прихо дится учитывать большее число факторов, их взаимодействие, техника расчетов, естественно, несколько усложняется.
Равномерные комплексы при наличии малых групп
Дисперсионный анализ двухфакторных равномерных комп лексов, состоящих из сравнительно небольших групп, проводит ся примерно по следующей схеме.
1.Все варианты дисперсионного комплекса суммируют. Най денную сумму возводят в квадрат и относят к общему числу на блюдений.
2.Затем каждую варианту комплекса возводят в квадрат и находят сумму квадратов (Их2).
3.Далее переходят к расчету сумм квадратов отклонений. Их можно рассчитать по следующим рабочим формулам (в на шей символике):
(Их)2
общая для всего комплекса — DY = Их2 — -— ; межгруп-
N
новая (по сочетанию градаций) — Dx = |
И (Их і ) 2 |
(2х) - • ос |
|
|
|
Пі |
N |
таточная или случайная— DZ = DY — DX, по фактору Л • |
(ИхА)2 |
(Их)2 |
по фактору |
|
(Ихв)2 |
DA — И----------------- -— ; |
В — DB = H------ — ■ |
пА |
N |
|
|
пв |
& х ) 2
по взаимодействию факторов AB — DAB = Dx —
N’
—DA — DB.
Здесь X — отдельные варианты дисперсионного комплекса; Ихі — сумма вариант по градациям комплекса; ИхА — сумма ва риант по фактору А; Ихв — сумма вариант по фактору В; пА — число вариант по фактору Л; пв — число вариант по фактору В; П{ — число вариант в отдельных клетках таблицы; N — общее число вариант, составляющих дисперсионный комплекс.
4. Определив суммы квадратов, устанавливают степени сво боды, которые равны:
для общей дисперсия — kY= N—1, дисперсии по фактору Л — кА= а—1, дисперсии по фактору В — kB = b—1, по взаимодейст вию факторов AB — kAB= (а—1) (Ь—1) = &а Х&в, остаточной или
случайной дисперсии — k z = N —ab. |
|
|
|
|
|
|
|
фак |
Здесь а — число градаций фактора Л; b — число градаций |
тора В. |
|
|
|
|
|
|
|
|
|
|
|
|
5. Отнесением сумм квадратов отклонений к числам степеней |
свободы определяются дисперсии: |
|
|
|
|
|
|
|
|
|
общая |
2 |
D Y |
, |
А |
2 |
= |
D А |
; по |
. |
фактору |
|
Су |
— _; по |
фактору Л — (Та |
|
|
|
|
|
Ar |
|
|
|
|
К а |
|
|
|
|
В |
2 |
D B |
по взаимодействию факторов AB |
г |
|
|
DAB |
Ов |
К в ; |
°AB ^ |
— |
|
|
|
|
|
|
|
|
|
|
|
Д а в |
и остаточная, отражающая действие на результативный признак
|
неконтролируемых в опыте (случайных) факторов — |
аі = |
~ ~ . |
|
|
|
|
|
|
K z |
|
6. Наконец, берут отношения дисперсий — |
р |
|
2 |
|
= |
— |
|
г А |
|
2 |
|
2 |
|
|
|
|
О в |
„ |
GA B |
|
по |
таб- |
|
Гв = — , |
FAB = |
— — и оценивают их достоверность |
|
Gz |
|
Gz |
|
|
|
|
Z |
|
Z |
|
|
|
лице Фишера (табл. VII приложений) для соответствующих сте пеней свободы и принятого уровня значимости.
7. Завершив первую часть анализа, определяют силу влияния факторов на результативный признак и делают соответствующие выводы.
Рассмотрим конкретный пример. На четырех породных груп пах одновозрастных коров изучалось влияние микроэлементов на жирность молока. Испытывались три препарата, каждое испыта ние имело трехкратную повторность. Результаты опыта оказа лись следующие (табл. 100).
|
|
|
|
|
|
|
|
|
Т а б л и ц а 100 |
|
|
% жира в молоке при 3-кратном испытании |
|
|
Породные |
|
|
препаратов |
(Л ) |
|
|
|
Средняя |
группы |
(В) |
Л , |
|
|
А 2 |
|
|
■Д 3 |
|
< ѵ |
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ві |
2,1 |
2,0 |
3,4 |
2,8 |
2,6 |
3,0 |
2,4 |
2,1 |
2,8 |
2,6 |
В2 |
4,0 |
3,2 |
4,1 |
3,9 |
4,1 |
4,5 |
3,0 |
3,9 |
4,2 |
3,9 |
Вз |
3,0 |
2,8 |
2,7 |
3,5 |
4,0 |
2,8 |
4,8 |
3,1 |
2,9 |
3,3 |
Ві |
3,4 |
3,0 |
2,9 |
3,0 |
2,9 |
3,0 |
3,3 |
2,8 |
3,0 |
3,0 |
Из табл. 100 видно, что средние арифметические породных групп неодинаковы: они варьируют от 2,6 до 3,9% жира в молоке. Нужно выяснить, случайны или достоверны различия между ни ми, т. е. оказывают ли влияние на жирномолочность породные свойства животных. Вместе с тем необходимо установить, оказы вают ли влияние на результативный признак (жирномолочность) различные препараты микроэлементов и как это влияние увязы вается с породной принадлежностью коров.
Обозначим через Л-фактор «микроэлементы», а через В — группы коров по породности и подвергнем результаты опыта дис-