Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ivanter2000_vved_v_kolich_biol

.pdf
Скачиваний:
16
Добавлен:
14.04.2015
Размер:
3.42 Mб
Скачать

142

Действительно, изменчивость вариант комплекса выборок (в нашем примере было 14 вариант в 4 выборках) определяется как действием изучаемого фактора, так и множеством других не учитываемых, случайных, причин. При сравнении же всего двух выборок (например, выборок 1 и 4) эта случайная изменчивость представлена не всем объемом информации, но только той частью, что проявилась в рамках этих двух сравниваемых выборок (две выборки содержат лишь 7 вариант). Поэтому оценки случайной изменчивости для двух выборок оказываются не столь точными, как могли бы быть по всем градациям.

Улучшить ситуацию позволяет метод попарного сравнения выборок, проводимый на базе однофакторного дисперсионного анализа (метод Шеффе). Для сравнения двух средних предлагается критерий F Фишера, в числителе которого стоит оценка действия фактора (разность средних) для любых двух сравниваемых градаций, а в знаменателе – оценка случайной изменчивости, общая для всего дисперсионного комплекса:

F

( M i M

 

j ) 2

 

 

 

~ F

( , df 1 , df 2 ) ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( k 1 ) S 2 случ.

 

 

1

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

n

 

 

 

 

 

 

 

 

 

i

 

j

 

 

где M – средние арифметические для любых двух (i, j) градаций однофакторного дисперсионного комплекса,

S²случ.– оценка случайной изменчивости из таблицы дисперсионного анализа,

k – число градаций фактора,

ni, nj – объемы выборок сравниваемых градаций,

α – принятый уровень значимости (обычно α = 0.05) df – число степеней свободы df1 = k–1, df2 = (k–1)∙(n–1).

Отличия средних считаются достоверными, если расчетное значение критерия Фишера превысит табличное F(α,df1,df2) (табл. 7П).

Сопоставляя выборочные средние для первой и четвертой градаций нашего примера (табл. 7.3), имеем:

F1,4 = (5.8–8)²/[(4–1)∙ 0.82∙(1/4+1/3)] = 3.37, df1 = 4–1 = 3; df2 = (4–1)∙(14–1) = 39,

F(0.05,3,39) = 2.87.

Полученное значение (3.37) больше табличного (2.87), следовательно, между средними арифметическими первой и последней

143

градаций есть достоверное отличие; разные дозы фактора действительно вызывают изменение плодовитости дафний.

Сравнение выборок первой и второй градаций показывает, что низкие дозы фактора в них не позволяют говорить о существенном влиянии на дафний: для данных объемов выборок полученное значение критерия (0.69) меньше табличного (2.87).

F = (5.8–6.8)²/[(4–1)∙ 0.82∙(1/4+1/3)] = 0.69 < 2.87.

Непараметрический однофакторный дисперсионный анализ

Рассмотренные выше схемы дисперсионного анализа исходили из предположения о нормальном распределении изучаемого результативного признака. Когда для какого-либо признака нет уверенности, что выполняется предположение о нормальном распределении изучаемого признака, когда требуется провести анализ быстро и без особой точности, когда мало данных или они выражены качественными признаками, можно использовать схему непараметрического дисперсионного анализа. Этот метод более неприхотлив, но менее точен, нежели параметрический анализ. Он исследует распределения вариант в нескольких выборках. Нулевая гипотеза состоит в том, что распределения одинаковы, т. е. выборки вязы из одной генеральной совокупности.

Порядок вычислений состоит в том, что все варианты ранжируются в порядке возрастания. Затем суммируются ранги вариант по каждой выборке отдельно и рассчитывается критерий:

 

 

 

 

2

 

 

R j

2

 

 

 

2

 

 

 

 

12

R

 

 

 

 

 

R

 

 

 

H

 

 

 

1

...

 

 

 

...

 

 

k

 

 

3 ( n 1 )

~ χ²(α, k–1),

 

 

 

 

 

 

 

 

n ( n 1 )

 

n 1

 

 

n j

 

 

 

n k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где n – число всех вариант,

nj – объем j-й градации фактора,

Rj – сумма рангов для каждой j-й градации фактора, k – число градаций фактора (j = 1, 2, … k).

При объеме выборок больше 5 вариант статистика H имеет распределение хи-квадрат с df = k–1 степенями свободы и сравнивается со значениями из табл. 9П.

Применим эту схему (табл. 7.4) к нашим данным из табл. 7.3,

144

расположив их в строку.

№ п/п

1

2

3

4

5

6

7

8

9

10 11 12 13 14

Градация

1

1

1

1

2

2

2

2

3

3

3

4

4

4

Значение

5

5

6

7

6

6

7

8

7

8

8

7

8

9

Затем упорядочим и ранжируем. Для нескольких одинаковых значений берется средний ранг.

№ п/п

1

2

3

4

5

6

7

8

9

10 11 12 13 14

Градация

1

1

1

2

2

1

2

3

4

2

3

3

4

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Значение

5

5

6

6

6

7

7

7

7

8

8

8

8

9

 

 

 

 

 

 

 

 

 

 

Ранг

1.5

1.5

4

4

4

7.5

7.5

7.5 7.5 11.5 11.5 11.5 11.5

14

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Наконец, разнесем ранги по градациям и подсчитаем необходимые суммы.

Таблица 7.4

Градация

1

1

1

1

2 2

2

2

3

3

3

4

4

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Значение

5

5

6

7

6 6

7

8

7

8

8

7

8

9

 

 

 

 

 

 

 

 

 

 

Ранг, R

1.5 1.5 4

7.5

4 4

7.5

11.5

7.5 11.5

11.5

7.5 11.5

14

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сумма, R

 

 

 

14.5

 

 

27

 

 

30.5

 

 

33

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

4

 

 

4

 

 

3

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R²/n

 

 

 

52.56

 

 

182.3

 

 

310.1

 

 

363

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Общий объем выборки равен n = 14. Величина критерия H составит:

 

12

52 . 56 182 . 3

 

 

 

 

H

 

 

310 . 1 363

3 13

 

 

 

14 13

 

 

 

 

 

 

 

0.065934

907.8958

45

14.86 .

 

 

 

По таблице хи-квадрат для α = 0.05 и df = 4–1 = 3 находим

χ²(0.05,3) = 7.81. Полученное значение критерия (14.86) больше табличного (7.81), значит, отличие выборочных распределений

достоверно. Химическая добавка действительно изменяет плодовитость дафний.

145

Сравнение нескольких выборок по изменчивости признака

Одна из задач сравнения двух выборок состояла в том, чтобы оценить однородность варьирования значений в их пределах, т. е. чтобы сопоставить множества случайных причин, действовавших при формировании выборок. Для двух выборок задача решалась с помощью метода сравнения двух дисперсий по критерию Фишера. В случае нескольких выборок используется критерий Бартлетта. С его помощью проверяется нулевая гипотеза о равенстве нескольких дисперсий по всем градациям дисперсионного комплекса (Но: S1² = ... = Sj ² = … = Sk²) – "фактор, действующий на разные выборки, не вызывает изменения характера варьирования".

Существенным ограничением для использования этого критерия является требование соответствия сравниваемых распределений нормальному закону. В другом случае критерий будет фиксировать не отличие дисперсий, но отличие типов распределений. Это значит, что уверенность в "нормальности" распределения должна быть условием выполнения процедуры, рассмотренной ниже.

Метод основан на том известном явлении, что выборочные дисперсии несколько отличаются от генеральной (в силу ошибки репрезентативности), а с ростом объема выборки ошибка репрезентативности уменьшается. Это значит, что для принятой нулевой гипотезы каждая из выборочных дисперсий (Sj²) может отличаться от общей дисперсии (S²), рассчитанной по всей совокупности, только случайно. Показано, что сумма отличий выборочных дисперсий от общей, есть случайная величина примерно с χ²-распределением:

k

S

2

 

 

 

 

j

χ² ≈

 

 

.

S

2

j 1

 

 

Стабилизировать поведение данной случайной величины позволяют поправки, применение которых дает критерий Бартлетта:

2

B

~ χ²(α,k–1),

 

 

 

 

 

 

 

 

C

 

 

 

 

B [ ( n j

1 )] ln S 2

 

( n j

1 ) ln S 2j ,

146

 

 

 

 

 

1

 

 

 

 

1

 

 

 

 

1

 

 

 

C

 

1

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 ( k 1 )

n

j 1

 

( n j

1 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

2

 

 

( x M j )

2

,

 

 

 

 

 

 

 

 

 

 

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

2

 

 

( x M ) 2

 

 

( n j

1 ) S

2j

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N k

 

 

 

N

k

 

 

 

 

 

где

k – число градаций (сравниваемых выборок),

 

nj – объем j-й градации (j = 1, 2,…, k),

 

S² – дисперсия для всей совокупности данных (общая средняя

сумма квадратов),

 

 

 

 

 

 

 

 

 

 

 

 

Sj² – дисперсии для каждой j-й градации (средняя сумма

квадратов по каждой градации),

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

– операция суммирования по всем k градациям.

j 1

Рассмотрим пример использования критерия Бартлетта для изучения изменчивости длины тела дафний (данные Н. М. Калинкиной). Животных в течение месяца содержали в пяти разных концентрациях лигнина, основного компонента сточных вод предприятий целлюлозно-бумажной промышленности. К концу опыта размеры рачков (M, мм) в высоких концентрациях стали выше, чем в контроле. Возникает вопрос, не сказалась ли жизнь в загрязненной среде на изменчивости (S, мм) размеров тела дафний? Предварительные расчеты приведены в табл.7.5.

 

 

 

 

 

 

Таблица 7.5

Концентрация

 

 

 

 

 

 

 

лигнина, мг/л

M

n

1/(n–1)

Sj

(nj–1)∙Sj2

(nj–1)∙lnSj2

 

0

4.05

8

0.143

0.057

0.0227

–40.106

 

1

4.08

10

0.111

0.158

0.2247

–33.213

 

50

4.45

10

0.111

0.126

0.1429

–37.286

 

147

100

4.36

10

0.111

0.190

0.3249

–29.893

150

4.40

10

0.111

0.158

0.2247

–33.213

Всего

 

48

0.587

0.689

0.93988

–173.711

Искомые величины составят:

S 2

 

 

( n j

1 ) S

 

2j

 

 

0 . 93988

 

 

 

0 . 02185

 

,

 

 

 

N

k

 

 

 

 

 

 

48

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B [ ( n j

1 )] ln S 2

 

 

 

( n j

 

1 ) ln S 2j

=

= 43

ln

0 . 02185

 

 

 

( 173

 

. 711 ) = –164.416 + 173.711 = 9.29816,

C 1

 

 

1

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

1

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 ( k 1 )

 

 

 

n j

 

1

 

( n j

1 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

1

 

 

 

 

0 . 587

 

 

1

 

 

= 1.04698,

 

 

 

3 ( 5

1 )

 

43

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

B

=

9 . 29816

 

 

= 8.88.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C

1 . 04698

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Полученная величина (8.88) не превышает табличное значение

критерия χ²(0.05,4) = 9.49 (табл. 9П), следовательно отличия дисперсий друг от друга недостоверны. Пока не удалось доказать влияние

токсиканта на изменчивость длины тела дафний.

148

Сравнение нескольких выборок по величине двух признаков (двухфакторный дисперсионный анализ)

Двухфакторный дисперсионный анализ исследует влияние на результативный признак двух факторов как порознь, так и совместно. Учет эффекта влияния каждого фактора по отдельности теоретически ничем не отличается от описанных выше схем. И там и тут оценивается изменчивость средних по градациям на фоне случайной изменчивости вариант внутри градаций, с помощью критерия Фишера устанавливается достоверность отличий межгрупповых дисперсий от внутригрупповых.

Важным преимуществом двухфакторного дисперсионного анализа перед однофакторным служит то, что с его помощью в рамках факториальной изменчивости удается определить варьирование по сочетанию градаций Ссочет., позволяющее получить новый и весьма ценный в биологическом отношении показатель – оценку влияния сочетанного действия (взаимодействия) факторов.

Логико-теоретические основы

Модель двухфакторного дисперсионного анализа становится сложнее и выражает отклонение варианты (xi) от общей средней (M) за счет действия двух контролируемых факторов порознь (xфактA., xфактB.) и совместно (xсочетAB.), а также за счет действия случайных причин

(xслуч.):

xi = M ± xфактA. ± xфактB. ± xсочетAB. ± xслуч..

Правило разложения вариаций предстает как:

Собщ. = СA + СB + СAB + Сслуч. ,

Сфакт. = Собщ. – Сслуч. = СA + СB + СAB,

где Собщ. = Σ(xi – M)²,

СA. = Σ(MAj – M)², j – число градаций фактора А, СB = Σ(MBk – M)², k – число градаций фактора В,

Сслуч. = Σ(xi – Mxi)²,

СAB = Собщ. (СA + СB + Сслуч.).

Сочетанное действие (взаимодействие) факторов означает, что каждый из них помимо прямого воздействия на объект исследования

149

сказывается и на характере влияния на объект и другого фактора, усиливает или ослабляет его. К примеру, неурожай кормов усугубляет негативное действие зимнего холода на численность популяций мелких млекопитающих.

Выделяют три основных вида взаимодействия факторов:

аддитивное, когда взаимодействия факторов нет, их эффекты просто складываются,

антагонизм, когда один фактор ослабляет действие другого, и наоборот,

синергизм, когда наблюдается усиление действия обоих факторов.

Эти эффекты часто встречаются в практике токсикологических исследований. Рассмотрим гипотетические примеры действия на подопытных животных двух веществ, взятых в разных концентрациях. По осям OX и OY диаграммы отложены концентрации этих веществ в

диапазоне от 0 до CL50, которые за время опыта вызывают гибель 50% особей (рис. 7.2). Первая иллюстрация показывает точки на осях, в

которых концентрации вещества [A] = 0 и [B] = CL50 = ВCL50, а наблюдаемая гибель составляет 50% особей, то же наблюдается для

вещества [A] = CL50 = ACL50 и [B] = 0.

Аддитивное действие – простое сложение влияний. Прямая,

соединяющая точки [A] = CL50 = ACL50, [B] = CL50 = ВCL50, есть множество опытов, в которых токсиканты ведут себя по отношению

друг к другу как одно и то же вещество, поскольку эффекты от их доз просто суммируются. Так, половинные по эффекту дозы ACL50/2 и BCL50/2 в сумме дают одну "полноценную" совместную CL50. Однако важно отметить, что пропорциональность эффектов разных веществ вовсе не означает пропорциональности их концентраций.

А

основа

аддитивизм

антагонизм

синергизм

 

CL100

 

 

 

 

 

 

 

CL70

 

 

 

 

CL50

 

CL30

В

 

 

 

 

 

CL100

CL50

CL70

CL30

 

150

Рис. 7.2. Виды взаимодействия веществ Антагонизм – подавление вредного действия одного вещества

другим. Любая точка на выгнутой кривой свидетельствует о том, что для достижения эффекта CL50 требуется взять дозы, которые в сумме должны бы превышать эффект CL50. Например, эффект CL50 в точке 1 достигается суммой 0.7∙ACL50 + 0.7∙BCL50. Чисто арифметически (аддитивно) эффект должен был составить 1.4∙CL50, т. е. 70% гибели тест-объектов.

Синергизм – усиление действия. Точки на вогнутой кривой соответствуют ситуации, когда для достижения эффекта CL50 можно взять дозы, суммы которых аддитивно меньше CL50. Так, эффект CL50 обнаруживается в точке для суммы 0.4∙ACL50 + 0.4∙BCL50. Аддитивный эффект должен был составить 0.8∙CL50, т. е. 40% гибели организмов, но синергизм обеспечивает гибель 50% особей.

Сочетанное действие факторов нельзя смешивать с корреляцией факторов. Взаимодействие осуществляется "внутри" объекта исследования и связано со спецификой реакции биосистемы, а корреляция реализуется "снаружи" и связана как с природой фактора, так и со способом организации наблюдений. Чтобы выявить эффект именно взаимодействия, изучаемые факторы должны быть, по возможности, независимы друг от друга.

Кроме этого, имеется ряд условий правильного применения данного метода. Так, дисперсионному комплексу необходима полнота, т. е. второй фактор (В) должен быть представлен в каждой градации первого фактора (А) одинаковым числом градаций.

Ниже рассмотрены алгоритмы, относящиеся лишь к равномерным комплексам, характеризующимся равной численностью групп (в градациях содержатся одинаковое число вариант). Что же касается неравномерных многофакторных комплексов, то их анализ принципиально возможен, но имеет свои особенности, существенно усложняющие технику вычислений.

Если исходные данные представлены по градациям неравномерно, вполне допустимо искусственное превращение их в равномерные комплексы. Для этого нужно составить выборки одинаковой величины, используя часть имеющихся данных. Следует помнить, что такой отбор должен быть не субъективным, но случайным. При организации случайного отбора вариант лучше всего

151

прибегнуть к жеребьевке. Например, убирать из выборки те варианты, номера которых совпадают со значениями случайных чисел (табл. 3П). Отбросив часть вариант, мы лишаемся и части информации о варьировании признаков; избежать неправильных выводов, вызванных методикой формирования выборок, помогает многократный пересчет по схеме дисперсионного анализа с использованием результатов нескольких жеребьевок. Ограниченные рамки настоящего краткого руководства не позволяют остановиться на этом вопросе более подробно, поэтому мы отсылаем заинтересованного читателя к специальным пособиям, где техника дисперсионного анализа неравномерных многофакторных комплексов изложена с исчерпывающей полнотой.

Условием эффективности многофакторного анализа является также выбор схемы организации факторов в градации. Выше был рассмотрен дисперсионный анализ массива данных с повторностями в каждой градации, для которого разложение суммы квадратов соответствует выражению Собщ. = СA + СB + СAB + Сслуч. (табл. 7.6).

Таблица 7.6 Двухфакторный дисперсионный комплекс: c градаций фактора А

(столбцы) и r градаций фактора В (ряды) с n повторениями в каждой градации (l = 1, 2,…, r; j = 1, 2,…, c; i = 1, 2,…, n)

 

А1

Аj

Аc

В1

x111

 

 

x1c1

 

x112

x1c2

 

 

 

Вl

xlji

 

 

 

 

 

Вr

xr11

 

xrc1

 

 

xrjn

 

xr1n

 

 

xrcn

Однако простейшей структурой дисперсионного анализа служит таблица, поля и графы которой характеризуют градации действия двух факторов, а в каждой ячейке содержится лишь одно значение

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]