Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ivanter2000_vved_v_kolich_biol

.pdf
Скачиваний:
16
Добавлен:
14.04.2015
Размер:
3.42 Mб
Скачать

112

L c

1 0 0

9 0

8 0

7 0

6 0

5 0

4 0

Таблица 6.3

 

A

B

 

 

 

C

 

 

1

 

Lt

 

 

 

Lc

 

 

2

m1

45

 

 

 

 

 

77

 

 

3

m2

46

 

 

 

 

 

84

 

 

4

m3

47

 

 

 

 

 

81

 

 

5

m4

45

 

 

 

 

 

76

 

 

6

m5

47

 

 

 

 

 

80

 

 

7

m6

50

 

 

 

 

 

78

 

 

8

m7

53

 

 

 

 

 

90

 

 

9

m8

51

 

 

 

 

 

87

 

 

10

 

Lt

 

 

 

Lc

 

 

11

f9

50

 

 

 

 

 

62

 

 

12

f10

55

 

 

 

 

 

65

 

 

13

f11

49

 

 

 

 

 

65

 

 

14

f12

51

 

 

 

 

 

66

 

 

15

f13

52

 

 

 

 

 

64

 

 

16

f14

50.5

 

 

 

 

 

64

 

 

17

f15

53

 

 

 

 

 

68

 

 

18

f16

51

 

 

 

 

 

62

 

 

19

f17

57

 

 

 

 

 

70

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L c

f

 

 

 

 

 

 

 

 

 

L c m

 

 

 

 

 

 

 

 

 

L c = 0 . 7 1 7 L t + 2 7 . 7 8 6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L c = 1 . 2 7 4 2 L t + 2 0 . 4 6 4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L t

4 5

5 0

5 5

6 0

6 5

Рис. 6.1. Регрессия длины хвоста по длине тела у гадюк

113

Для целей иллюстрации рассчитаем и более точную оценку. Для этого предварительно нужно найти суммы квадратов отклонений значений независимой переменной x (в нашем случае ее роль играет длина тел Lt) от своих средних. Найдем величины с помощью функции

Excel =КВАДРОТКЛ(диапазон). Для таблицы 6.3 имеем: Cx1 =КВАДРОТКЛ(C2:C9) = 62,

Cx2 =КВАДРОТКЛ(C11:C19) = 52.222.

Поскольку общая остаточная дисперсию S

2

равна

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

остат .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S остат

 

 

( n

1 2 ) S

остат2

. 1

 

( n 2 2 ) S остат2

. 2

 

 

 

 

 

 

.

 

 

 

 

 

n 1

 

n 2 4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( 8

2 ) 12 . 202

( 9 2 ) 4 . 006

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.7908,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

9 4

 

 

 

 

 

 

 

обобщенная ошибка коэффициентов регрессии составит:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

1

1

 

1

 

= 0.52419

m a 1 , 2

 

S остат

.

 

 

 

 

 

 

2 . 7908

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C x 1

 

C x 2

62

 

52 . 222

 

 

т. е. практически не отличается от рассчитанной первым способом.

Теперь

можно

оценить

значимость отличий коэффициентов (для

df = n1+n2–4 = 8+9–4 = 13):

 

 

 

 

a 1 a

2

1.27419

0.71702

= 10.76.

T

 

 

 

 

 

 

 

 

 

 

 

 

m a 1 , 2

 

0 . 52419

 

Полученное значение критерия Стьюдента больше табличного

даже для уровня значимости α = 0.001(T(0.001,13) = 4.22), т. е. коэффициенты регрессии не равны.

Итак, результаты сравнения показывают, что линии регрессии имеют разный угол наклона; с увеличением размеров тела длина хвоста у самцов (a = 1.2) прирастает быстрее, чем у самок (a = 0.7).

Сравнение двух выборок по характеру распределения

Рассмотренные выше методы сравнения двух выборок проверяют предположение либо о действии систематического, контролируемого, фактора (по критерию Стьюдента оценивается различие средних), либо о действии разного набора случайных факторов (критерий Фишера пытается обнаружить отличие дисперсий), либо обеих причин вместе (с помощью непараметрических

114

статистик).

115

Специфические методы χ² Пирсона и λ Колмогорова – Смирнова позволяют проверять гипотезы о соответствии друг другу двух частотных распределений и тем самым улавливать не только отличия в общих тенденциях, но и частные особенности отдельных классов вариант.

Критерий χ² Пирсона

Критерий позволяет выяснить, насколько полученный экспериментатором фактический материал подтверждает теоретическое предположение, в какой мере анализируемые данные совпадают с теоретически ожидаемыми. Возникает задача статистической оценки разницы между фактическим и теоретическим распределениями. С формальных позиций сравниваются два вариационных ряда, две выборки: одна – эмпирическое распределение, другая представляет собой выборку с теми же параметрами (n, M, S и др.), что и эмпирическая, но ее частотное распределение построено в точном соответствии с выбранным теоретическим законом (нормальным, Пуассона, биномиальным и др.), которому предположительно подчиняется поведение изучаемой случайной величины.

Нулевая гипотеза предполагает отсутствие различий между сравниваемыми распределениями. Для ее проверки и служит "критерий согласия" χ² Пирсона:

2

 

( a A ) 2

,

A

 

 

 

где a — фактическая частота наблюдений,

A — теоретически ожидаемая частота для данного класса. Расчетное значение критерия сравнивают с критическим значением для принятых уровня значимости (α) и числа степеней свободы (df) (табл. 9П). Если вычисленная величина χ2 равна или превышает табличную χ²(α, df), решают, что эмпирическое распределение от теоретического отличается достоверно. Тем самым гипотеза об отсутствии этих различий будет опровергнута. Если же χ² < χ²(α, df), нулевая гипотеза остается в силе. Обычно принято считать допустимым уровень значимости α = 0.05, так как в этом случае остается только 5% шансов, что нулевая гипотеза правильна и,

116

следовательно, есть достаточно оснований (95%), чтобы от нее отказаться.

Как и раньше, для определения числа степеней свободы из общего объема выборки нужно вычесть число ограничений (т. е. число параметров, использованных для расчета теоретических частот). Однако необходимо помнить, что в случае с критерием хи-квадрат для определения числа степеней свободы используют не объем выборки n, а число классов частотного распределения k.

Для альтернативного распределения (k = 2) в расчетах участвует только один параметр, объем выборки, следовательно, число для него df = k–1 = 2–1 = 1. Для проверки равномерности распределения результатов дигибридного скрещивания (известно четыре класса) df = k–1 = 4–1 = 3. Для проверки соответствия вариационного ряда распределению Пуассона используются уже два параметра – объем выборки и среднее значение (численно совпадающее с дисперсией); число степеней свободы df = k–2. При проверке соответствия эмпирического распределения вариант нормальному или биномиальному закону число степеней свободы берется как число фактических классов минус три условия построения рядов – объем выборки, средняя и дисперсия, df = k–3. Сразу стоит отметить, что критерий χ² работает только для выборок объемом не менее 25 вариант, а частоты отдельных классов должны быть не ниже

4.

Общий порядок работы таков. Сначала строится вариационный ряд, т. е. частотное (a) распределение для фактических данных. Затем формулируются теоретические соображения о том, какой тип распределения реализуется в изучаемой совокупности. В соответствии с этим выдвигается нулевая гипотеза: "эмпирические частоты соответствуют данному типу распределения" или, что то же самое, "в генеральной совокупности реализован такой-то тип распределения". На следующем этапе формируется "теоретическая выборка". Для этого, во-первых, требуется явно вычислить теоретические частости (p), соответствующие значениям вариационного ряда. Пожалуй, это самый ответственный момент всех расчетов, поскольку ранее высказанная идея воплощается в числа – теоретические частости данного значения. После этого рассчитываются частоты распределения выбранного теоретического типа (A) для конкретных параметров исходной

117

выборки. Завершается процедура расчетом величины критерия хиквадрат (χ²), ее сопоставлением с табличным значением (χ²(α, df)). В итоге формулируется статистический вывод о соответствии или не соответствии эмпирических рядов теоретическому распределению. Это дает возможность прийти к тому или иному биологическому заключению.

В качестве первого примера решим задачу, соответствует ли закону Пуассона распределение числа повторных отловов альбатросов (табл. 6.4). В этом случае рассматривается процесс, этапами которого выступают события "отлов птицы". В чреде таких событий встречаются редкие – "отлов меченной особи". Биологическая подоплека состоит в следующем: случайны ли повторные отловы птиц, или есть факторы, ответственные за нарушение случайности? Например, птицы могут приманиваться и стремиться попасть вновь либо могут стараться избежать повторного отлова. В обоих случаях птицы буду "умышленно" попадаться чаще или реже, нарушая случайность повторного отлова и искажая тем самым форму распределения, которое будет отходить от формы, предписанной законом Пуассона. Согласно нулевой гипотезе, птицы ведут себя случайно, их встречаемость соответствует этому закону.

Алгоритм расчетов теоретических частот для распределения Пуассона достаточно прост и основан на формулах, не требующих предварительного расчета теоретических частостей p:

 

 

 

n

 

(частота нулевого класса),

A 0

 

 

 

 

e M

 

 

 

 

 

 

A x

 

M

A x 1 (частота прочих классов),

x

 

 

 

 

 

где М – средняя арифметическая ряда,

x – значение ряда (число объектов в пробе), Ax теоретическая частота значения x,

n – объем выборки (число проб),

e = 2.7183… – основание натурального логарифма.

Параметры данного вариационного ряда были рассчитаны в разделе Основные типы распределений: M = 0.968. Теоретическая частота нулевого значения равна:

118

 

n

32

= 11.93803 ≈ 12,

A 0

 

 

 

 

 

 

e M

e 0 . 968

 

Таблица 6.4

Число

Фактическая

 

Теоретическая

 

( a A )

2

 

повторных

частота,

 

частота,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

отловов,

a

 

A

 

 

A

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

15

 

12

 

 

0.75

 

 

1

7

 

11

 

 

1.45

 

 

2

7

 

6

 

 

 

 

 

3

2

10

2

9

 

0.17

 

 

4

1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

Сумма

n = Σa = 32

 

n = ΣA = 32

 

 

χ² = 2.31

 

 

 

 

 

 

 

 

 

 

частота значения x = 1:

A x

 

M

A x 1

 

0 . 968

11 . 93 = 11.55602 ≈ 11

 

 

 

 

x

 

1

 

и т. д. (табл. 6.4, графа 3).

По окончании вычислений получаем два ряда частот, отличия между которыми оцениваются по критерию хи-квадрат.

Перед расчетом значения критерия следует убедиться, что выполнены требования к данным для расчета критерия χ²:

объем выборки более 25 вариант, n>25,

суммы эмпирических и теоретических частот равны объему выборки n = Σa = ΣA (с точностью не ниже 1–2%),

все классы эмпирического и теоретического рядов имеют частоты

более 4, aj>4; если какие-либо классы имеют меньше 4 вариант (у нас значения 3 и 4 имею частоты 2 и 1), то они должны быть объединены (суммированы) с соседними, что и показано в таблице с помощью

119

фигурных скобок. Далее вычисляем значения критерия: для первой строки

( a A ) 2 (15 12 ) 2 0 . 75

A12

ит. д. (графа 4), итого χ² = 2.31. Число степеней свободы находим как

число окончательных классов (3) минус число ограничений (средняя и объем выборки): df = k–2 = 3–2 = 1.

Табличное значение χ²(0.05,1) = 3.84. Полученная величина (2.31) меньше табличной (3.84), следовательно, нулевая гипотеза не

отвергается: эмпирическое распределение достоверно не отличается от распределения Пуассона. Иными словами, у нас нет оснований утверждать, что вероятность повторного отлова изменяется: нельзя утверждать, что операция отлова птиц привлекает или пугает.

Кстати, соответствие эмпирического ряда распределению Пуассона можно проверить и другим способом: сравнив по критерию Фишера величины средней арифметической и дисперсии для числа степеней свободы df1 = n–1, df2 = n–1. В нашем случае M = 0.968,

S² = 1.257; F = 1.257/0.968 = 1.157. Поскольку эта величина меньше

табличной (F(0.05,31,31) = 1.84), сравниваемые показатели достоверно не отличаются, а равенство средней и дисперсии характерно лишь для

распределения Пуассона.

В качестве второго примера рассмотрим анализ пространственного размещения особей. Как известно, есть три важнейших типа размещения: регулярное (соответствующее жестким конкурентным отношениям), агрегированное (скученность особей вблизи от источников необходимых ресурсов) и случайное (когда нет острой конкуренции или дефицита ресурсов). Зная тип размещения особей, можно многое сказать об их биологии. Судить о характере пространственного размещения можно по распределению встреч особей по небольшим одинаковым пробным площадкам, на которые разбивается исследуемая территория (рис. 6.2). Равномерное территориальное размещение особей дает унимодальное распределение встреч (одна вершина повышенных частот) (рис. 6.2, В). Если наблюдается агрегация, имеет место бимодальное распределение (много площадок без особей, много площадок с несколькими особями и мало площадок с единичными экземплярами) (рис. 6.2, Б). Когда же размещение животных или растений по территории местообитания

120

случайно, при обобщении получается частотное распределение Пуассона (рис.6.2, А). Поэтому, проверяя соответствует ли этому закону эмпирическое распределение особей по площадкам, мы тем самым проверяем гипотезу о случайном размещении организмов в пространстве. Возьмемся проверить, действительно ли на иллюстрации "случайное размещение" из монографии А. М. Гилярова (1990, с. 41, рис. 8) точки размещены случайно? Разбиваем территорию на пробные площади, нарисовав сетку. Подсчитываем число площадок (a), на которых встретилось разное число точек (x), формируем вариационный ряд (табл. 6.5).

3 0

А

 

Б

В

 

2 0

10

0

0

1

2

3

4

0

1

2

3

4

0

1

2

3

4

Рис. 6.2. Территориальное размещение особей и соответствующие распределения

Таблица 6.5

Число точек

Фактическая

 

Теоретическая

 

 

 

 

на одной

 

 

 

 

 

 

 

 

 

( a A )

2

 

 

 

 

 

 

 

площадке,

частота,

 

частота,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

 

A

 

 

A

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

28

 

29.7

 

 

2.98

 

 

1

19

 

15.5

 

 

 

 

 

2

2

22

4.0

20.3

 

3.01

 

 

3

1

 

0.7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

121

4

0

0.1

 

 

 

 

 

Сумма

n = Σa = 50

n = ΣA = 50

χ² = 5.99

 

 

 

 

Определяем объем выборки (n = 50), среднюю арифметическую (M = 0.52). Предполагая распределение Пуассона, рассчитываем по алгоритму теоретические частоты (A), объединяем классы, где частоты

меньше 4, вычисляем χ², отыскиваем табличное значение χ²(0.05,1) = 3.84. Поскольку полученное значение критерия (5.99) больше табличного

(3.84), эмпирическое распределение отличается от распределения Пуассона. На иллюстрации отображено не случайное размещение особей в пространстве, поскольку пустых площадок слишком мало, а единичных слишком много; размещение точек тяготеет к агрегированному. Такому типу лучше соответствует биномиальное распределение с неравными вероятностями исходов.

Теория статистического оценивания строится на идее нормального распределения. Многие из параметров и критериев предлагаются ею в предположении, что изучаемые признаки имеют нормальное распределение. По большому счету, используя статистические методы для описания непрерывных признаков, нужно быть уверенным, что они действительно подчиняются нормальному закону, а в случае дискретных признаков – биномиальному. Для такой проверки нулевая гипотеза звучит так: "полученное распределение соответствует нормальному (биномиальному)" или "выборка взята из генеральной совокупности, подчиняющейся закону нормального (биномиального) распределения".

Все вычислительные операции для случаев нормального и биномиального распределений совпадают. Рассмотрим проверку на не- нормальность распределения массы тела бурозубок.

Расчеты начинаются с построения вариационного ряда и поиска центральных значений для каждого класса (табл. 6.6 и 6.7). Далее по

формуле t

 

x j

M

 

вычисляются нормированные отклонения

 

 

 

 

 

 

 

 

 

 

 

S

середины каждого классового интервала (xj) от общей средней M (S – стандартное отклонение). В нашем случае M = 9.29 г, S = 0.897 г. Для второго интервала имеет: t = |8.05–9.27|/0.897 = 1.38. Далее определяем теоретические частости нормального распределения, или ординаты

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]