Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ivanter2000_vved_v_kolich_biol

.pdf
Скачиваний:
16
Добавлен:
14.04.2015
Размер:
3.42 Mб
Скачать

72

доверительный интервал, например, для стандартного отклонения:

S±Tms = 1.33±1.96∙0.118 = 1.33±0.231 экз./ самку.

Значение генерального стандартного отклонения находится в диапазоне от 1.09 до 1.56 экз./ самку.

Распределение Пуассона

Это вариант описания стохастического поведения дискретных признаков для случаев, когда базовая вероятность элементарных альтернативных событий неодинакова, одно из них наблюдается заметно чаще другого (p<<q) (классический пример – попадание гитлеровских авиационных бомб в разные кварталы Лондона). Закон Пуассона описывает редкие события, происходящих 1, 2, 3 и т. д. раз на сотни и тысячи обычных событий. Поведение биологических объектов, соответствующее закону Пуассона, наблюдается в том случае, когда по пробам случайно распределены редкие объекты. Примеры таких явлений – частота нарушений хромосомного аппарата на каждую тысячу митозов, встречаемость семян сорняка в большой серии навесок семян культурного растения, число повторных попаданий животных в ловушки, встречаемость животных на отрезках длинных маршрутов (или на пробных площадках обширной территории), отловы животных в отдельные промежутки времени при длительных наблюдениях.

Как и в случае с биномиальным распределением, случайная величина, распределенная по закону Пуассона, определяется подсчетом числа элементарных событий в пробе (в группе, в навеске, на участке, на этапе). Распределение Пуассона резко асимметрично, причем дисперсия равна средней арифметической, что может служить критерием для оценки характера распределения изучаемого признака

(рис. 3.5).

В течение одного года (1946) пометили кольцами и выпустили на волю 32 буревестника.

Число

Число

Число случаев

повторных

отловленных

повторного

отловов,

животных,

отлова,

x

a

x∙a

0

15

0

 

 

 

 

73

 

1

 

 

7

 

 

 

7

 

 

 

2

 

7

 

14

 

 

3

 

2

 

6

 

 

4

 

1

 

4

 

 

n

 

32

 

31

 

В последующие пять лет часть из них отлавливали повторно:

7 экз. по одному разу, 7

– по два, 2

– по три, 1 экз. – четыре раза,

15 экз. окольцованных птиц повторно не попадались. Число классов составляет k = 4, интервал dx = 1. Асимметрия в частотах встречаемости птиц позволяет предполагать распределение Пуассона.

Расчеты показали, что средняя арифметическая (M) примерно равна дисперсии (S²):

 

 

 

x

31

 

mp = 4∙0.242 = 0.968 экз.,

M

 

 

 

 

 

 

 

 

 

 

n

 

32

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x 2

 

( x ) 2

 

 

 

 

69

( 32 ) 2

 

 

 

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

n

 

 

 

 

32

 

 

1.121 экз., S² = 1.257,

 

 

 

( n 1 )

 

 

 

( 32 1 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S² ≈ M.

По крайней мере, проверка по критерию Фишера не выявила достоверных отличий между ними (подробнее см. с.91, 112):

F = 1.257/0.968 = 1.157<F(0.05,31,31) = 1.8.

Эта близость свидетельствует о соответствии наблюдаемого распределения закону Пуассона.

(α, df2),

74

0 . 4

0 . 3

0 . 2

0 . 1

0

0

1

2

3

4

Рис. 3.5. Распределение Пуассона с параметрами n = 32,

M ≈ S² = 0.968. По оси абсцисс – число повторных отловов, по оси ординат – частости (относительные частоты)

Доверительный интервал для параметров распределения Пуассона определить несколько сложнее, чем для других типов. В связи с асимметричностью распределения Пуассона для расчета левой и правой доверительных границ средней арифметической и дисперсии (как известно, эти значения равны) используют специальные формулы с участием статистики хи-квадрат Пирсона (Браунли, 1977):

левая граница xлев. = 0.5 ∙ χ2(P, df1),

правая граница xправ. = 0.5 ∙ χ2

где P – доверительная вероятность(обычно P = 0.95), α – уровень значимости (обычно α = 0.05),

df – число степеней свободы: df1 = 2∙M, df2 = 2∙(M+1), М – средняя арифметическая выборки, χ2 – значение хи-квадрат по таблице 9П.

Доверительные границы для среднего числа повторных отловов составят: левая граница xлев. = 0.5 ∙χ2(0.95,2) = 0.5 ∙ 0.1 = 0.05,

правая граница xправ. = 0.5 ∙ χ2 (0.05,4) = 0.5 ∙ 9.49 = 5.

Иными словами, число повторных отловов птиц может варьировать от 0 до 5 раз.

75

Альтернативное распределение

Распределение дискретной случайной величины, имеющей лишь два противоположных (разнокачественных) значения (k = 2). В одной пробе (в одном наблюдении) содержится одна варианта, одно из двух возможных значений. Вероятности каждого из них могут быть равны (p = q) либо не равны (p < q; p > q). В выборке варианты разделены по некоторому признаку на два класса в соответствии с наличием у них одного из двух значений. Примеры: самцы и самки в одной выборке, больные и здоровые организмы, сработавшие и пустые ловушки на одной учетной линии, два варианта аллельных признаков, вакцинированные и невакцинированные пациенты среди заболевших и др. (рис. 3.6). Вычисления констант достаточно просты и не требуют построения вариационного ряда.

0 . 8

 

0 . 6

 

0 . 4

 

0 . 2

 

0

 

с а м ц ы

с а м к и

Рис. 3.6. Альтернативное распределение, представленное двумя классами вариант. По оси ординат – частости (доли) этих групп

Важнейшей характеристикой является доля (p) вариант определенного вида (А), представленных общим числом nA в пределах выборки объемом n:

p n A , n

В том случае, если исходы отдельных испытаний характеризуются числами 0 или 1, тогда доля вариант со значением 1 численно совпадает со средней арифметической, рассчитанной для всех значений:

76

M x . n

Ключевым моментом здесь является соображение, имеем ли мы право придавать испытаниям вид чисел 0 и 1 или это просто удобная форма отображения качественных признаков? Обращаясь к теории формирования сложных распределений дискретной величины, мы можем и для альтернативного распределения воспользоваться идеей отбора вариант группами, принципом отбора проб. Только для альтернативного распределения объем одной пробы равен единице, m = 1. Так, если для группы особей, состоящей из самцов и самок, подсчитывать число самок в пробе из одной варианты, получаем набор единиц (самка есть) и нулей (самки нет, это самец), т. е. выборку частот встречаемости самок в пробах. В таком случае есть все основания применять формулу средней арифметической и рассматривать долю вариант с качеством 1 для всего ряда значений именно как среднее число встреч самок в пробе.

Один из результатов отловов полевок из природных популяций показал, что в исследуемой группе (200 особей) было 120 самок и 80 самцов. В данном случае мы имеем дело с альтернативным признаком (самка – самец). Из 200 проб 120 проб содержат самок (значение 1), 80

– не содержат (значение 0); так получаем выборку n = 200: 0000000000000000000000000000000000000000000000000000000000001 1111111111111111111111111111111111111111111111111111111111111 11111111111111111111111111111111111111111111111111111111.

Доля вариант со значением 1 составляет:

p

n

A

 

120

0.6

,

n

200

 

 

 

 

что совпадает со средней арифметической для всего ряда:

M x 120 0.6 . n 200

Для альтернативного распределения могут применяться те же формулы расчета выборочных параметров, что и для биномиального распределения.

Средняя (доля самок):

M = m∙p = 1∙0.6 = p = 0.6.

Стандартное отклонение (при m = 1):

77

S

m p q

p q

0 . 6 0 . 4

0.24.

Ошибка средней (ошибка доли самок):

 

S

0 . 24

 

0.017 .

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

200

 

 

Доверительный интервал для альтернативных признаков (их долей, процентов и частот) строится с помощью φ-преобразования Фишера, что дает более точные границы, особенно если доли сильно отличаются. Сначала вместо значения доли (процента) одного признака объектов берут значение φ (фи), найденное по формуле,

 

2 arcsin

p или по таблице 10П. Затем вычисляют ошибку:

 

 

 

 

m

1 / n , обе доверительные границы φ лев. = φ–Tmφ, φ прав. = φ+Tmφ,

после чего с помощью таблицы 10П переводят найденные значения обратно в проценты.

Найдем доверительные границы для доли самок полевок p = 0.6 при уровне значимости α = 0.05. Используя таблицу 10П и проводя

расчеты, получаем: φ(60%) = 1.772, m 1 / 200 = 0.0707,

φ лев. = 1.772–1.96∙0.0707 = 1.6334, φ прав. = 1.772+1.96∙0.0707 = 1.9106, p лев.(1.6334) = 53.1%, p прав.(1.9106) = 66.4%.

Доля самок в генеральной совокупности (популяции полевок) составляет минимум 53.1%, максимум 66.4%.

Полиномиальное распределение

Наблюдается для качественных признаков, имеющих не два альтернативных свойства, но несколько возможных проявлений качества (k>2). Примеры полиморфизма популяций – как раз из этой области. В их числе варианты окраски покровов и волос, типы рисунков в определенных областях тела, способы жилкования листьев растений или крыльев насекомых, варианты расположения и формы щитков рептилий и другие проявления множественности фенотипов особей. Формализуя описание, укажем, что в одной пробе содержится одна варианта (m = 1), но типов вариант (морф, фенотипов) больше, чем два (k>2).

Примером полиномиального (иначе – мультиномиального) распределения может служить встречаемость 4 фенов головы

78

живородящей ящерицы – 4 вариантов контакта лобно-носового, предлобных и лобного щитков (рис. 3.7).

Лучше всего выборка может быть представлена вариационным рядом – частотами (pj) встречаемости в популяции особей с данным (j- м) проявлением качественного признака и общим числом морф (k). Для более емкого представления ряда используется величина "среднее число фенотипов", учитывающая характер распределения частот между разными морфами: μ = Σ(pj)²,

статистическая ошибка показателя равна: m

 

 

 

( k

)

.

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

Среднее число фенотипов (μ) равно числу фенотипов (k) только тогда, когда частоты всех фенотипов одинаковы (p1 = p2 = … = pj = pk), и меньше во всех других случаях.

А

Б

В

Г

0 . 8

0 . 6

0 . 4

0 . 2

0

А

Б

В

Г

Рис. 3.7. Полиномиальное распределение (4 фена головы живородящей ящерицы). По оси ординат – частости фенов среди 64 сеголетков, отловленных под Петрозаводском

Для полиномиального распределения предлагается еще одна характеристика – "доля редких морф": h = 1– μ∙k,

статистическая ошибка показателя равна: m

 

 

h (1 h )

.

h

 

 

 

n

 

 

 

79

Доля редких фенотипов равна нулю при равенстве частот всех морф и отличается от нуля при других вариантах распределения.

Равномерное распределение

Частный случай распределения альтернативного и полиномиального. Равномерное распределение характеризуется одинаковой частотой встречаемости всех значений дискретного признака (p = q для двух классов или p1 = p2 = … = pj = pk для нескольких классов). Такой тип распределения можно использовать для формулирования гипотез при анализе частот генов и фенов в популяциях, при подсчете тест-организмов, выживших в токсикометрическом эксперименте, и т. п. В частности, можно предположить, что ветви дерева могут равномерно располагаться по сторонам света (рис. 3.8).

p

 

 

 

 

 

 

 

0 . 2 5

 

 

 

 

 

 

 

0 . 2

 

 

 

 

 

 

 

0 . 1 5

 

 

 

 

 

 

 

0 . 1

 

 

 

 

 

 

 

0 . 0 5

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

0 - 4 5

5 - 9 0

-1 3 5

-1 8 0

-2 2 5

-2 7 0

-3 1 5

-3 6 0

 

4

0

5

0

5

0

5

 

 

9

3

8

2

7

1

 

 

 

1

1

2

2

3

Рис. 3.8. Предположительно равномерное распределение

числа ветвей ели по секторам азимута (º)

Помимо рассмотренных четырех типов распределения для описания эмпирических совокупностей предложено множество других моделей, основанных на других принципах и дающих нередко более точные оценки параметров.

Для описания природных явлений более реалистичные

80

основания, чем биномиальное, имеет распределение гипергеометрическое, оно не предполагает возврата объектов каждой пробы обратно в изучаемую совокупность. Распределение негативное биномиальное подходит для случая, когда вероятности элементарных событий (p и q) не постоянны, в отличие от биномиального распределения. Распределения Максвелла и Рэлея имеют умеренную правостороннюю асимметрию и описывают поведение непрерывных положительных случайных величин. Распределения Парето и показательное пригодны для описания резко правосторонне асимметричных вариационных рядов с перепадом частот. Распределение логнормальное, или логарифмически нормальное, характеризуется тем, что логарифмы исходных значений выборки образуют правильное нормальное распределение; эта модель подходит для описания признаков, имеющих распределения с умеренной правосторонней асимметрией, это в первую очередь концентрации веществ в различных средах, т. е. гидрохимические, физиологические и биохимические показатели.

81

4

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Проверка статистических гипотез – это путь установления биологических закономерностей. Закономерное означает не только повторяемое, но – в связи с известной причиной. "Установить закономерность" значит "установить причинную связь явлений", когда степень выраженности изучаемого свойства объекта определяется внешними или внутренними факторами. Однородность действия факторов определяет и сходство отклика, изменение факторов влечет за собой изменение характеристик наблюдаемого объекта. Параллельное изменение свойств объекта и его среды (признака и фактора) эмпирической наукой принимается как свидетельство зависимости признака от фактора, как закономерная связь явлений.

Для регистрации такого рода зависимости необходимы наблюдения хотя бы двух состояний объекта – при разных уровнях действия фактора. Со статистической точки зрения это должны быть две группы значений (две выборки), характеризующие устойчивость реакции признака на разные уровни действия фактора (разные дозы). Так формируется первая задача поиска закономерностей – сравнение между собой групп вариант, полученных при разной силе воздействия внешних (или внутренних) условий. Если наличие фактора существенно для проявления признака, параметры выборок будут различаться, если фактор безразличен (не действует на объект), отличий между группами не будет.

В терминах математической статистики эта задача формулируется как вопрос о принадлежности выборок к общей генеральной совокупности. Если выборки взяты из одной генеральной совокупности, то между ними не должно быть существенных отличий

– только небольшие и случайные (ошибки репрезентативности). Если же выборки взяты из разных генеральных совокупностей, то отличия между выборками должны быть закономерными –достоверными, значимыми. Решая эту задачу, изначально предполагают, что "выборки взяты из одной и той же генеральной совокупности, отличия между средними незначимы". Отличия между выборочными параметрами рассматриваются как отличия по случайным причинам, как ошибки

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]