Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1nikitin_a_ya_sosunova_i_a_analiz_i_prognoz_v_ekologicheskikh

.pdf
Скачиваний:
13
Добавлен:
19.11.2019
Размер:
821.47 Кб
Скачать

10

уровня. Таким образом, ВР могут быть представлены не только абсолютными, но и относительными величинами (например, процентами). В последней графе табл.1.2 приведен ряд относительных уровней численности клещей сведенный в целое этим способом.

Таблица 1.2

Пример обеспечения сходимости двух рядов путем принятия за 100 % оценки, полученной в базисный год использования обоих методов (1996 г.)

(до 1996 г. учет численности клещей на флаго/час, а после - на флаго/км)

Год

Исход-

% ряд до

Год

Исходный

% ряд по-

Год

Сведен-

 

ный ряд

1996 г.

 

ряд на-

сле 1996 г.

 

ный %

 

наблюде-

 

 

блюдений

 

 

ряд

 

ний

 

 

флаго/км

 

 

 

 

флаго/час

 

 

 

 

 

 

1994

9,2

68,1

1996

20,8

100,0

1994

68,1

 

 

 

 

 

 

 

 

1995

3,6

26,7

1997

32,5

156,3

1995

26,7

 

 

 

 

 

 

 

 

1996

13,5

100.0

1998

33,4

160,6

1996

100,0

 

 

 

 

 

 

 

 

-

-

-

-

-

-

1997

156,3

 

 

 

 

 

 

 

 

-

-

-

-

-

-

1998

160,6

 

 

 

 

 

 

 

 

Из табл.1.1 и 1.2, следует один важный вывод. Для обеспечения сходимости двух рядов обязательно необходимо иметь хотя бы одну общую для них точку (базу), полученную при использовании обоих методов учета (наблюдения). Если таковой нет, то следует провести специальное исследование и обеспечить материалом (базой) процедуру расчета сходимости.

11

2. Статистические параметры рядов динамики, используемые в биометрии

Ряды обычно не сравниваются друг с другом непосредственно. Для осуществления этой процедуры, вначале ряды сжато описывают с помощью параметров. Для характеристики ВР используют те же параметры, которые применяются в «обычной» статистике при описании выборок. Формулы и правила их расчетов можно найти в любом пособии по биометрии /4, 6, 16-19, 22/. Однако, появляются и некоторые новые понятия, например, величины периода колебаний, оценки наличия связи между последовательными наблюдениями, параметр стационарности ряда. Неправильная «параметризация» рядов может привести к принципиально неверным выводам.

Среди параметров, характеризующих ВР, можно выделить математические и описательные. К первым отнесем различные способы оценки средней, амплитуды, периода, асимметрии, эксцесса. Ко вторым – оценку типов распределения наблюдений, наличия взаимосвязи между ними, устойчивости проявления параметров во времени.

Некоторые из перечисленных характеристик ВР рассмотрены ниже.

2.1.Математические параметры

При описании ВР в экологических исследованиях обычно достаточно использовать определение центральной тенденции ряда, уровня ее колеблемости (амплитуды) и периода осцилляций. В зависимости от характера статистических данных применяют различные виды параметров, наилучшим образом отвечающие этой цели в конкретном случае.

2.1.1. Оценка центральной тенденции Значение, возле которого концентрируется большинство наблюдений в рассматри-

ваемых нами ВР, характеризует средняя арифметическая. Вместе с тем, в действительности ни одно из наблюдений может быть и не равно точно этому значению. Вычисляют простую среднюю арифметическую ряда по формуле:

 

 

 

 

Υ i

,

(1)

Υ =

n

 

 

 

 

 

 

 

 

 

где n

- число уровней ряда, Υi

- сумма всех наблюдений.

Однако для характеристики центральной тенденции ряда могут применяться и дру-

гие параметры. Например, средняя хронологическая:

 

 

y1 + yn

 

+ yt

 

 

 

 

 

n1

 

 

 

2

 

y2

(2),

Υ =

n

1

 

 

 

12

где

y1 и yn – соответственно начальный и конечный уровни ряда; n

- число на-

 

n1

 

блюдений,

yt - сумма всех наблюдений, кроме первого и последнего.

 

 

y2

 

Средняя геометрическая:

 

 

n

 

Υ = n

y1 y2 y3... yn = n yt

(3),

 

i=1

 

 

n

 

где

n - число уровней ряда, yt - произведение всех наблюдений.

 

 

i=1

 

Существуют и другие меры центральной тенденции, которые могут быть востребованы при решении определенных задач /9, 17-19/. Применение только средней арифметической во всех без исключения случаях может приводить к ошибкам /9/.

Следует отметить, что информативная мера средней величины повышается, если приводится ее доверительный интервал /6, 16/.

2.1.2. Оценка амплитуды колебаний Амплитуда характеризует размах изменчивости значений ряда вокруг средней. Вы-

ражать амплитуду принято через дисперсию (σ 2 ). Термин впервые введен Фишером в

1918 г. Для расчета этого параметра используют формулу:

 

 

(Υ −

 

)2

 

Υi 2

(Υi )2

 

 

 

 

 

 

Υ

 

 

2

 

=

n

 

 

i

 

 

 

(4),

σ y

=

 

n 1

 

 

 

 

n

1

 

 

 

 

 

где

Υi - отдельные наблюдения,

 

- средняя арифметическая ВР,

n – число на-

Υ

блюдений.

Последний вариант формулы более удобен при расчетах дисперсии с помощью калькуляторов, особенно, если они позволяют автоматически оценить сумму квадратов имеющихся наблюдений.

Нередко для характеристики средней используют также стандартное отклонение

представляющее квадратный корень из величины дисперсии:σ y = σ y2 .

Известно, что дисперсия ряда связана с величиной его средней арифметической /6, 20, 21/. То есть, чем больше различия в средних, тем сильнее различия в дисперсиях, хотя фактически амплитуды колебаний могут совпадать. Для устранения влияния центральной тенденции на величину амплитуды осцилляций при оценке изменчивости ис-

13

пользуют коэффициент вариации /6, 16-19/. Этот относительный параметр очень часто выражают в процентах:

CV =

σΥ

*100

(5),

 

 

 

 

Υ

 

 

где σΥ - стандартное отклонение,

 

- средняя арифметическая.

Υ

В качестве показателя ошибки CV иногда рекомендуют использовать формулу: scv = cv2n .

В ряде книг по «экологии» рекомендованы и другие показатели, характеризующие центральную тенденцию ряда или его колеблемость /20, 21/. Однако их использование обычно ограничено более частными случаями исследований или не является бесспорным

спозиции математической статистики.

2.1.3.Оценка длительности периода

Период ВР измеряется в единицах времени. Обычно его рассчитывают по времени прохождения процессом двух точек минимума в одном цикле.

Минимальный период, который мы можем обнаружить в ряде (любым методом) равен удвоенной величине интервала времени между последовательными наблюдениями

/1, 2, 7, 10/.

Рассмотрим простой, но грубый прием расчета времени периода цикла. Метод основан на нахождении и оценке количества «поворотных точек» или «фаз» в ряду, при отсутствии выраженного тренда /4, 6/. Если в ВР наблюдается тренд, то перед расчетом периода цикла его необходимо устранить (см. разд. 2.2.2.1).

Для реализации метода строится специальная таблица, где подсчитывается число локальных экстремумов в исследуемом ВР. С этой целью каждое наблюдение последовательно сопоставляют по величине с предшествующим. Если последующее значение больше предшествующего, его отмечают в графе таблицы знаком плюс, если меньше – минус (см. Пример 2). Группу значений с одинаковым знаком называют “фазой” /6/. Количество фаз, определенных в ВР, обозначают через h.

Все время наблюдения за исследуемым процессом равно произведению количества уровней ряда на интервал времени между ними (n * t ). Таким образом, усредненное время одного цикла (T) можно выразить через n и h:

T =

n * t

(6)

h 2

 

 

14

где n – количество наблюдений в ряду, t интервал времени между любыми двумя наблюдениями; h- количество фаз в ряду.

Другим специальным все более широко используемым методом количественной оценки усредненного времени как основного, так и дополнительных (скрытых) периодов ВР (квазициклов) является спектральный анализ. В нашем руководстве относительно использования этого метода мы ограничимся лишь несколькими замечаниями. Область применения спектрального анализа ограничена рамками стационарных рядов (см. разд.2.2.2). Следует отметить, что, несмотря на значительное число публикаций с его использованием, корректная оценка периода цикла вызывает трудности. Обусловлено это тем, что спектральная функция часто имеет ложные пики. Особенно они характерны для конца кривой. Таким образом, если, например, мы располагаем 30 наблюдениями, то нужно очень осторожно относиться к корректности оценки длительности циклов в 15 и более интервалов времени. Особенностью метода является то, что он допускает искусственное наращивание длины исходного ряда, что может быть важно при отсутствии длительных наблюдений. Для освоения спектрального анализа рекомендуем воспользовать-

ся программой Statistica /2/.

Итак, при сжатой характеристике ВР через математические параметры, предпочтительнее применять (если это корректно) самые простые, распространенные и необходимые из них: среднюю арифметическую, дисперсию, оценку времени периода цикла.

В случаях, когда в рядах присутствует выраженный тренд, целесообразно использовать для их описания среднюю хронологическую, а при различии сравниваемых рядов по уровню средней, применять в качестве параметра, оценивающего колеблемость, коэффициент вариации (Пример 2, см. также Пример 5) /13/.

Пример 2.

Оценку численности рачков в экспериментальной популяции дафний проводили через каждые три дня в течение 42 суток /13/. По данным, приведенным в табл.2.1, определим основные статистические параметры, характеризующие динамику численности этой популяции.

Для расчета простой средней численности используем формулу (1):

 

 

 

Υ t

= 953/14 = 68,1.

Υ =

n

 

 

 

 

 

 

 

15

Для иллюстрации оценки величины средней хронологической ряда используем формулу (2):

 

 

y1 + yn

 

n1

 

 

 

 

+yt

 

 

 

2

 

 

 

 

 

y2

 

Υ =

= (30,5+892)/13=71,0.

n

1

 

 

 

Как видим, полученное значение простой средней мало отличается от средней хронологической, что обусловлено отсутствием тренда.

Таблица 2.1 Оценка основных параметров ряда, представляющего наблюдения за численностью рачков в экспериментальной популяции Daphnia pulex

№ наблю-

Числен-

( Υi

Υ

)

( Υi

Υ

)2

Знак

№ фазы

дения

ность рач-

 

 

 

 

 

 

разности

 

 

 

 

ков( Υi )

 

 

 

 

 

 

( Υi+1 −Υi )

 

1

 

 

26

-42,1

 

1770,0

 

 

 

2

 

 

89

20,9

 

438,0

 

+

1

3

 

 

98

29,9

 

895,7

 

+

 

4

 

 

128

59,9

 

3591,4

 

+

 

5

 

 

50

-18,1

 

326,6

 

-

2

6

 

 

30

-38,1

 

1449,4

 

-

 

7

 

 

26

-42,1

 

1770,0

 

-

 

8

 

 

77

8,9

 

 

79,7

 

+

3

9

 

 

81

12,9

 

167,1

 

+

 

10

 

 

89

20,9

 

438,0

 

+

 

11

 

 

108

39,9

 

1594,3

 

+

 

12

 

 

67

-1,1

 

1,1

 

 

-

4

13

 

 

49

-19,1

 

363,7

 

-

 

14

 

 

35

-33,1

 

1093,7

 

-

 

Сумма

953

0,0

 

 

13978,9

 

 

Средняя

68,1

-

 

 

-

 

 

 

 

числен-

 

 

 

 

 

 

 

 

ность (

 

)

 

 

 

 

 

 

 

 

 

Υ

 

 

 

 

 

 

 

 

 

Дисперсия

1075,30

-

 

 

-

 

 

 

 

численно-

 

 

 

 

 

 

 

 

сти (σ 2 )

 

 

 

 

 

 

 

 

 

Для расчета средней арифметической ряда вместо калькулятора целесообразно использовать программу Excel (или любую другую табличную). При применении Excel для нахождения средней арифметической в ее главном меню необходимо активизировать опцию «функция». В появившемся диалоговом окне выбираем список команд «Стати-

16

стические». В нем, следуя алфавиту, находим команду «СРЗНАЧ», и, после ее вызова, действуя в соответствии с подсказками программы, производим оценку простой средней.

Для нахождения дисперсии и коэффициента вариации ВР соответственно используем формулы (4) и (5):

 

 

(Υi

 

)2

 

2

=

Υ

= 13978,9/13=1075,30,

σ y

n 1

 

 

 

CV = σΥΥ *100 = 32,79*100/68,1= 48,2 %.

Напомним, что эти параметры являются разными способами оценки амплитуды колебаний численности экспериментальной популяции дафний.

При нахождении дисперсии с помощью Excel можно воспользоваться командой «ДИСП», которая, как и «СРЗНАЧ», находится в алфавитном списке «Статистические» окна «функции».

Чтобы оценить время периода колебаний экспериментальной популяции, найдем по табл.2.1 количество фаз, наблюдавшихся в ней. Получилось, что за 42 дня, количество фаз составило 4. Таким образом, по формуле (6) можно провести оценку усредненного времени одного цикла:

T = hn* t2 = (14*3)/(4-2)= 42/2=21 день.

Если учитывать, что время одной генерации этого вида около 6 суток, то весь популяционный цикл охватывает 3 поколения. Примерно такая продолжительность периода колебаний характерна для большинства экспериментальных популяций дафний, содержащихся при сходных условиях культивирования /13/.

2.2. Описательные параметры

2.2.1. Анализ последовательности наблюдений на неслучайность Особенности течения биологических процессов порождают взаимообусловлен-

ность уровней хронологического ряда, наличие связи между последовательными наблюдениями. Наличие закономерностей в ВР служит основой для проведения анализа связи между рядами, сравнения их друг с другом, прогнозирования. Однако визуальный анализ графиков, отображающих хронологическую последовательность наблюдений, не всегда позволяет установить наличие закономерностей в их изменениях. Рассмотрим два критерия, позволяющих объективно решить задачу выявления закономерного характера в изменении уровней ВР /5, 8,18-20/.

17

17

Критерий Валлиса-Мура

Критерий применим при числе наблюдений (n) больше 12. Он является непараметрическим, следовательно, независим от характера распределения данных в ВР (см.

разд.2.2.3).

Анализируется временная последовательность наблюдений: Υ1 , Υ2 ,...Υt на пред-

метвыявления связи между уровнями ряда. Предположение о связанности наблюдений принято обозначать как H1. Альтернативная гипотеза (нуль-гипотеза – H0) предполагает случайную вариацию уровней.

Для выбора между H0 и H1 необходимо подсчитать число фаз (h) в ВР (см. разд. 2.1.3). Затем с учетом количества фаз (h) и длины ряда (n) вычислить Ζ^ статистику:

^

| (h 2)

(2n 7)

| 0,5

3

Ζ=

 

 

(7),

 

(16n 29)

 

 

 

 

 

 

90

 

Если значение Ζ^ < 1,96, то принимается H0, и анализируемый ряд считается случай-

ным. При Ζ^ > 1,96 H0 отвергается с 5 % вероятностью ошибки (P<0,05). В этом случае рассматриваемый ряд считается неслучайным. В медико-биологических исследованиях используются также уровни значимости равные P<0,01 (для отбрасывания H0 и, соот-

ветственно, принятия Н1 с этим уровнем надежности Ζ^ должно быть больше 2,58) и P<0,001 ( Ζ^ > 3,29).

Пример 3.

Рассмотрим данные, взятые из отчета Иркутского городского Центра госсанэпиднадзора о сезонной декадной динамике заболеваемости населения Иркутска клещевым энцефалитом в 2001 г. (табл.2.2) /15/. Требуется определить: является ли полученный ВР случайным (H0) или уровни ряда зависимы друг от друга (H1).

Для решения вопроса определим число фаз в ряду (табл.2.2). Оно равно 4. Обратим внимание, что в случае, если два следующих друг за другом числа равны (количество больных во вторую и третью декады мая), то есть их разность составляет 0, считаем, что наблюдавшаяся фаза не прерывается.

Используя формулу (7), получим оценку Ζ^ :

 

18

Ζ^

= {|2 – (2*13-7)/3| – 0,5 }/ (16 *13 29) / 90 = 3,83 / 1,41 = 2,72

2,72 > 2,58, таким образом, с уровнем значимости P<0,01 нуль-гипотеза (H0) отклоняется. То есть, последовательные ежедекадные оценки уровня заболеваемости населения Иркутска клещевым энцефалитом в течение 2001 г. являются определенным образом связанными между собой. Анализируемый ряд неслучаен.

 

 

 

 

 

Таблица 2.2

 

Анализ на неслучайность ВР, характеризующего сезонную

динамику заболеваемости населения Иркутска клещевым энцефалитом в 2001 г.

№ наблюде-

Месяц

Декада

Количество

Знак разно-

№ фазы

 

ния

 

 

больных

сти: Хi+1 - Хi

 

 

1

Май

1

0

 

 

 

2

2

6

+

1

 

3

 

3

6

0

 

 

4

Июнь

1

7

+

 

 

5

2

15

+

 

 

6

 

3

20

+

 

 

7

Июль

1

21

+

 

 

8

2

13

-

2

 

9

 

3

5

-

 

 

10

Август

1

4

-

 

 

11

2

1

-

 

 

12

 

3

2

+

3

 

13

Сентябрь

1

1

-

4

 

Воспользовавшись тем, что для ряда из табл. 2.1, описывающего изменение численности дафний, число фаз уже определено (Пример 2), проанализируем и его по критерию Валлиса-Мура на неслучайность. С этой целью по данным табл.2.1 определим

Ζ^ : Ζ^ = 4,5/1,47 = 3,06.

3,06 > 2,58. То есть, и в этом случае мы принимаем Н1 (P<0,01) и делаем вывод о закономерном характере изменений численности в популяции ветвистоусых ракообразных.

Автокорреляционный критерий Для оценки связи между последовательными значениями одного и того же ряда

может быть использован коэффициент автокорреляции (ra). Очевидно, что в предположении о случайном характере колебаний наблюдений в исследуемом ряду (H0) связи между их уровнями быть не должно. Альтернативная гипотеза (Н1) допускает зависимость величины последовательных значений друг от друга, или, иными словами неслучайность ВР.