Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1nikitin_a_ya_sosunova_i_a_analiz_i_prognoz_v_ekologicheskikh

.pdf
Скачиваний:
13
Добавлен:
19.11.2019
Размер:
821.47 Кб
Скачать

А.Я.Никитин, И.А.Сосунова

АНАЛИЗ И ПРОГНОЗ ВРЕМЕННЫХ РЯДОВ В ЭКОЛОГИЧЕСКИХ НАБЛЮДЕНИЯХ И ЭКСПЕРИМЕНТАХ

Учебно-методическое пособие

Иркутск, 2003

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ УНИВЕРСИТЕТ

А.Я. Никитин, И.А. Сосунова

АНАЛИЗ И ПРОГНОЗ ВРЕМЕННЫХ РЯДОВ В ЭКОЛОГИЧЕСКИХ НАБЛЮДЕНИЯХ И ЭКСПЕРИМЕНТАХ

Учебно-методическое пособие

Иркутск, 2003

Печатается по решению редакционно-издательского совета ИГПУ

А.Я.Никитин, И.А.Сосунова. Анализ и прогноз временных рядов в экологических наблюдениях и экспериментах: учеб.-методич.пособие. – Иркутск: Изд-во Иркутск. гос.

пед. ун-та, 2003. -

УДК 578.087.1

Предлагаемое пособие предназначено для студентов, аспирантов, преподавателей и специалистов-биологов, сталкивающихся с проблемой анализа и прогноза временных рядов, полученных в ходе проведения экологических наблюдений и лабораторных экспериментов. Пособие проиллюстрировано типовыми примерами из области биометрии с демонстрацией возможности применения при их решении компьютерных программ.

Рецензенты: Т.А.Михайлова, доктор биол. наук, ведущий научный сотрудник Сибирского института физиологии и биохимии растений СО РАН

С.В.Пыжьянов, доктор биол. наук, зав.каф.биологии Иркутского государственного педагогического университета

©А.Я.Никитин, И.А.Сосунова, 2003

©Иркутский государственный педагогический университет, 2003

ОГЛАВЛЕНИЕ ВВЕДЕНИЕ……………………………………………………………………………….. 4

1.ПРАВИЛА ПОСТРОЕНИЯ РЯДОВ И ИХ КЛАССИФИКАЦИЯ……........ 5

2.СТАТИСТИЧЕСКИЕ ПАРАМЕТРЫ РЯДОВ ДИНАМИКИ,

ИСПОЛЬЗУЕМЫЕ В БИОМЕТРИИ.............................................................................

11

2.1.Математические параметры……………………………………………… 11

2.1.1.Оценка центральной тенденции……………………………………... 11

2.1.2.Оценка амплитуды колебаний……………………………………….. 12

2.1.3.Оценка длительности периода……………………………………….. 13

2.2.Описательные параметры……………………………………………….. 16

2.2.1. Анализ последовательности наблюдений на неслучайность ............

16

2.2.2.Анализ временного ряда на стационарность………........................... 22

2.2.2.1.Преобразование ряда к стационарному виду путем удаления

трендов ..................................................................................

24

2.2.3. Оценка нормальности распределения наблюдений во временных

 

рядах...........................................................................................................................

28

2.3.Анализ надежности построенных моделей……………………….. 32

3.СРАВНЕНИЕ РЯДОВ…………………………………………………........... 34

4.ИЗМЕРЕНИЕ СВЯЗИ МЕЖДУ РЯДАМИ………………………............... 38

5.

ПРОСТЫЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ 44

5.1.Прогноз по тенденциям развития ряда…………………………… 44

5.1.1.Метод парной линейной регрессии……………………....................... 45

5.1.2. Стационарный ряд с циклическими составляющими…………… 51

5.1.3.Комбинированный тренд-циклический ряд……………………........ 56

5.2.Индикаторный (факторный) прогноз…………………………….. 60

ЗАКЛЮЧЕНИЕ………………………………………………………………………… 65 ИСПОЛЬЗОВАННАЯ ЛИТЕРАТУРА…………………………………………........... 69

КРАТКИЙ СЛОВАРЬ ОСНОВНЫХ ПОНЯТИЙ И ТЕРМИНОВ……………….. 71

ПРИЛОЖЕНИЯ…………………………………………………………………………. 76

Введение Временной ряд (ВР) – хронологически упорядоченная последовательность

наблюдений за развитием определенного процесса или явления. Теория исследования ВР применяется в экономике, демографии, географии, биологии, медицине, химии, метеорологии и др. дисциплинах. В последнее десятилетие вновь резко возрос интерес к проблеме анализа и прогноза временных рядов (ВР). Прежде всего это связано с появлением персональных компьютеров, избавивших исследователей от рутинных вычислений, ранее служивших серьезным препятствием широкого использования приемов статистического анализа ВР, сдерживающим прогресс в этом несомненно актуальном направлении работ. Имеющаяся отечественная и переводная литература по проблеме, как можно судить даже на основе далеко неполного ее списка приводимого в конце пособия, достаточно обширна. Однако на сегодняшний день отсутствуют методические рекомендации, адресованные экспериментаторам, работающим в области биологии и медицины, которые бы содержали корректное относительно полное современное изложение элементарных (базовых) методов статистической обработки рядов, отражали особенности их применения в биометрии. Особый интерес рекомендации могут представлять для экологов, занимающихся проблемами изучения факторов и механизмов динамики численности популяций, охраной и интродукцией видов, причин распространения трансмиссивных и инфекционных заболеваний.

Предлагаемые рекомендации предназначены для студентов, аспирантов, преподавателей и специалистов, готовых самостоятельно изучать статистические методы исследования ВР, содержащие наблюдения за явлениями в жизни животных, растений, людей, природы в целом. Они могут быть использованы как учебно-справочное пособие, проиллюстрированное типовыми примерами и приемами решения задач из области биометрии.

5

1. Правила построения рядов и их классификация

Каждый временной ряд содержит наблюдения (уровни ряда) и соответствующие им значения времени их регистрации.

Наиболее удобны для анализа ВР с равноотстоящими друг от друга наблюдениями. Именно поэтому сбор данных лучше всего осуществлять через равные интервалы времени.

ВР могут различаться по полноте охвата единиц наблюдения. При сплошном наблюдении регистрации подлежат все без исключения единицы совокупности. Обычно в биологии это возможно лишь при работе с лабораторными популяциями. Несомненно, основным видом наблюдений являются несплошные. Они строятся либо способом исследования основного массива, то есть изучением части совокупности, вносящей наибольший вклад в изучаемое явление или процесс, либо путем обследования незначительной части единиц (выборки) отобранной в определенном порядке. В последнем случае для того, чтобы выборка была репрезентативной, то есть отражала особенности генеральной совокупности (например, всей популяции) ее необходимо получать по определенным правилам. Чаще всего для этого используется принцип случайного наблюдения, особенности организации которого диктуются характером изучаемого процесса или явления. При этом нередко возникают значительные сложности. Так при оценках численности природных популяций ошибки измерений редко бывают ниже 15, а иногда их величина достигает 50 и более процентов, что обесценивает полученные данные /5/.

Важен правильный выбор длительности интервалов между уровнями ряда. Если интервал между наблюдениями большой, можно упустить существенные моменты в динамике ряда. Напротив, слишком малые интервалы увеличивают объем работы по сбору данных, их обработке, и, кроме того, не давая новой информации, могут приводить к «засорению» основной тенденции процесса. Вопрос о выборе интервала времени между наблюдениями должен решаться исходя из целей и особенностей объекта конкретного исследования. Большое значение здесь могут играть темпы изменения изучаемого явления, размах его изменчивости, интенсивность и характер периодичности действия внешних факторов, особенности жизненного цикла объекта изучения. В большинстве работ по оценке численности популяций, если генерации не перекрываются, целесообразно иметь не менее одного наблюдения за

6

время жизни поколения. При перекрывающихся поколениях интервал времени между учетами должен быть не более времени генерации.

Последнее положение позволяет грубо рассчитать и желательную длину ряда наблюдений в подобных исследованиях. Так, если установлено, что при изучении периодических колебаний необходимо обладать информацией не менее, чем за три полных цикла /4/, а период цикла у многих организмов составляет 3-5 поколений /11-13/, то отсюда минимальная длина наблюдений должна составлять 9-15 генераций исследуемого объекта. То есть, в зависимости от объекта, это может быть 90150 дней (муха дрозофила) или 9-15 лет (мышевидные грызуны). Кроме того, на оценку желаемой длины ряда влияет и выбор метода его статистического анализа.

Фактические ВР нередко содержат пропуски наблюдений, отдельные выбросы (значения резко отличающиеся от других). Появление последних часто связано с возникновением ошибок при сборе, записи и передаче информации. Выявление и исключение выбросов, замена их истинными или расчетными значениями, заполнение пропусков являются необходимыми этапами первичной обработки уровней ряда. Без выполнения этого этапа применение математических методов приведет к искажению результатов анализа. Простые методы оценки выбросов и заполнения пропусков можно найти в ряде источников /2, 9, 22/. Вместе с тем, следует обратить внимание, что иногда аномальные значения не являются артефактами. В этом случае при составлении модели процесса их лучше все же заменять расчетными, но, вместе с тем, учитывать при оценке возможной величины отклонений между фактическими и ожидаемыми значениями ряда.

Еще одним способом выявления и вычленения основной тенденции в ряде наблюдений при первичной обработке материала является укрупнение интервалов методом сглаживания /8, 18, 22/. В экологических исследованиях широко применяется прием усреднения данных по 3 и 5 точкам. Чем шире выбранное окно сглаживания, тем рельефнее будут выглядеть тренды и низкочастотные циклы. Однако при этом можно потерять короткопериодические и высокочастотные составляющие рядов.

Важным принципом сбора информации для построения ВР является сопоставимость уровней ряда. Под этим подразумевается сохранение неизменным метода сбора наблюдений, их классификации, района исследования, его площади, терминологии и т.п. Например, при энтомологических сборах иксодовых клещей долгое время параллельно применяются два метода учета их обилия: на флаго/час и флаго/км.

7

Естественно, при этом получаются разные значения численности. Если в процессе многолетних наблюдений методика сбора иксодид претерпела изменения, а это не было соответствующим образом описано и учтено при статистической обработке ряда, характеризующего изменения численности клещей, то могут возникнуть ложные представления об особенностях динамики объекта. В большинстве случаев, при наличии соответствующей информации, подобные несопоставимости удается устранить. Для этого необходимо иметь минимум две одновременные оценки одного и того же процесса разными методами. Процедура пересчета одних уровней ряда в другие называется обеспечением его сходимости /17/. Сходимость может быть достигнута двумя способами, которые рассмотрены в Примере1 в конце данного раздела. Однако необходимо отметить, что точность анализа ВР после проведения процедуры обеспечения сходимости может снижаться.

Основные типы рассматриваемых ВР можно свести к следующим (рис.1): 1. Пилообразные или маятниковые, имеющие минимальную длину периода, то есть характеризующиеся высокочастотными колебаниями; 2. Долгопериодические, низкочастотные; 3. Комбинированные; 4. Случайные.

Большинство ВР в биометрии является комбинированными: они могут включать тренды, циклическую, сезонную компоненты и обязательно случайную составляющую.

Под трендом будем понимать изменение, определяющее общее направление развития, основную тенденцию временного ряда. Эта составляющая наиболее долговременного действия.

Наряду с долговременными тенденциями в ВР часто могут наблюдаться более или менее регулярные колебания (осцилляции) – представляющие периодические компоненты рядов. При длинных и неодинаковых периодах колебаний их называют длиннопериодическими. Регулярные колебания, особенно если их период равен году (однако это необязательно), называют сезонными циклами. Высокочастотные колебания, крайним случаем которых является пилообразная кривая (рис.1), - короткопериодическими. Все перечисленные типы ВР необходимо отличать от случайного процесса, колебания в котором не подчиняются каким-либо закономерностям (наблюдения флуктуируют). Именно обучению как определить характер колебаний того или иного ВР, как его статистически сжато описать и спрогнозировать будущие изменения и посвящена остальная часть предлагаемого пособия.

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

а)

 

 

 

 

 

1 0

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

1

3

5

7

9 б1)1

1 3

1 5

1 7

1 9

2 1

 

 

 

 

 

время

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

1

3

5

7

9

11

13

15

17

19

21

 

 

 

 

 

в)

 

 

 

 

 

 

 

 

 

 

время

 

 

 

 

30

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

1

3

5

7

9

11

13

15

17

19

21

 

 

 

 

 

г)

 

 

 

 

 

 

 

 

 

 

время

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

15

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

1

3

5

7

9

11

13

15

17

19

21

 

 

 

 

 

время

 

 

 

 

Рис.1. Некоторые возможные типы временных рядов: а) низкочастотный ста-

ционарный;

б) высокочастотный стационарный; в) низкочастотный с линейным

трендом (комбинированный);

г) случайные флуктуации (генерация чисел в про-

грамме Excel)

 

 

 

 

 

 

 

 

 

9

Пример 1.

Рассмотрим гипотетический пример. В табл.1.1 и 1.2 приведены данные о пятилетних учетах численности имаго клещей. Причем до 1996 г. и после него учеты проводились разными методами. В 1996 г. клещей подсчитали обоими методами одновременно. Будем называть этот год базисным. Именно наличие базисной точки позволяет нам построить единый временной ряд (обеспечить схождение), несмотря на допущенное изменение в подходе к учетам численности.

В табл. 1.1 схождение ряда обеспечено методом индексирования. Для этого в начале найдено отношение между оценками численности клещей, полученных разными методами в одном и том же базисном году (1996г.). Рассчитанный индекс (= 0,65) позволяет узнать во сколько раз один из способов учета численности имаго более «уловист», чем другой. Затем уровни отрезков исследований до или после базисного года корректируются на полученный индекс (гр. 3 и гр. 5). Так, например, мы получили сведенный воедино ряд путем перемножения на величину индекса (см. гр. 8 табл.1.1) всех значений наблюдений, полученных после 1996 г.

Таблица 1.1

Пример обеспечения сходимости двух рядов путем их индексации, посредством сопоставления двух методов учета на материале

базисного 1996 г. (Индекс = 13,5/20,8 = 0,65)

(до 1996 г. учет численности клещей на флаго/час, а после - на флаго/км)

Год

Исход-

Вариант

Год

Исход-

Вариант ин-

Год

Сведен-

 

ный ряд

индексации

 

ный ряд

дексации

 

ный пу-

 

наблюде-

ряда до

 

наблюде-

ряда после

 

тем ин-

 

ний

1996 г.

 

ний

1996 г

 

дексиро-

 

флаго/час

(гр.2 / 0,65)

 

флаго/км

(гр.5 * 0,65)

 

вания ряд

 

 

 

 

 

.

 

 

1

2

3

4

5

6

7

8

 

 

 

 

 

 

 

 

1994

9,2

14,2

1996

20,8

13,5

1994

9,2

 

 

 

 

 

 

 

 

1995

3,6

5,5

1997

32,5

21,1

1995

3,6

 

 

 

 

 

 

 

 

1996

13,5

20,8

1998

33,4

21,7

1996

13,5

 

 

 

 

 

 

 

 

-

-

-

-

-

-

1997

21,1

 

 

 

 

 

 

 

 

-

-

-

-

-

-

1998

21,7

 

 

 

 

 

 

 

 

В табл.1.2 схождение ряда обеспечено принятием уровня базисного года, когда исследование велось обоими методами (1996 г.), за 100 %. Затем наблюдения, выполненные до и после базисного года, выражаются в процентах относительно этого