Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1nikitin_a_ya_sosunova_i_a_analiz_i_prognoz_v_ekologicheskikh

.pdf
Скачиваний:
13
Добавлен:
19.11.2019
Размер:
821.47 Кб
Скачать

58

Уравнение для описания циклической составляющей ряда остатков строится на основании результатов гармонического анализа, в соответствии с тем, как это сделано выше (см. Пример 10) и имеет вид:

Yt=0,57cost-1,35sint+1,42cos2t-0,98sin2t- 0,22cos3t+0,41sin3t+3,03cos4t+2,74sin4t+37,45cos5t+1,49sin5t

В табл.5.7 приводятся окончательные результаты аппроксимации исходного ВР, описывающего заболеваемость населения клещевым энцефалитом, по подобранному уравнению линейного тренда и пяти гармоникам ряда остатков. Здесь же приведены результаты прогноза исследуемого ВР на ближайшие четыре года.

Таблица 5.7 Аппроксимация и прогноз заболеваемости населения Иркутска клещевым энцефалитом на 2002-2005 гг. на основе анализа комбинированного ряда

Год

Исход-

Аппроксимация

Аппроксимация и

Итоговая ап-

 

ный ВР

и прогноз по ли-

прогноз ряда остат-

проксимация и

 

 

нейному тренду

ков по уравнению

прогноз

 

 

 

Фурье

 

1983

3,3

1,8

-4

0,0

1984

2,9

3,1

1

3,7

1985

3,5

4,4

-1

2,4

1986

5

5,8

-4

0,9

1987

5,8

7,1

-2

4,1

1988

8,5

8,4

0

9,0

1989

10,6

9,8

0

10,9

1990

15,4

11,1

3

18,3

1991

13,7

12,4

4

17,7

1992

10,1

13,8

-3

7,1

1993

7,2

15,1

-8

0,0

1994

15,1

16,4

0

15,5

1995

23,3

17,8

9

32,7

1996

26,6

19,1

4

30,3

1997

11,0

20,4

-5

5,8

1998

20,8

21,8

0

20,4

1999

32,9

23,1

8

40,7

2000

28,1

24,4

3

31,4

2001

17,7

25,8

-6

12,1

2002

-

27,1

-4

23,0

2003

-

28,4

1

29,3

2004

-

29,8

-1

28,7

2005

-

31,1

-4

27,0

Коэффициент детерминации (R2) для данных с 1983 по 2001

0,93

гг. между исходным ВР и его итоговой аппроксимацией

 

Примечания. 1.Отрицательные значения заболеваемости населения, полученные в ряду итоговой аппроксимации (1983 и 1993 гг.), как бессмысленные заменены на 0. 2. Полужирным шрифтом выделены уровни итоговых прогнозов.

59

Данные табл.5.7 показывают, что заболеваемость населения Иркутска клещевым энцефалитом лучше описывается рядом, представляющим комбинацию линейного тренда и уравнения Фурье с пятью гармониками. В этом случае доля объясненной изменчивости составляет 93 %.

Таким образом, именно комбинированную модель лучше использовать для прогноза заболеваемости населения в Иркутске. В частности, она показывает, что в 2002 г. относительный уровень заболеваемости населения (в расчете на 100 тысяч жителей) должен несколько увеличиться. Более сильный рост заболеваемости будет наблюдаться в 2003 г., когда число заболевших может достигнуть уровня наиболее неблагоприятного 1999 г. В последующие два года, судя по прогнозу, уровень заболеваемости клещевым энцефалитом будет примерно одинаковым. Вероятные его колебания не выходят за пределы ошибки наблюдений. Фактически это может означать, что ситуация с заболеваемостью клещевым энцефалитом в 2005 г. несколько улучшится по сравнению с 2003 г. Доверительный интервал прогноза можно рассчитать, как и в Примере 12, для прямой линии регрессии. В этом случае для ориентировочного расчета, уровни остатков из табл. 5.7 можно суммировать соответственно с верхними и нижними ожидаемыми значениями ряда, полученными при оценке доверительного интервала линейного тренда.

Следует помнить, что проведенный прогноз не учитывает возможность влияния на уровень заболеваемости населения изменения доли людей, прошедших противоэнцефалитную вакцинацию, площадей территорий, обработанных от клещей и других факторов, способных повлиять на окончательные результаты. То есть, любой прогноз дается в предположении неизменности характера и интенсивности действия факторов, определяющих изучаемый процесс на протяжении предшествующих лет и на время проводимой экстраполяции уровней ВР. В этой связи не всегда оправдано брать ВР со значительной предисторией, или делать попытки заглянуть слишком далеко вперед. Обычно прогноз не должен выходить за пределы установленного времени одного цикла. По мере прохождения новых событий аналитические уравнения, описывающие исходный ВР, должны корректироваться, а время экстраполяции постепенно наращиваться.

5.2. Индикаторный (факторный) прогноз

Метод основан на сборе информации о характере изменения не только исследуемого ВР, но и других факторов, представленных в виде временных рядов, которые

60

либо непосредственно влияют на исследуемый процесс, либо изменяются коррелятивно, хотя между рядами и нет причинно-следственных отношений. Выявление подобных факторов (предикторов или индикаторов) полезно в обоих случаях. Незнание роли отдельных из них в формировании динамики исследуемого процесса или даже установленное отсутствие связи между явлениями не являются причинами, по которым было бы недопустимо включать их в уравнения прогноза. Так, например, в биологии успешно развивается метод феноиндикаторов, основанный на принципе регистрации корреляций между явлениями несвязанными или имеющими опосредованную зависимость.

Прогнозирование с помощью индикаторов (факторов) основано на моделировании процесса в соотвествии с уравнением:

Υx = a +b1 x1 +b2 x2 +...bi xi (28),

где Υx - исследуемый ВР с уровнями, характеризующимися нормальным рас-

пределением; a - свободный член уравнения; b1 ,b2 ,...bi коэффициенты регрессии при соответствующих факторах x1 , x2 ,...xi , которые могут иметь любое распределение, но должны значимо влиять на исследуемый процесс (являются предикторами).

Воснове выявления среди множества исследованных факторов предикторов лежит корреляционный анализ. В частности, строится матрица парных коэффициентов корреляции, где анализируется характер и степень связи между всеми переменными

(см. разд. 4, с. 39).

Вкаждой табличной компьютерной программе существует команда вычисления корреляций (например, в Excel в меню «функция» команда «КОРРЕЛ»), а также по-

строения матрицы парных r (в Excel в меню «Сервис», команда «Анализ данных», а

затем «Корреляция»). Матрица парных корреляций необходима нам для того, чтобы: 1.Отобрать для построения уравнения регрессии только факторы, значимо коррелирующие с зависимой переменной (предикторы). 2. Исключить из уравнения регрессии те факторы, которые в матрице парных корреляций связаны между собой на уровне более 0,8. Точнее, оставить из двух подобных факторов в качестве предиктора лишь один, который имеет более тесную связь с зависимой переменной /4, 8/.

Так как мы имеем дело не со случайными процессами, полезно ввести в матрицу парных корреляций несколько рядов с исходными наблюдениями, сдвинутыми на один, два и более шагов относительно начала ВР, то есть, по сути, оценить автокор-

61

реляции. Нередко предшествующие значения могут являться хорошими предикторами в уравнениях прогноза и, таким образом, его точность может быть увеличена.

Вместе с тем, для построения уравнений наличие автокорреляций в исследуемых ВР нежелательно.Установлено, что добавление в уравнение прогноза фактора времени устраняет автокорреляцию в рядах динамики /8, 18/. Причем обычно показатели времени берут без всяких преобразований, даже в тех случаях, если ряды наблюдений над другими факторами были трансформированы. Фактически, мы должны, для исключения автокорреляций, в уравнение вида (28) добавить фактор времени и перейти к уравнению:

Υx = a +b1 x1 +b2 x2 +...bi xi + ct,

где xi – отдельные предикторы; bi и c – соответствующие константы при предикторах; t – временной ряд последовательных интервалов времени. Параметр c при t отражает среднюю величину изменения анализируемого ряда под воздействием прочих факторов, при закреплении предикторов xi на постоянном уровне.

Итак, обобщим перечисленные, а также приведем некоторые дополнительные эмпирически установленные правила построения уравнения множественной регрессии /2, 4, 8, 18/. 1. В уравнения прогноза не должны включаться факторы, если они имеют коэффициент парной корреляции между собой больший или равный 0,8. 2. В уравнение прогноза должно входить как можно меньше предикторов. Оно должно быть наиболее простым из возможных. На каждый предиктор должно приходиться не менее 10-15 наблюдений исследуемого ВР. 3. При сокращении числа используемых предикторов первоочередному исключению подлежат факторы, коррелирующие с исследуемым ВР в меньшей степени. 4. Не следует делать прогноз на время, превышающее 1/3 длины базового ВР. 5. Нельзя подставлять в уравнения прогноза значения предикторов (xi), значительно отличающиеся по величине от тех, на основе которых уравнение было составлено. Рекомендуется не выходить за пределы 1/3 размаха вариации как сверхминимального, так и сверхмаксимального значений признакафактора, имевшихся в исходных рядах. 6. Необходимо проверять адекватность построенной модели (см. выше). Желательно, чтобы расчетное уравнение объясняло не менее 60 % колеблемости исходного ВР. 7. Для устранения автокорреляции рядов динамики в уравнение прогноза необходимо включать в качестве самостоятельного предиктора фактор времени. Фактор времени берется без преобразований, даже в тех случаях, когда остальные параметры модели трансформировались.

62

Прогноз может осуществляться на основе не только множественной линейной, но и других видов зависимостей. В частности, Excel позволяет использовать для этого криволинейную множественную регрессию (команды: «РОСТ», «ЛГРИФПРИБЛ»).

Пример 12.

В качестве примера использования при прогнозировании индикаторного подхода проанализируем данные, обобщенные в годовых отчетах Иркутского городского Центра госсанэпиднадзора за 1992-2001 гг. относительно обращаемости жителей Иркутска в специализированные медицинские учреждения по поводу присасывания таежного клеща Ixodes persulcatus /14, 15/, а также характер изменения некоторых из изученных показателей погодных условий (табл.5.8). Очевидно, что все приведенные в табл.5.8 факторы погоды не могут существенно повлиять на активность имаго клещей, так как в июле-августе наблюдается ее закономерный естественный спад.

Таблица 5.8

Годовая активность нападения иксодовых клещей на население в рекреационной зоне Иркутска и некоторые показатели погодных факторов

Годы на-

Число горо-

Средняя

Средняя

Средняя

Средняя

блюде-

жан покусан-

температура

температу-

влажность

влажность

ний

ных клещами

воздуха в

ра воздуха

воздуха в

воздуха в ав-

 

 

июле

в августе

июле

густе

 

 

( 0 С )

( 0 С )

(в %)

(в %)

1992

2937

-

-

-

-

1993

2369

20,8

16,2

65

60

1994

2462

18,8

16

76

80

1995

3929

18

17

78

77

1996

4275

16,1

16,9

76

75

1997

2186

17,7

16,8

73

76

1998

3731

17,8

17,1

76

78

1999

4210

19,6

13,6

75

75

2000

3807

17,5

16,2

79

81

2001

4460

18

17

78

79

Примечания. 1. «-» означает отсутствие данных. 2. Данные по температуре августа в 1996 г. рассчитаны как среднее из двух соседних значений, т.е. использован один из приемов заполнения пропусков (см. разд.1).

Более вероятно, что если рассмотренные факторы являются предикторами численности и активности клещей, то обусловлено это их влиянием на нимф паразита в предшествующем году. Поэтому в табл.5.9 мы сразу приводим матрицу парных корреляций, построенную с учетом возможного сдвига влияния факторов. Иными словами, активность нападения клещей в 1994 г. сравнивается с показателями погоды в 1993 г., а в 1995 г. - с данными 1994 г. и так далее. Учитывая, что у нас нет данных о

63

погодных факторах в 1992 г. и об активности клещей в 2002 г., число уровней в сравниваемых рядах при построении матрицы корреляций сокращается на две единицы и становится равным 8.

Таблица 5.9

Матрица парных корреляций между показателями табл.5.8, полученная с учетом сдвига погодных факторов на один шаг по отношению к данным по активности напа-

дения имаго клещей

 

Число го-

Средняя тем-

Средняя темпе-

Средняя

Средняя

 

рожан по-

пература воз-

ратура воздуха

влажность

влажность

 

кусанных

духа в июле

в августе

воздуха в

воздуха в

 

клещами

( 0 С )

( 0 С )

июле (в %)

августе (в

 

 

 

 

 

%)

Число горожан,

1,00

-

-

-

-

покусанных

 

 

 

 

 

клещами

 

 

 

 

 

Средняя темпе-

-0,07

1,00

-

-

-

ратура воздуха в

 

 

 

 

 

июле ( 0 С )

 

 

 

 

 

Средняя темпе-

-0,06

-0,53

1,00

-

-

ратура воздуха в

 

 

 

 

 

августе ( 0 С )

 

 

 

 

 

Средняя влаж-

0,63

-0,69

0,08

1,00

-

ность воздуха в

 

 

 

 

 

июле (в %)

 

 

 

 

 

Средняя влаж-

0,70

-0,65

0,07

0,94

1,00

ность воздуха в

 

 

 

 

 

августе (в %)

 

 

 

 

 

Из всех проанализированных факторов погоды (табл. 5.9) наибольшее влияние на активность нападения имаго в следующем сезоне (как мы предположили, это обусловлено характером влияния на выживание нимф клещей) оказывают параметры среднемесячной влажности июля и августа. Влияние температуры этих месяцев не доказано. Однако показатели влажности воздуха в эти два месяца сильно коррелируют между собой (то есть они коллениарны r = 0,94 > 0,80). Следовательно, для составления прогноза необходимо из этих двух факторов оставить один, а именно «среднемесячную влажность воздуха в августе месяце», так как величина коэффициента корреляции этого параметра с уровнем активности имаго несколько выше. Кроме того, и малая длина исследуемого ВР запрещает нам использовать при составлении аналитического уравнения более одного предиктора. К сожалению, выбранный нами фактор, хотя и влияет сильнее других из проанализированных (0,70 по табл. 5.9), не оказыва-

64

ет достоверного действия на зависимую переменную (сравни с табулированными значениями r по Приложению 7). То есть, его нельзя использовать для прогнозирования. Одной из причин этого может быть и недостаточное число лет наблюдений. В подобной ситуации необходимо попытаться найти другие подходы к прогнозу активности нападения клещей на население в рекреационной зоне Иркутска.

Как уже сказано, использовать при прогнозировании факторы, действие которых не доказано, бессмысленно. Однако для демонстрации порядка проведения расчетов при индикаторном прогнозировании доведем рассмотрение примера до конца.

При построении уравнения зависимости уровня активности клещей от «среднемесячной влажности воздуха в августе месяце предшествующего года» введем в него параметр времени. Расчеты коэффициентов уравнения могут быть осуществлены разными способами в любой из программ. Например, в Excel можно воспользоваться уже знакомой нам командой «Анализ данных» в меню «Сервиса», выбрав пункт «Регрессия». Сразу же после выполнения этих команд вся необходимая информация выводится на экран дисплея в виде трех таблиц. Анализ их позволяет сделать ряд выводов относительно рассматриваемых ВР и построить уравнение линейной регрессии. В частности, в нашем случае учет действия рассматриваемых факторов объясняет только около 50 % изменчивости анализируемого ВР, причем ни один из факторов не влияет достоверно. Линейное уравнение имеет следующий вид:

Υx = a +b1 x1 + ct = + 78,4* x1+ 57,7*t – 117420.

Используя полученное уравнение, сделаем прогноз ожидаемой активности имаго клещей в 2002 г. Напомним, что влажность воздуха в августе 2001 г. равна 79,0 % (табл.5.8). Проведя соответствующие подстановки, получим:

Υx = a +b1 x1 + ct = - 117420 + 78,4*79 + 2002*57,7 = 4186

Итак, в соответствии с индикаторным прогнозом, выполненным при учете действия двух факторов (напомним, что их влияние на переменную не доказано), в 2002 г. ожидается некоторое снижение активности нападения имаго иксодовых клещей на население в рекреационной зоне Иркутска по сравнению с 2001 г. (см.

табл.5.8).

65

65

ЗАКЛЮЧЕНИЕ

Как мы уже отмечали, использование компьютеров, избавив исследователей от необходимости проводить громоздкие расчеты, послужило причиной вновь возросшего их интереса к решению актуальной задачи построения количественных прогнозов исследуемых процессов и явлений. Однако применение вычислительной техники не избавляет от совершения ошибок в методах и методологии прогнозирования. Знакомство с оригинальными работами в области биологии за последние годы, где использовались методы анализа ВР, показывает, что наиболее часто наблюдаются следующие ошибки: комбинированные ряды не разлагаются на составляющие; проверка адекватности модели аналитического уравнения либо не проводится, либо проводится на основе того же ряда наблюдений, по которым оно было получено; в аналитические уравнения включается избыточное число предикторов, а иногда и незначимых факторов; наличие или отсутствие корреляции между рядами однозначно трактуется как доказательство соответственно наличия или отсутствия причинноследственных связей между ними. Внимательное знакомство с предлагаемым руководством, а также источниками, рекомендуемыми нами, поможет избежать подобных ошибок.

Водном пособии нельзя рассмотреть все широко применяющиеся способы прогнозирования ВР. Мы остановились только на некоторых элементарных. При дальнейшем самостоятельном изучении проблемы особо следует обратить внимание на возможность использования в работе экспоненциального метода, ортогональных полиномов, сезонных индексов, криволинейной регрессии, нейронных сетей /2, 4, 9,10, 17-19/. Из компьютерных программ в настоящее время достаточно перспективно применять Statistica /2/. Однако, возможно использование и иных программ.

Вцелом примерная схема анализа временных рядов, которая может быть использована при обработке данных экологических наблюдений, приводится на рис.4. Не обязательно нужно проводить все 6 этапов анализа. Однако полный анализ, включающий прогноз, как одну из наиболее важных с точки зрения практики задач, может содержать все или большинство этапов, что будет зависеть от особенностей ряда, в свою очередь, определяющихся биологией объекта.

Избрав схему-алгоритм проведения анализа рядов, напомним некоторые статистические методы с помощью которых решаются задачи, сформулированные на отдельных его этапах. Соответствующие материалы приведены в табл.5.10.

66

В заключение отметим, что получив те или иные прогнозные оценки, мы, во-первых, должны пронаблюдать насколько хорошо они будут сбываться с течением времени. Вовторых, нельзя забывать, что только знание биологии объекта, происходящих с ним и в его окружении изменений страхует исследователя от выдачи прогнозов, верных с математической точки зрения, но бессмысленных и не возможных с экологических позиций /1/.

СХЕМА АНАЛИЗА ВРЕМЕННЫХ РЯДОВ

Случайный

1 Этап:

Неслучайный

 

Комбинированный. Разде-

 

Анализ завершен

(мало шумов)

 

ление на случайную и не-

 

 

 

 

случайную компоненты

 

 

2 Этап:

Нестационарный

трансформация

Стационарный

 

 

 

3 Этап:

Ненормальный

трансформация

Нормальный

 

 

 

4 Этап:

Непараметрические методы сравнения рядов и выявления связи между ними

Параметрические методы сравнения рядов и выявления связи между ними

5 Этап:

Подбор модели (аналитического уравнения), описывающей процесс, и проверка ее адекватности путем анализа ряда остатков

6 Этап:

В случае хорошей аппроксимации исходной последовательности аналитическим уравнением его используют для ПРОГНОЗА.

При комбинированном строении ряда, прогноз проводится для каждой из его компонент в отдельности, с последующим их синтезом.

Рис. 4. Схема использованной последовательности анализа временных рядов