1nikitin_a_ya_sosunova_i_a_analiz_i_prognoz_v_ekologicheskikh
.pdf67
Таблица 5.10
Статистические методы, рекомендуемые для использования на отдельных этапах анализа временных рядов
Этап ана- |
|
Решаемая задача |
Возможные статистические приемы анализа |
||||
лиза |
|
|
|
|
|
|
|
1 |
|
|
2 |
|
|
3 |
|
1 |
1.Заполнение пропусков. |
1. |
По средней или медиане /2, 9/ |
||||
подгото- |
2.Оценка выбросов |
2. |
Критерий выпадающих значений /22/ |
||||
витель- |
3.Обеспечение схождения |
3. Пересчет в индексы или проценты к базовой |
|||||
ный |
|
|
|
|
точке |
||
|
4.Проверка на неслучайность |
4. |
Критерий Валлиса-Мура /6/; автокорре- |
||||
|
|
|
|
|
ляционный критерий /2, 4/ |
||
|
5.Разложение, очистка от |
5. |
3 или 5 –точечное сглаживание, подбор ана- |
||||
|
шумов |
|
|
литического уравнения и последующее нахож- |
|||
|
|
|
|
|
дение остатков методом вычитания /8, 22/ |
||
|
6.Определение |
параметров |
6. Оценка параметров /4, 6, 9,16-19, 22/ |
||||
|
исходной |
последовательно- |
|
|
|||
|
сти |
|
|
|
|
|
|
2 |
1. Анализ ряда на стационар- |
1. |
а) Использованием коррелограммы /2, 4/; |
||||
оценка |
ность. |
|
|
б) Метод последовательной группировки и |
|||
стацио- |
|
|
|
|
сравнения групп /4/. |
||
нар- |
2.Трансформация |
наблюде- |
2. |
а).Метод нахождения последовательных |
|||
ности |
ний ряда для достижения его |
разностей /4/; б) Удаление тренда, в соотвест- |
|||||
|
стационарности |
относитель- |
вии с аналитическим уравнением подобран- |
||||
|
но центральной тенденции |
ным по исходным уровням ряда /4/. |
|||||
3 |
1. |
Проверка нормальности |
1. |
Критерий Колмогорова-Смирнова, χ2 , от- |
|||
оценка |
распределения наблюдений в |
ношение размаха изменчивости к стандарт- |
|||||
нормаль- |
ряду. |
|
|
ному отклонению /2, 4, 6, 22/. |
|||
ности |
2. |
Преобразования уровней |
|||||
2.Логарифмирование, нахождение обратной |
|||||||
распре- |
ряда с целью придания ему |
величины, извлечение корня /6, 20/ |
|||||
деления |
нормального распределения |
|
|
||||
4 |
1. Сравнение рядов и выяв- |
1. |
Непараметрические методы анализа (коэф- |
||||
(сравне- |
ление связи между ними в |
фициент корреляции Спирмэна, критерий |
|||||
ние ря- |
случае, если их распределе- |
Краскала-Уоллиса) /6, 22/. Для стационарных |
|||||
дов) |
ние не соответствует нор- |
рядов спектральный анализ /1, 2, 7/. |
|||||
|
мальному. |
|
|
2. |
Параметрические методы анализа (коэффи- |
||
|
2. Сравнение рядов и выяв- |
циент корреляции Пирсона, критерий Стью- |
|||||
|
ление связи между ними в |
дента, F- Фишера). Для стационарных рядов |
|||||
|
случае нормального распре- |
спектральный анализ /1, 2, 7/. |
|||||
|
деления наблюдений. |
|
|
||||
5 |
Проверка |
адекватности вы- |
|
Критерий Дарбина-Уотсона, коэффици- |
|||
(созда- |
бранной модели (аналитиче- |
ент детерминации, анализ средней и дисперсии |
|||||
ние мо- |
ского уравнения). |
остатков, нормальности их распределения /2, 8, |
|||||
дели ря- |
|
|
|
|
18, 19/. |
||
да) |
|
|
|
|
|
|
68
Продолжение табл.5.10
1 |
2 |
|
3 |
|
6 |
Построение прогноза: |
|
Методами множественной прямолинейной или |
|
(прогно- |
по тренду. |
|
криволинейной регрессий, |
экспоненциального |
зирова- |
|
|
сглаживания, индексов сезонности, уравнения |
|
ния) |
|
|
тренда /1, 2, 4, 7-10, 16-19/; |
|
|
Построение прогноза |
по |
Методом множественной |
криволинейной рег- |
|
циклической компоненте |
|
рессии, экспоненциального сглаживания, индек- |
|
|
|
|
сов сезонности, гармонический анализ /1, 2, 4, |
|
|
|
|
7-10, 16-19/. |
|
69
Литература
1.Андерсон Т. Статистический анализ временных рядов. - М.: Мир, 1976. – 756 с.
2.Боровиков В.П., Ивченко Г.И. Прогнозирование в системе Statistica в среде Windows. Основы теории и интенсивная практика на компьютере. - М.: Финансы и статистика, 2000. – 384 с.
3.Гречаный Г.В., Корзун В.М., Кравченко К.Л. Колебания численности ящичных популяций дрозофилы и селекционно-генетический механизм их регуляции // Журн.
общ. биол. – 2002. - № 5, Т.63. – С.382-392.
4.Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник. - М.: Финансы и статистика, 2000. – 480 с.
5.Жирмунский А.В., Кузьмин В.И. Критические уровни в процессах развития биологических систем. – М.: Наука, 1982. – 178с.
6.Закс Л. Статистическое оценивание.- М.: Статистика, 1976.– 598 с.
7.Кендалл М., Стьюарт А. Многомерный статистический анализ и временные ряды.- М.: Наука, 1976. – 736 с.
8.Кильдишев Г.С., Френкель А.А. Анализ временных рядов и прогнозирование. -
М.: Статистика, 1973. – 103 с.
9.Кожухарь Л.И. Основы общей теории статистики.- М.: Финансы и статистика, 1999. – 144 с.
10.Компьютерная биометрика / Под ред. В.Н. Носова. - М.: МГУ, 1990. – 232 с.
11.Максимов А.А. Многолетние колебания численности животных, их причины и прогноз. - Новосибирск: Наука, 1984. - 250с.
12.Максимов А.А., Ердаков Л.Н. Циклические процессы в сообществах животных (биоритмы, сукцессии). - Новосибирск: Наука, 1985. – 236 с.
13.Никитин А.Я. Динамика численности моно- и гетероклональных экспериментальных популяций двух видов рода Daphnia (Cladocera, Crustacea). Автореф. дис...канд. биол. наук. - Иркутск, 1986.- 23 с.
14.Никитин А.Я., Антонова А.М., Чистофорова Г.А., Кульшина Т.М., Сосунова И.А. Динамика заболеваемости, эпидемиологический прогноз и профилактика иксодовых клещевых боррелиозов в Иркутске // Бюл.ВСНЦ СО РАМН. – 2002. - № 3, Т.2.- С.56-60.
15.Никитин А.Я., Антонова А.М., Чистофорова Г.А., Кульшина Т.М., Сосунова И.А. Прогноз динамики заболеваемости населения Иркутска клещевым энцефалитом // Бюл.ВСНЦ СО РАМН. – 2002. - № 4, Т.2.- С.83-86.
70
16.Поллард Дж. Справочник по вычислительным методам статистики. - М.: Финансы и статистика, 1982. – 344 с.
17.Статистика: Учебник / Под ред. В.С. Мхитаряна. - М.: Мастерство, 2001. –
272с.
18.Статистика: Учебник / Под ред.проф. И.И. Елисеевой. - М.: ВИТРЭМ, 2002. –
448с.
19.Теория статистики: Учебник /Под ред. проф. Р.А.Шмойловой. - М.: Финансы и статистика, 2002. – 560 с.
20.Уильямсон М. Анализ биологических популяций. - М.: Мир, 1975. – 271с.
21.Уиттекер Р. Сообщества и экосистемы. - М.: Прогресс, 1980.- 327с.
22.Урбах В.Ю. Биометрические методы. - М.: Наука, 1964. – 415 с.
71
Краткий словарь основных понятий и терминов
•Автокорреляция – корреляционная зависимость между соседними уровнями временного ряда.
•Авторегрессия – регрессия, учитывающая влияние предыдущих уровней ряда на последующие.
•Амплитуда колебаний – размах изменчивости уровней ряда, обычно выражаемый стандартным отклонением, дисперсией или коэффициентом вариации.
•Аналитическое выравнивание ряда проводится при помощи математических формул, отражающих общую тенденцию ряда, представляет его простейшую модель.
•Биометрия – наука о применении математических методов для изучения живых существ.
•Вариация – колеблемость, многообразие, изменчивость величины признака у отдельных единиц совокупности.
•Временной ряд динамики – ряд числовых значений (уровней) определенного статистического показателя, характеризующего изменения изучаемого явления за определенные промежутки времени.
•Выборочные наблюдения – несплошные наблюдения, при которых статистическому обследованию подвергаются единицы изучаемой совокупности.
•Высокочастотные колебания – с малым периодом (высокой частотой). Крайний их случай - пилообразная кривая, в которой период равен двум интервалам используемого масштаба измерения времени.
•Гауссовское (нормальное) распределение – одновершинное, колоколообразное, содержит в пределах 3 стандартных отклонений 99,75 % всех наблюдений. При статистической обработке могут применяться параметрические и непараметрические методы анализа, однако первые являются более мощными.
•Генеральная выборка – совокупность всех единиц исследуемого явления (процесса).
•Дисперсия, среднее квадратическое отклонение (стандартное отклонение), коэффициент вариации, размах вариации и др. -– статистические параметры, используемые при описании амплитуды колебаний уровней ряда.
72
•Закономерности распределения – закономерности изменения частот в вариационных рядах.
•Интерполяция – приближенный расчет уровней, лежащих внутри ряда, но неизвестных.
•Комбинированный временной ряд – включает кроме случайной компоненты, не менее двух других составляющих (например, тренд и циклическую компоненту, две различных циклических и т.д.)
•Корреляционная связь – сопряженное изменение уровней (признаков = наблюдений) двух и более рядов. Прямая связь (положительная) – с увеличением (уменьшением) значений уровней одного ряда наблюдения другого ряда увеличиваются (уменьшаются). Обратная связь (отрицательная) - с увеличением (уменьшением) значений уровней одного ряда наблюдения другого ряда уменьшаются (увеличиваются).
•Коэффициент детерминации показывает, на сколько процентов вариация зависимой переменной объясняется изменчивостью факторных признаков, вошедших в модель, описывающую процесс.
•Коэффициент регрессии (bi) показывает, насколько в среднем изменяется значение зависимой переменной при изменении независимой (факторной) на одну единицу собственного измерения.
•Кривая распределения – графическое изображение в виде непрерывной линии изменения частот в вариационном ряду.
•Лаг – промежуток времени отставания одного явления от другого, связанного с ним.
•Линейная связь – статистическая связь между явлениями, выраженная уравнением прямой линии регрессии.
•Линейный коэффициент корреляции определяет тесноту и направление связи между двумя коррелируемыми признаками.
•Множественная регрессия – модель связи трех и более признаков
•Множественный коэффициент корреляции отражает связь между зависимой переменной и несколькими факторными признаками.
•Модель процесса – описание основной тенденции процесса (тренда) с помощью математического уравнения.
73
•Мультиколлинеарность – наличие тесной зависимости между факторными признаками (>80 %).
•Негауссовское (ненормальное) распределение – не обладающее свойствами нормального (например, пуассоновское, биноминальное и др.). При статистической обработке нельзя применять параметрические методы.
•Нелинейная связь – описывается уравнением параболы, гиперболы, синусоиды и т.п.
•Непараметрические методы – используются при статистической обработке рядов с распределением, отличающимся от нормального (гауссовского).
•Нестационарный ряд – содержит нециклический тренд и/или закономерно меняющуюся со временем амплитуду колебаний.
•Низкочастотные колебания – с большим периодом (низкой частотой).
•Объем совокупности – число ее единиц.
•Основная тенденция (тренд) – достаточно плавное и устойчивое изменение уровней явления во времени. Тренд можно представить либо аналитически – в виде описывающего его уравнения (модели), либо графически.
•Осцилляции – закономерные (неслучайные) колебания.
•Ошибка выборочного наблюдения – разность между величиной параметра в генеральной совокупности и его величиной, вычисленной по результатам выборочного наблюдения.
•Параметрические методы – используются при статистической обработке рядов с распределением близким к нормальному (гауссовскому). В этом случае они являются более мощными, чем непараметрические методы.
•Парная регрессия – аналитическое выражение зависимости двух признаков.
•Переменные – это то, что можно измерять и оценивать в исследованиях. Значения независимой переменной не выбираются экспериментатором и обычно откладывается на графиках, отображающих связь двух явлений или процессов, по оси ординат (Y). Значения зависимой переменной контролируются или задаются экспериментатором и откладываются на графиках по оси абсцисс (Х).
•Период – интервал времени между двумя уровнями с одинаковой фазой (равен двум фазам).
•Перспективный прогноз – экстраполяция уровней временного ряда за пределы известных значений (в будущее).
74
•Пилообразная кривая – интервал времени между фазами равен единице, период равен двум единицам принятого масштаба измерений.
•Преобразования (трансформация) – определенное математическое изменение значений уровней ряда или параметров модели, выполненное для их приведения в соответствие с определенными условиями (например, нормальность распределения, стационарность и т.д.)
•Причинно-следственные отношения – связь явлений и процессов, когда изменения одного из них – причины – ведет к изменению другого – следствия. Функциональная связь – связь, при которой определенному значению факторного признака соответствует строго определенное значение результативного признака.
•Ранг – порядковый номер значения признака (уровня ряда = наблюдения), когда они расположены в порядке возрастания (убывания).
•Ранжирование – процедура упорядочения объектов изучения путем их построения в порядке возрастания (убывания).
•Регрессионный анализ – аналитическое выражение связи (с помощью уравнения = модели процесса), в которой изменение одной величины – результативного признака (зависимой переменной) – обусловлено влиянием одной или нескольких независимых переменных (факторов). Причем, множество других факторов, влияющих на зависимую переменную, принимается за постоянные и берется по их средней величине.
•Результативный признак – изменяющийся под действием факторных признаков.
•Ретроспективный прогноз – прогноз известных уровней ряда (в прошлое) для проверки качества модели.
•Сезонная компонента – внутригодичные колебания, имеющие более или менее регулярный характер.
•Смыкание рядов динамики – один из методов приведения несопоставимых рядов к сопоставимым путем прямого пересчета уровней с помощью специальных коэффициентов (индексов) или относительных величин.
•Спектральный анализ (разложение в ряд Фурье = гармонический анализ) дает возможность выделить периодические (сезонные) колебания.
75
•Средняя арифметическая, средняя хронологическая, средняя гармоническая, средняя геометрическая и др. - статистические параметры, используемые при описании центральной тенденции ряда.
•Стационарный ряд – ряд имеющий постоянную амплитуду колебаний вокруг постоянной по величине средней тенденции (с отсутствующим нециклическим трендом).
•Уровень ряда динамики – абсолютная (относительная, средняя) величина каждого члена (наблюдения) динамического ряда.
•Фаза – интервал времени между двумя соседними экстремальными точками.
•Факторный признак (предиктор = независимая переменная) – признак, оказывающий влияние на изменение результативного (зависимая переменная).
•Флуктуации – случайные колебания.
•Частный коэффициент корреляции показывает степень тесноты связи между двумя признаками при фиксированном значении остальных факторных признаков, входящих в модель процесса.
•Экстраполяция - нахождение уровней за пределами изучаемого временного ряда.
76
ПРИЛОЖЕНИЯ
Приложение 1 Минимальные значения коэффициентов автокорреляции (ra), при которых можно считать, что данные в ряду взаимозависимы (наблюдения в ряде неслучайны)
Число наблюде- |
Положительные значения ra |
Отрицательные значения ra |
||
ний во времен- |
Уровни значимости (Р) |
Уровни значимости (Р) |
||
ном ряду (n) |
0,05 |
0,01 |
0,05 |
0,01 |
|
||||
5 |
0,253 |
0,297 |
-0,753 |
-0,798 |
|
|
|
|
|
6 |
0,354 |
0,447 |
-0,708 |
-0,863 |
|
|
|
|
|
7 |
0,370 |
0,510 |
-0,674 |
-0,799 |
|
|
|
|
|
8 |
0,371 |
0,531 |
-0,625 |
-0,764 |
|
|
|
|
|
9 |
0,366 |
0,533 |
-0,593 |
-0,737 |
|
|
|
|
|
10 |
0,360 |
0525 |
-0,564 |
-0,705 |
|
|
|
|
|
11 |
0,353 |
0515 |
-0,539 |
-0,679 |
|
|
|
|
|
12 |
0,348 |
0,505 |
-0,516 |
-0,655 |
|
|
|
|
|
13 |
0,341 |
0,495 |
-0,497 |
-0,634 |
|
|
|
|
|
14 |
0,335 |
0,485 |
-0,479 |
-0,615 |
|
|
|
|
|
15 |
0,328 |
0,475 |
-0,462 |
-0,597 |
|
|
|
|
|
20 |
0,299 |
0,432 |
-0,399 |
-0,524 |
|
|
|
|
|
25 |
0,276 |
0,398 |
-0,356 |
-0,473 |
|
|
|
|
|
30 |
0,257 |
0,370 |
-0,324 |
-0,433 |
|
|
|
|
|
35 |
0,242 |
0,347 |
-0,300 |
-0,401 |
|
|
|
|
|
40 |
0,229 |
0,329 |
-0,279 |
-0,376 |
|
|
|
|
|
45 |
0,218 |
0,313 |
-0,262 |
-0,256 |
|
|
|
|
|
50 |
0,208 |
0,301 |
-0,248 |
-0,339 |
|
|
|
|
|