- •1. Введение в анализ временных рядов
- •1.1. Временные ряды и требования, предъявляемые к ним
- •1.2. Основные показатели динамики экономических явлений
- •1.3. Компонентный состав временного ряда
- •1.4. Некоторые элементы теории случайных процессов
- •2. Определение общей тенденции временного ряда
- •2.1. Виды тенденций и проверка гипотезы о существовании тенденции
- •Расчет вспомогательных характеристик
- •2.2. Методы выделения общей тенденции временного ряда
- •2.2.1. Механическое сглаживание
- •2.2.2. Аналитическое выравнивание временных рядов
- •2.2.3. Гармонический анализ
- •3.1. Проверка гипотезы о правильности выбора вида тренда
- •3.2. Проверка гипотезы о независимости случайного компонента
- •3.3. Проверка гипотезы о нормальности случайного компонента
- •4. Описание стационарных временных рядов с помощью авторегрессионной модели
- •4.1. Оценка параметров авторегрессионной модели
- •4.2. Определение порядка авторегрессии
- •5. Прогнозирование экономических показателей
- •5.1. Простейшие приемы экстраполяции
- •5.2. Прогнозирование экономических показателей с помощью кривых роста
- •5.3. Прогнозирование экономических показателей с помощью авторегрессионных моделей
- •6. Статистический анализ сезонной компоненты
- •6.1. Методы выявления периодической компоненты
- •6.3. Прогнозирование явлений с помощью индексов сезонности
- •8. Корреляция и регрессия рядов динамики
- •8.1.Простая корреляция и регрессия рядов динамики
- •8.2. Множественная корреляция и регрессия рядов динамики
- •Тест для самопроверки
8.2. Множественная корреляция и регрессия рядов динамики
В большинстве случаев экономические явления редко развиваются индивидуально, они образуют целые комплексы, где одно самостоятельное явление влияет на другие или само подчиняется влиянию других явлений. Для исследования влияния ряда явлений на одно результативное явление применяется множественный корреляционно-регрессионный анализ, который подробно рассматривается в курсах „Многомерные статистические методы в экономике" и „Эконометрика".
В качестве уравнения регрессии наиболее часто используется
линейная функция
y= а0 + а1х1 + а2х2 + ... + аnхn, (8.9)
коэффициенты которой обычно определяются методом наименьших
квадратов.
При построении многофакторных моделей, полученных по временным рядам, возникают две проблемы — автокорреляция и мультиколлениарность. Как отмечалось выше, для оценки параметров модели (8.9) используется метод наименьших квадратов, который основывается на предпосылке независимости друг от друга отдельных наблюдений по одной и той же переменной. В большинстве случаев в экономических временных рядах последовательные наблюдения зависят друг от друга, т. е. между ними существует автокорреляция, в условиях которой метод наименьших квадратов дает неоптимальные оценки параметров регрессии. Для устранения автокорреляции в качестве важнейшей меры рекомендуется исключить тенденции из временных рядов. Другой способ уменьшения автокорреляции основан на включении фактора времени в уравнение множественной регрессии (8.9). Этот прием приводит к частичному устранению автокорреляции лишь при условии, что все рассматриваемые временные ряды имеют
одинаковую тенденцию.
Автокорреляцию в наблюдениях ε1,ε2, ε3, ..., εп можно объяснить следующими причинами:
в изменении изучаемых величин имеется тенденция разви тия;
в модели регрессии учтены не все факторы, оказывающие
существенное влияние на величину результата;
3) неправильно выбрана форма связи между зависимой и не зависимой переменными;
4) в модели не учтен ряд факторов, влияние каждого из которых несущественно, но когда их изменения по направлению и фазе совпадают, в отклонениях может возникнуть автокорреляция;
5) наличие ошибок измерения в независимых переменных.
Наиболее распространенным приемом выявления наличия автокорреляции служит использование критерия Дарбина — Уотсона (см. п. 3.2.). Другое необходимое условие получения оптимальных оценок параметров модели (8.9) — отсутствие среди х, линейно зависимых, факторов. Нарушение этого условия ведет к возникновению явления мультиколлениарности.
Одним из практических методов выявления мультиколлениарности служит определение парного коэффициента корреляции
rxiх = (xiхj - xiхj )/ σiσj
Если значение коэффициента по абсолютной величине превышает 0,8, то факторы считаются мультиколлениарными. Для устранения мультиколлениарности необходимо первоначально выяснить основные причины ее возникновения. Они могут заключаться в следующем.
1. В качестве независимых переменных выбраны показатели, характеризующие один и тот же признак (стоимость основных фондов, численность рабочих и т. д. между собой коррелированы, так как они являются характеристиками размера предприятия).
2. Неоднородность совокупности исходных данных(если совокупность состоит из двух частей , каждая из которых формировалась при различных условиях, то высокая корреляционная связь между переменными может быть обусловлена случайным положением изменений переменных в одной совокупности по сравнению с другой).
3.Использование в качестве независимых переменных величин ,сумма которых –постоянное число(удельные веса, проценты и т.д.).
4.Наличие независимых переменных, отнесенных к одному и тому же признаку.
5.Присутствие исходных данных, представляющих собой последовательности, имеющие в своей динамике закономерные компоненты.
Устранение мультиколлениарности в первую очередь связано с исключением из модели регрессии одной или нескольких связанных независимых переменных. Если же имеются сомнения относительно того, какую из линейно связанных переменных оставить в модели, то можно применить процедуру пошаговой регрессии. Другой путь устранения эффекта мультиколлениарности состоит в преобразовании независимых переменных в новые переменные не коррелированные между собой. Для этого можно использовать метод главных компонент и факторный анализ. Эти методы подробно рассмотрены в курсе „Многомерные статистические методы".
Пример 8.1. Для выяснения тесноты связи между явлениями были взяты следующие данные: xt — объем промышленной продукции региона; yt — объем продукции сельского хозяйства региона (табл. 8.1)
Таблица 8.1
Объемы промышленной и сельскохозяйственной продукции
региона за 1993 — 2000 гг.
Год |
x1 |
y1 |
x-xsr |
y-y1sr |
(x-xsr)*(y-ysr) |
(x-xsr)^2 |
(y-ysr)^2 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1993 |
248,3 |
70,9 |
-106,7 |
-9,8 |
1045,6 |
11384,9 |
95,8 |
1994 |
285,9 |
77,0 |
-69,1 |
-3,7 |
255,7 |
4774,8 |
13,6 |
1995 |
322,8 |
78,1 |
-32,2 |
-2,6 |
83,7 |
1036,8 |
6,7 |
1996 |
345,0 |
81,6 |
-10,0 |
0,9 |
-9,0 |
100,0 |
0,8 |
1997 |
374,3 |
78,7 |
19,3 |
-2,0 |
-38,6 |
372,5 |
4,0 |
1998 |
395,7 |
87,0 |
40,7 |
6,3 |
256,4 |
1656,5 |
39,9 |
1999 |
420,0 |
87,9 |
65,0 |
7,2 |
468,0 |
4225,0 |
52,0 |
2000 |
448,0 |
84,3 |
93,0 |
3,6 |
334,8 |
8649,0 |
13,1 |
итого |
2840,0 |
645,5 |
- |
- |
2395,7 |
32199,5 |
225,9 |
Рассчитав коэффициент корреляции по формуле (8.2), получим:
rху = 0,877,
что говорит о сильной взаимосвязи между этими явлениями. Однако на тесноту связи во временных рядах влияет зависимость каждого последующего уровня от предыдущего, т. е. прежде чем коррелировать ряды динамики (по уровням), необходимо проверить каждый ряд на наличие или отсутствие в них автокорреляции (см. п. З.2.). В случае ее наличия между уровнями ряда она должна быть устранена. Используя формулу (1.9), рассмотрим коэффициент корреляции между рядом Хt (см. табл. 8.1, графу 2) и рядом Хt + 1 (t= 1, 2, ..., n + 1). Проведенная проверка показала, что для ряда Хt r1 = 0,996, а для ряда Уt r1 = 0,488. Это означает, что в исследуемых рядах существует автокорреляция.
Таким образом, чтобы сделать обоснованные статистические выводы о взаимосвязи исследуемых рядов, необходимо устранить автокорреляцию. Одним из способов ее устранения является исключение из анализируемых рядов их тенденций развития и вычисление корреляции между отклонениями от выровненных уровней(тренда) по формуле (8.3).Все вычисления представлены в табл.8.2.Коэфициент корреляции для рядов отклонений равен 0,22.Это говорит о том, что между данными рядами существует ложная корреляция. Для ряда Хt выражается уравнением прямой Хt =231,3+27,5t
А для ряда Уt - yt =71.7+2t
Таблица 8.2
Вычисление коэффициента корреляции для отклонения
год |
x |
xsr |
x-xsr |
(x-xsr)^2 |
y |
ysr |
Y-ysr |
(y-ysr)^2 |
(x-xsr)* (Y-ysr) |
1993 |
248.3 |
258.8 |
-10.5 |
110.3 |
70.9 |
73.7 |
-2.8 |
7.8 |
29.4 |
1994 |
285.9 |
286.3 |
-0.4 |
0.2 |
77.0 |
75.7 |
1.3 |
1.7 |
-0.5 |
1995 |
322.8 |
313.8 |
9.0 |
81.0 |
78.1 |
77.7 |
0.4 |
0.2 |
3.6 |
1996 |
345.0 |
341.3 |
3.7 |
13.7 |
81.6 |
79.7 |
1.9 |
3.6 |
7.0 |
1997 |
374.3 |
368.8 |
5.5 |
30.3 |
78.7 |
81.7 |
-3.0 |
9.1 |
-16.6 |
1998 |
395.7 |
396.3 |
-0.6 |
0.4 |
87.0 |
83.7 |
3.3 |
10.9 |
-2.0 |
1999 |
420.0 |
423.8 |
-3.8 |
14.4 |
87.9 |
85.7 |
2.2 |
4.8 |
-8.4 |
2000 |
448.0 |
451.3 |
-3.3 |
10.9 |
84.3 |
87.7 |
-3.4 |
11.6 |
11.2 |
итого |
2840.0 |
2840.4 |
- |
- |
645.5 |
645.6 |
- |
49.7 |
23.7 |
Исходя из высшее изложенного можно сделать следующие выводы. При применении корреляционно - регрессионного анализа для выявления связи между явлениями необходимо обращать внимание на соответствие начальным данным предпосылкам такого анализа.
При выявлении факторов, оказывающие влияние на исследуемый процесс, и выборе формы их связи следует проводить подробный экономический анализ. Необходимо иметь в виду то, что анализом нельзя охватить весь комплекс существенных явлений т. е. является экспериментом нахождения конкретной формы связи между явлениями. Следует помнить, что начальные данные практически всегда представляют собой выборочную совокупность, поэтому результаты анализа всегда имеют вероятный характер. Следовательно, необходима их статистическая оценка с помощью различных критериев, которые рассматриваются в курсе «Эконометрика»