Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
EMM_MAMAEVA.pdf
Скачиваний:
230
Добавлен:
27.03.2015
Размер:
1.08 Mб
Скачать

Следует отметить, что необходимость выявления и устранения мультиколлинеарности определяется целями исследования. Если основная

задача–прогнозирование по модели, то при достаточно большом коэффициенте детерминации наличие мультиколлинеарности чаще всего не сказывается на прогнозных качествах модели, если и в будущем между коррелированными переменными будут сохраняться те же отношения, что и ранее.

Если же целью исследования является определение степени влияния

переменных на результативный показатель, то наличие мультиколлинеарности, приводящее к увеличению стандартных ошибок, наверняка исказит истинные зависимости между переменными. В этом случае необходимо подумать об устранении мультиколлинеарности.

Для устранения мультиколлинеарности или ее уменьшения используют различные приемы:

увеличение объема выборки, так как это ведет к уменьшению

дисперсии оценок МНК.

исключение из уравнения одной или нескольких объясняющих переменных. В этом случае возникает следующая проблема: возможно переменные были включены на теоретической основе и будет неправомочным их исключение только лишь для того, чтобы сделать статистические результаты лучше. Существуют и другие способы устранения или уменьшения влияния мультиколлинеарности. Единого метода устранения мультиколлинеарности, пригодного для любого случая, не существует. Это связано с тем, что причины

ипоследствия мультиколлинеарности неоднозначны и во многом зависят от

выборки.

5. Моделирование временных рядов

5.1. Введение в анализ временных рядов

Наблюдения над некоторым явлением, характер которого меняется во

времени, порождает упорядоченную последовательность значений некоторой числовой характеристики этого явления, называемую временным рядом.

Значение исследуемой величины в каждый момент времени (или временной интервал) t называется уровнем ряд. Число уровней определяет длину временного ряда..

Теоретически измерения уровней ряда могут регистрироваться

непрерывно (временные ряды с непрерывным временем), но обычно они

осуществляются через равные промежутки времени (дискретные ряды) и

нумеруются аналогично выборке объема n : Yt1 ,Yt2 ,....Ytn . В экономической

практике моменты времени, в которые проводились наблюдения, часто даны заранее, что приводит к рассмотрению рядов дискретного типа.

Характерным для временного ряда

является

то, что порядок в

последовательности t ,t

2

,....t

n

существен для анализа, т.е.

время выступает как

1

 

 

 

 

41

один из определяющих факторов. Это отличает временной ряд от случайной выборки Y1,Y2 ,.....,Yn , где индексы служат лишь для удобства идентификации.

Можно привести множество примеров временных рядов, появляющихся в

реальной действительности: потребление товаров в течение ряда лет; данные о

населении какой-либо страны, полученные при проведении регулярных переписей; количество осадков за определенные периоды времени и т. д.

К уровням временного ряда предъявляется ряд требований: должны быть сопоставимы, сформированы по одним методикам, иметь одинаковые единицы измерения и один шаг наблюдений.

Применяемые при обработке временных рядов методы во многом опираются на методы и характеристики, разработанные математической статистикой. Последние базируются на достаточно жестких требованиях к исходным данным (таким как однородность данных, предположения о типе их распределения и т. д.). В то же время при исследовании временных рядов

(особенно экономических данных) проверка выполнимости этих требований в

должной мере зачастую невозможна. Поэтому выводы, полученные на базе формально-статистического инструментария, должны восприниматься с осторожностью и дополняться содержательным анализом.

Как уже отмечалось, в моделях временных рядов имеется всего одна независимая переменная t – время., т.е. это однофакторные модели Y F(t) ,

Во временном ряду принято выделять две основные составляющие: детерминированную (систематическую) – F(t)и случайную (остаточную) –

(t) . Под детерминированной составляющей временного ряда понимают

числовую последовательность, элементы которой вычисляются по

определенному правилу как функция времени t .

Исключив детерминированную составляющую из данных, мы получим

колеблющийся вокруг нуля ряд, который может в одном случае представлять случайные скачки, а вдругом – плавное колебательное движение.

Детерминированная составляющая может содержать следующие

структурные компоненты: S(t),T (t),C(t), где

Tt – тренд, или систематическое движение; St– сезонная составляющая (колебания около тренда с периодом менее года); Ct –циклическая составляющая (колебания относительно тренда с периодом более года).

Эти составляющие необязательно все одновременно присутствуют во

временном ряду, в то время как случайная компонента всегда присутствует во

временном ряду.

Следует отметить, что предположение о независимом действии

указанных составляющих является чрезмерным упрощением. В зависимости от

структуры временного ряда строят различные модели временных рядов.

При анализе временных рядов в отличие от регрессионного анализа, мы

располагаем не N реализациями случайной переменной, а одной реализацией случайного процесса. Поэтому важное значение в анализе временных рядов имеет понятие стационарности ряда.

Временной ряд называется стационарным если его вероятностные

42

свойства не изменяются во времени, т. е. закон распределения и его числовые характеристики не зависят от t.

Исследователя, как правило, интересуют не распределения, а лишь некоторые числовые характеристики (средние значения, дисперсия и пр.).

Поэтому на практике чаще используется понятие слабой стационарности или

стационарности в широком смысле. В этом случае стационарность связывают с независимостью числовых характеристик от времени. (среднего, дисперсии, ковариации).

Уровни стационарного временного ряда колеблются около среднего уровня, причем эти колебания носят случайный характер, поэтому в стационарном ряду отсутствует тенденция.

В экономике встречаются как стационарные, так и нестационарные временные ряды, т. е. ряды с тенденцией. Выявление и оценка основной

тенденции развития экономического процесса является важнейшей задачей

исследования временных рядов.

5.2. Предварительный анализ временных рядов.

Предварительный анализ временных рядов экономических показателей включает в основном:

выявление аномальных наблюдений;

проверку наличия тренда;

сглаживание временных рядов;

расчет показателей развития динамики экономических процессов.

Выявление аномальных уровней (т.е. резко выделяющихся,

нетипичных для данного ряда наблюдений). Аномальные наблюдения проявляются в виде сильного изменения уровня – скачка или спада – с последующим приблизительным восстановлением предыдущего уровня. Наличие аномалии может резко искажать результаты моделирования.

Причинами аномальных наблюдений могут быть ошибки технического

порядка, или ошибки первого рода: ошибки при агрегировании и дезагрегировании показателей, при передаче информации и другие технические

причины. Сюда же можно отнести значения, связанные с различными катастрофическими явлениями, не влияющими, однако, на дальнейший ход

развития процесса. Ошибки первого рода подлежат выявлению и устранению.

Кроме того, аномальные уровни во временных рядах могут возникать из-

за воздействия факторов, имеющих объективный характер, но проявляющихся эпизодически, очень редко – это ошибки второго рода; они устранению не

подлежат.

Для выявления аномальных уровней можно использовать простейшие

методы: визуальный просмотр, графический анализ, а также специально разработанные методы, например, метод Ирвина9.

9 Федосеев В.В., Гармаш А.Н., Дайитбегов Д.М., Орлова И.В., Половников В.А. Экономико-

математические методы и прикладные модели: Учеб. пособие для вузов / Под ред. В.В.Федосеева. М.: ЮНИТИ, 1999

43

Суть метода состоит в следующем:

для всех или только для подозреваемых в аномальности наблюдений

 

 

 

 

 

n

 

 

 

 

 

 

y y

 

 

( yt y)2

 

1

n

 

 

 

 

 

вычисляется величина t : t

 

 

, где Sy

 

 

 

yt .

 

t t 1

 

t 1

 

, y

 

 

Sy

 

n 1

 

 

 

 

 

 

n t 1

Если рассчитанная величина

 

t превышает

табличный

 

уровень (см.

таблицу 13 ) то уровень yt считается аномальным.

При выявлении аномальных значений первого рода требуется корректировка временного ряда. Обычно аномальные значения заменяют средним арифметическим значением двух соседних уровней, либо

соответствующими значениями по кривой, аппроксимирующей данный временной ряд и пр.

Выявление тенденции во временном ряду.

При практических исследованиях временных рядов различают тенденцию трех видов:

1. Тенденция среднего уровня или тренд (аналитически выражается в виде некоторой функции F(t) вокруг которой варьируют эмпирические

значения признака).

2.Тенденцию дисперсии – это изменение отклонений эмпирических

значений признака от среднего уровня исходного ряда динамики.

3.Тенденцию автокорреляции – это изменение корреляционной зависимости между последовательными уровнями исходного ряда динамики.

Под трендом (или тенденцией) понимается устойчивое систематическое

изменение процесса в течение продолжительного времени. Не существует

"автоматического" способа обнаружения тренда во временном ряду. Однако, если тренд является монотонным (устойчиво возрастает или устойчиво убывает), то анализировать такой ряд обычно нетрудно (визуальный просмотр,

графический анализ).

Если временные ряды содержат значительную ошибку, то для выявления тренда приходится прибегать к специальным приемам и методам (метод

проверки разности средних уровней, метод Фостера - Стьюарта, критерий восходящих и нисходящих серий и пр., а также методы сглаживания10).

Метод Фостера –Стьюарта.

Этот метод кроме тренда самого ряда (тренда в среднем), позволяет установить наличие тренда дисперсии временного ряда (если тренда дисперсии

нет, то разброс уровней ряда постоянен )

1. Производится сравнение каждого уровня исходного временного ряда, начиная со второго уровня, со всеми предыдущими, при этом определяются две

числовые последовательности:

1,

если

Yt Yt 1,Yt 2 , Y1

Ut

 

 

случае

0,в противном

10 Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики.-М. Юнити,1998, с.803

44

1,если

Yt Yt 1,Yt 2 , Y1

 

Vt

противном

случае

 

0,в

 

2. Вычисляются величины K и L:

 

n

Vt )

и

n

(5.1)

K (Ut

L (Ut Vt )

t 1

 

 

t 1

 

Нетрудно заметить, что величина K принимает значения от 0 (все уровни ряда равны между собой) до (n-1) (ряд монотонный). Соответственно величина

L изменяется

от -(п-1) (ряд монотонно убывает)

до

(n-1) (ряд монотонно

 

 

n

n

возрастает).

L принимает нулевое значение, если

Ut Vt =0, т. е. когда

 

 

t 1

t 1

тренд отсутствует. В этом случае ряд как бы распадается на равные части с разными тенденциями.

3. Третий этап заключается в проверке гипотез: можно ли считать случайными отклонение величины K от величины — математического

ожидания величины K для ряда, в котором уровни расположены случайным образом; отклонение величины L от нуля.

Эта проверка проводится с использованием расчетных значений t- критерия Стьюдента для средней и для дисперсии

Вычислим значения соответствующих t–статистик:

tK

 

 

K K

 

 

 

и tL

 

 

 

L

 

 

, где

 

 

- математическое ожидание случайной

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

K

L

k

 

 

 

 

 

 

 

 

 

величины К; k -

среднее квадратическое отклонение случайной величины К;

L - среднее квадратическое отклонение случайной величины L.

Значения

, k ,

L

протабулированы для различных значений n и ,

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

где n – число наблюдений), –

уровень статистической значимости. Для

=0,05 данные приведены в следующей таблице 3..

 

Таблица 3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Табулированные значения величин k ,

k , L при 0,05

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

K

 

 

K

L

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

 

 

 

 

 

 

3.703

 

 

1.242

1.927

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

3.858

 

 

1.288

1.964

 

 

 

 

 

 

 

 

 

15

 

 

 

 

 

 

4.636

 

 

1.521

2.153

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

5.191

 

 

1.677

2.279

 

 

 

 

 

 

 

 

 

30

 

 

 

 

 

 

5.990

 

 

1.882

2.447

 

4. Расчетные значения статистики Стьюдента сравниваются с

табличными при выбранной доверительной вероятности и числе степеней

свободы (n-2)

Если t L tтеор , то с выбранной вероятностью можно говорить о наличии тренда в среднем. Если tk tтеор , то имеется тенденция в дисперсии

Пример1. Задан временной ряд для экономического показателяY (t) (объем выпуска продукции). Исходные данные представлены следующей

45

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]