Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебники 8015

.pdf
Скачиваний:
2
Добавлен:
01.05.2022
Размер:
297.86 Кб
Скачать

случайных отклонений (возмущений) наиболее часто встречается в регрессионном анализе при использовании данных упорядочены во времени (такие данные получили название временных рядов или рядов динамики), при использовании пространственно упорядоченных данных наличие автокорреляции на практике встречается довольно редко.

На практике, как правило, если автокорреляция присутствует, то наибольшее влияние на наблюдение оказывает результат предыдущего наблюдения – так называемая автокорреляция первого порядка. Именно такой тип автокорреляции и изучался на лекциях. Отсутствие корреляции между соседними наблюдениями чаще всего служит достаточно надежным основанием считать, что корреляция отсутствует в целом и обычный МНК даст адекватные и эффективные результаты.

Методы обнаружения автокорреляции и методы ее устранения хорошо описаны в лекционном материале.

Вопросы для самоконтроля

1.Что такое автокорреляция?

2.Приведите графический пример положительной автокорреляции.

3.Приведите графический пример отрицательной автокорреляции.

4.Каковы причины появления автокорреляции?

5.Какие свойства оценок, получаемых по МНК, будут нарушаться если имеет место автокорреляция исходных данных.

6.Методы обнаружения автокорреляции.

7.Приведите графический пример обнаружения корреляции.

8.Какие методы исключения автокорреляции Вы знаете?

9.Как связан критерий Дарбина—Уотсона с линейным коэффициентом корреляции?

10.Условия применения критерия Дарбина—Уотсона.

Тема №6 «Анализ связи между атрибутивными признаками»

Изучение данной темы, как правило, затруднений не вызывает, необходимо только понять, что исследования экономических явлений могут потребовать количественного измерения тесноты связи между атрибутивными признаками.

Взаимосвязь между атрибутивными признаками анализируются посредством таблиц взаимной сопряженности. Они описывают комбинационные распределения совокупности по факторному признаку х и результативному у. Причем следует обратить внимание, что в качестве исходных данные будут фигурировать частоты повторений элементов статистической совокупности, удовлетворяющие определенным условиям, которые задаются факторным и результативным признаками.

11

Вопросы для самоконтроля

1.Приведите примеры, когда необходимо измерить тесноту связи между атрибутивными признаками.

2.Таблицы взаимной сопряженности.

3.Критерий Пирсона (χ2 Пирсона)

4.Коэффициент взаимной сопряженности Чупрова.

5.Коэффициент взаимной сопряженности Крамера.

6.Коэффициент ассоциации Д. Юла

7.Коэффициент контингенции К. Пирсона.

8.Коэффициент корреляции рангов Спирмена.

9.Коэффициенты конкордации Фехнера и Кендэла.

Тема №7 «Системы эконометрических уравнений»

Входе изучения данной темы необходимо обратить внимание на тот факт, что, как правило, социально-экономические явления и процессы, изучаемые в ходе эконометрического моделирования достаточно сложны и описываются не одним уравнением, а системой уравнений. Эти системы эконометрических уравнений могут строиться по-разному, в зависимости от конкретных условий моделирования. В принципе можно выделить три формы представления таких уравнений: система независимых уравнений, системы рекурсивных уравнений и система взаимозависимых уравнений, которая по-

лучила название системы совместных, одновременных уравнений.

Вэконометрической модели присутствуют две категории переменных эндогенные (зависимые) и экзогенные (независимые). Отнесение той или иной величины к эндогенным (зависимым) или экзогенным (независимым) переменным зависит от характера модели, так как экономические переменные могут выступать в одних моделях как эндогенные (зависимые), а в др у- гих как экзогенные (независимые) переменные.

Вданном случае следует обратить внимание на тот факт, что в качестве экзогенных (независимых) переменных могут рассматриваться значения эндогенных (зависимых) переменных за предшествующий период времени, так называемые лаговые переменные.

Структурная форма модели составляется на этапе спецификации эконометрической модели и позволяет увидеть влияние изменений любой экзогенной (независимой) переменной на значения эндогенной (зависимой) переменной. Структурная форма модели в правой части содержит неизвестные коэффициенты, которые необходимо определить. Непосредственное применение метода наименьших квадратов (МНК) в этом случае позволяет получить оценки неизвестных коэффициентов, которые не будут удовлетворять требованиям теоремы Гаусса-Маркова, то есть определенные таким образом коэффициенты будут смещенными и несостоятельными. Именно поэтому обычно для определения структурных коэффициентов модели структурная форма модели преобразуется в приведенную форму модели.

12

Приведенная форма модели представляет собой систему линейных функций эндогенных (зависимых) переменных от экзогенных (независимых), то есть по правилам алгебры система уравнений для решения должна содержать все известные в правой части, а неизвестные в левой. По своему виду приведенная форма модели ничем не отличается от системы независимых уравнений, параметры которой оцениваются традиционным МНК. Применяя МНК, можно оценить коэффициенты приведенной формы модели, а затем оценить значения эндогенных (зависимых y) переменных через экзогенные (независимые x). При переходе от приведенной формы модели к структурной исследователь сталкивается с проблемой идентификации.

Идентификация – это единственность соответствия между приведенной и структурной формами модели. В зависимости от условий задачи может возникнуть ситуация, когда имеется несколько вариантов для расчета структурных коэффициентов одной и той же модели. Это, как раз и будет характеризовать неполную идентификацию модели.

Модель будет считаться идентифицируемой в том случае, если число коэффициентов приведенной формы модели будет равно числу коэффициентов структурной формы модели. В том случае если число коэффициентов приведенной формы модели будет меньше числа коэффициентов структурной формы модели, эконометрическая модель будет неидентифицируемой, то есть такая модель непригодна для использования. Структурная модель в полном виде, содержащая n эндогенных (зависимых) и m предопределенных переменных в каждом уравнении системы, всегда неидентифицируема. Ну, а в том случае, когда число коэффициентов приведенной формы модели будет больше числа коэффициентов структурной формы модели, эконометрическая модель будет сверхидентифицируемой. В этом случае на основе коэффициентов приведенной формы можно получить два или более значений одного структурного коэффициента.

Сверхидентифицируемая модель в отличие от неидентифицируемой модели практически решаема, но требует для этого применения специальных методов.

Таким образом, важное значение приобретает получение условий, позволяющих заранее определить идентифицируема модель или же нет. Такие условия были поучены. Была доказана их необходимость и достаточность. Необходимым условием идентифицируемости модели является, так называемое счетное правило:

D + 1 = Н – уравнение идентифицируемо;

D + 1 < Н – уравнение неидентифицируемо;

D + 1 > Н – уравнение сверхидентифицируемо,

где Н – число эндогенных (зависимых) переменных в j-м уравнении (уравнение, которое проверяется) системы; D – число экзогенных (предопределенных) переменных, которые содержатся в системе, но не входят в данное уравнение.

13

Рассмотренное счетное правило отражает необходимое, но недостаточное условие идентификации. Более точно условия идентификации определяются, если накладывать ограничения на коэффициенты матриц параметров структурной модели.

Достаточное условие идентификации: уравнение идентифицируемо,

если по отсутствующим в нем переменным (эндогенным и экзогенным) можно из коэффициентов при них в других уравнениях системы получить матрицу, определитель которой не равен нулю, а ранг матрицы не меньше, чем число эндогенных (зависимых) переменных в системе без одного.

Обязательно необходимо вспомнить, что такое ранг матрицы.

Ранг матрицы – наивысший из порядков всевозможных ненулевых, то есть имеющих определитель отличный от нуля, миноров (матрица, получаемая из исходной вычеркиванием одной строки и одного столбца) этой матрицы.

Коэффициенты структурной модели могут быть оценены разными способами в зависимости от вида системы одновременных уравнений.

Наибольшее распространение получили следующие методы оценивания коэффициентов структурной модели:

косвенный метод наименьших квадратов;

двухшаговый метод наименьших квадратов;

трехшаговый метод наименьших квадратов;

метод максимального правдоподобия.

Косвенный метод наименьших квадратов (КМНК) применяется для идентифицируемой системы одновременных уравнений.

Двухшаговый метод наименьших квадратов (ДМНК) используется для оценки коэффициентов сверхидентифицируемой модели. Перечисленные методы оценивания также используются для сверхидентифицируемых систем уравнений.

В лекционном материале и соответствующей литературе подробно на примерах описаны особенности реализации косвенный метод наименьших квадратов и двухшаговый метод наименьших квадратов.

Вопросы для самоконтроля

1.В какой форме могут существовать системы эконометрических урав-

нений?

2.Что такое структурная форма эконометрических уравнений?

3.Что такое приведенная форма эконометрических уравнений?

4.В чем заключается проблема идентификации?

5.Каковы необходимые условия для идентификации уравнений моде-

ли?

6.Каковы достаточные условия для идентификации уравнений модели?

14

7.Какое максимальное количество параметров, подлежащих определению, будет иметь структурная форма модели, имеющая n эндогенных (зависимых) и m экзогенных (независимых) переменных?

8.Какое максимальное количество параметров, подлежащих определению, будет иметь структурная форма модели, имеющая n эндогенных (зависимых) и m экзогенных (независимых) переменных?

9.Какие способы уменьшения числа неизвестных параметров структурной формы эконометрической модели Вы знаете?

10.Когда эконометрическая модель будет идентифицируемой, неидентифицируемой и сверхидентифицируемой?

11.Что означает идентифицируемость, неидентифицируемомость и сверхидентифицируемомость эконометрической модели?

Тема №8. «Моделирование временных рядов»

Необходимо по лекционным материалам изучить определение и структуру модели временного ряда или ряда динамики. Необходимо подчеркнуть, что временные ряды уже изучались в курсе статистике 1 часть (общая теория статистики) и основные определения также используются и в эконометрике, но в этом случае вместо термина «ряд динамики» чаще все-таки используется название «временной ряд». Но следует еще раз напомнить основные понятия и определения.

Временно́й ряд (или ряд динамики) – собранный в разные моменты времени статистический материал о значении каких-либо параметров (в простейшем случае одного) исследуемого процесса. Каждая единица статистического материала называется измерением или отсчётом, также допустимо называть его уровнем на указанный с ним момент времени. Во временном ряде для каждого отсчёта должно быть указано время измерения или номер измерения по порядку. Временной ряд существенно отличается от простой выборки данных, так как при анализе учитывается взаимосвязь измерений со временем, а не только статистическое разнообразие и статистические характеристики выборки.

Необходимо повторить следующие разделы из курса «Статистика 1 часть»: основные элементы временного ряда; приведение рядов динамики к сопоставимому виду и основные приемы для этого; структура временного ряда моделирование тенденции временного ряда.

Особое внимание следует остановиться на приемах выравнивания временных рядов и целях для чего это делается. Необходимо уяснить, что в каждом временном ряду содержится три компоненты:

основная тенденция или тренд;

кратковременное систематическое движение или сезонные колебания;

несистематическое случайное движение.

На первых этапах исследования основной задачей исследователя является выявление тренда изучаемого явления, то есть выяснение основной тенденции. Для этой цели, первое, что необходимо сделать – нанести все стати-

15

стические данные на координатную плоскость. Причем необходимо очень тщательно выбрать масштаб представления имеющихся данных, так как неудачно выбранный масштаб может скрыть изучаемую тенденцию: на графике просто не увидишь имеющуюся тенденцию. Поэтому график должен быть наиболее крупным. Но даже это обстоятельство далеко не всего позволяет разглядеть имеющуюся тенденцию. В этом случае приходится прибегать к специальным способам выравнивания временных рядов

В курсе «Статистка 1 часть» изучалось четыре приема выравнивания: а) увеличение интервалов; б) вычисление средних уровней для увеличенных интервалах;

в) определение скользящей (подвижной) средней; г) аналитическое выравнивание.

Первые три изучались подробно, а последний, аналитическое выравнивание, относился к курсу «Эконометрики». Необходимо повторить особенности первых трех приемов выравнивания временны рядов (рядов динамики).

Следует иметь в виду, что приемы увеличение интервалов; вычисление средних уровней для увеличенных интервалах и определение скользящей (подвижной) средней, позволяют описать только качественно выявленную тенденции. Никаких количественных параметров в данном случае получить нельзя. Поэтому данные методы выравнивания дополняются методом аналитического выравнивания временного ряда, который позволяет получить аналитическое выражение, описывающее изучаемое явление.

Метод аналитического выравнивания по сути дела является парной корреляционной моделью, в которой в качестве факторного признака принимается время. В этом случае имеется возможность использовать алгоритм построения парной корреляционной модели.

Единственной особенностью в данном случае является способ задания времени. Принято, что нецелесообразно задаваться абсолютными значениями времени: датами или числом дней, часов или секунд, прошедших с момента события принятого за точку отсчета, гораздо разумнее обозначать временные интервалы или моменты времени, числами натурального ряда. В этом случае временной параметр ti будет во всех моделях принимать одни и те же значе-

ния: ti=1, 2, 3,….,Т.

Кроме того, следует обратить внимание на тот факт, что при изучении данных, упорядоченных во времени, наиболее часто встречается автокорреляция случайных отклонений (возмущений), поэтому исследования на выявлении этого явления все-таки являются обязательными,

Так же, как и при построении обычной корреляционной модели, следует проводит исследование на адекватность построенной модели с использованием t-критерия Стьюдента и F-критерия Фишера

Последующее изучение временного ряда осуществляется путем выяснения вопроса о наличии в ряду сезонной составляющей и ее измерении. Сделать это можно следующими способами:

16

а) метод абсолютных разностей; б) метод относительных разностей;

в) построение индексов сезонности; г) построение аналитической модели.

Так же, как и при выявлении тренда, первые три метода позволяют только установить наличие сезонных колебаний, но полное исследование модели в этом случае невозможно. Как правило, эти методы достаточно просты и их использование обычно затруднений не вызывает. А вот метод построения аналитической модели позволяет провести полное исследование модели сезонных колебаний, но он и достаточно сложен, хотя и представляет собой построение обычной парной корреляционной модели, в которой за факторный признак принимается время. Второй особенностью в этом случае является тот факт, что вид уравнения регрессии в этом случае практически задан: зависимость изучаемой переменной от времени задается рядом Фурье. В этом случае уравнение регрессии будет иметь следующий вид

Yt = a0 + k (ak coskt + bk sin kt)

i =1

где a0, ak, bk – параметры, которые подлежат определению; k – количество членов ряда Фурье. В литературе имеются формулы, согласно которым рассчитываются эти коэффициенты.

В данном случае основная сложность заключается в том, что ряд Фурье является бесконечным рядом, что для практического использования является препятствием. Возникает задач ограничить число членов ряда разумными пределами. Практика показывает, что обычно хватает 2 – 4 членов ряда. Для определения количества удерживаемых членов ряда Фурье задачу приходится решать несколько раз.

Первая итерация заключается в том, что в ряде Фурье удерживается только один член. Производят расчет и определяют суммарную ошибку аппроксимации в данном случае. Если эта ошибка будет незначительно, то на этом процесс вычисления останавливается. Если же ошибка будет значительной, то переходят к следующей итерации.

Вторая итерация. В ряде Фурье удерживается уже два члена ряда. Строят модель для этой аппроксимации и определяют ошибку. Сравниваю эту ошибку с ошибкой, полученной на предыдущей итерации. В том случае если точность решения повысилась незначительно, то есть смысл прекратить процесс вычисления. Если же полученная точность решения не устраивает, то переходят к следующей итерации, на которой уже рассматривают ряд Фурье, содержащий три члена.

Подобная процедура продолжается до тех пор, пока не будет достигнута точность необходимая для решаемой задачи.

Полученная модель позволяет выполнять прогнозирование социальноэкономических явлений во времени. И здесь очень важно иметь представле-

ние об интерполяции и экстраполяции.

17

Интерполяция – это нахождение отсутствующих промежуточных уровней временного ряда. Зная уравнение тренда для вычисления теоретических уровней и подставляя в него промежуточные значения t между заданными, можно определить отвечающий им теоретический уровень результативного фактора.

Экстраполяция используется при прогнозировании социальноэкономических явлений в будущем с предположением, что выявленная тен-

денция будет сохраняться и в дальнейшем за пределами исследуемого вре-

менного ряда. При этом значения t вне пределов динамического ряда подставляют в трендовое уравнение и получают точечное прогнозное значение уровня тренда Yпр будущем.

Практическая ценность точечного прогноза невелика. В целях повышения практической ценности полученных результатов необходимо на базе точечного прогноза определить доверительный интервал полученного прогностического значения, то есть определить интервал значений, в который прогнозируемая величина будет попадать с заданной вероятностью. Это выполняется по следующей формуле

Yt - tg σε Yпр Yt + tg σε

где tg – коэффициент доверия t-распределения Стьюдента, для вероятности

95% равен 1,96; σg =

(y -Yt )2

(n - m)

– остаточное среднее квадратическое от-

клонение; n – количество уровней рассматриваемого временного ряда; m – количество параметров теоретической зависимости тренда; (n m) — число степеней свободы; Yt – дискретное (точечное) значение прогнозного уровня.

Следует отметить одно важное обстоятельство: использование формулы для определения доверительного прогноза будет справедливо только в том случае, если исходная совокупность данных распределена по нормальному закону распределения. В большинстве случаев это все-таки соблюдается, но возможны отклонения, которые обесценивают приведенные здесь результаты.

Важным вопросом при моделировании временных рядов является вопрос о глубине прогнозирования, то есть на сколько периодов времени вперед возможен прогноз. В данном случае в этом вопросе так же имеется фундаментальное соотношение.

Если обозначить: T = t + τ – общий временной горизонт, где t – период наблюдений (предпрогнозный интервал), τ – период прогноза (интервала упреждения) собственно глубина прогнозирования. Тогда математическая статистика рекомендует, чтобы глубина прогнозирования определялась исходя из следующего соотношения

τt ≥ 3 t ≥ 3τ.

Таким образом:

18

если желаемый период прогноза τ=1 год, то величина периода наблюдений должна составить t ≥ 3 года, соответственно T ≥ 4 – общий временной горизонт;

если желаемый период прогноза τ=2 года, то величина периода на-

блюдений должна составить t ≥ 6 лет, соответственно T ≥ 8 – общий временной горизонт;

– если желаемый период прогноза τ=3 года, то величина периода наблюдений должна составить t ≥ 9 лет, соответственно T ≥ 12 – общий временной горизонт, и т.д.

Вопросы для самоконтроля

1.Из каких компонентов состоит набор статистических данных по которому строится эконометрическая модель?

2.Аналитическое выравнивание временного ряда.

3.Линейный и нелинейные тренды.

4.Расчет параметров тренда.

5.Моделирование сезонных колебаний.

6.Аддитивная и мультипликативная модели временного ряда.

7.Выравнивание ряда методом скользящей средней.

8.Расчет сезонной компоненты. Выделение тренда.

9.Методы определения сезонности.

10.Какие методы изучения и измерения сезонных колебаний Вы знаете?

Тема №9 «Адаптивные модели прогнозирования»

Тема рассматривается как факультативная, то есть необязательная. Выявление и анализ тенденции временного ряда часто производится с

помощью его выравнивания или сглаживания. Экспоненциальное сглаживание – один из простейших и распространенных приемов выравнивания ряда, с помощью которого осуществляется краткосрочное прогнозирование временных рядов.

Экспоненциальное сглаживание ряда осуществляется по рекуррентной формуле:

St=αxt+(1 – α)St-1

где xt – уровень временного ряда; St – экспоненциальная средняя, вычисленная для момента времени t; α – постоянная сглаживания.

Естественно, при использовании этой формулы возникает вопрос о том, как выбрать начальное приближение S0, которое появляется в формуле при t=1. Если к моменту начала вычислений нам известны более ранние данные, то в качестве начального значения S0 можно использовать арифметическую среднюю всех имеющихся данных или какой-то их части. Но такая ситуация достаточно редка, поэтому вопрос остается открытым: что же принимать за значение S0?

19

Достаточно часто в качестве начального значения S0 принимается средняя арифметическая первых нескольких членов ряда, например, 5 – 7. Таким образом, в данном случае уверенности в правильности выбора этого значения нет. Обычно в таких случаях используют более высокое значение постоянной сглаживания α, что обеспечивает быстрое уменьшение влияния этого начального значения на результаты прогнозирования.

Постоянная сглаживания α, определяет, что же будет в большей степени влиять на прогноз: последние данные или отдаленные. Если α = 1, то пр е- дыдущие наблюдения полностью игнорируются, а е сли α = 0, то игнорир у- ются текущие наблюдения. Значениям α между 0, 1 будут соответствовать промежуточные результаты.

Эмпирические исследования показали, что весьма часто простое экспоненциальное сглаживание дает достаточно точный прогноз.

На практике обычно рекомендуется брать α меньше 0,3. Однако α больше 0,3 часто дает лучший прогноз.

Из всего этого можно сделать вывод: лучше оценивать оптимально α по данным, чем просто гадать или использовать искусственные рекомендации.

Эмпирический анализ модели простого экспоненциального сглаживания позволяет сделать вывод о том, что с ее помощью нельзя осуществлять прогноз для данных, имеющих ярко выраженную тенденцию, то есть тренд.

Модель Хольта предполагает модификацию алгоритма для случая линейного тренда.

В этом случае эффект достигается за счет введения еще одного параметра сглаживания где α1, α2 – параметры экспоненциального сглаживания

1> 0; α2 <1).

Недостатком модели Хольта является невозможность учета сезонности. Модель Хольта-Уинтерса является развитием модели Хольта, в ней появляется сезонная составляющая, в результате чего получается система урав-

нений с тремя постоянными сглаживания

Вопросы для самоконтроля

1.В чем сущность экспоненциального сглаживания?

2.Когда применяется метод экспоненциального сглаживания

3.В чем недостаток метода экспоненциального сглаживания?

4.Как выбирается постоянная сглаживания α?

5.Как выбирается начальное приближение S0?

6.Для чего используется модель Хольта?

7.В чем недостаток модели Хольта?

20

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]