- •Блаженков в.В., д.Т.Н., профессор, заведующий кафедрой «Математики» Военной академии рвсн им. Петра Великого.
- •Шеметов в.В., д.Э.Н., профессор, заведующий кафедрой «Менеджмента и маркетинга» Российской Академии предпринимательства. Содержание
- •Предисловие
- •Цель и задачи курса
- •Содержание основных тем программы
- •Парная регрессия
- •Множественная регрессия
- •Реализация типовых задач на персональном компьютере.
- •Рекомендуемая литература.
- •Контрольные вопросы для проверки знаний студентов.
- •Контрольная работа по дисциплине «Эконометрика»
Содержание основных тем программы
-
Предпосылки корреляционного и регрессионного анализов. Виды связей и характер данных в экономике.
-
Модель парной регрессии. Условия Гаусса-Маркова. Проверка значимости параметров модели и уравнения в целом.
-
Модель множественной регрессии. Условия Гаусса-Маркова. Проверка значимости параметров модели и уравнения в целом.
-
Временные ряды. Учет автокорреляции и гетероскедастичности.
-
Выявление адекватности и точности оцененных моделей. Прогнозирование.
-
Системы регрессионных уравнений.
-
Обобщенный метод наименьших квадратов.
Таблица соответствия основных параметров
|
Англоязычное обозначение |
Отечественное обозначение |
Пояснение |
|
1. Е (х) |
M(x) |
Математическое ожидание |
|
2. V(x), Var(x) |
D(x) = 2(x) |
Дисперсия |
|
3. pop.var(x) |
2(x) |
Дисперсия генеральной совокупности |
|
4. plim |
- |
Предел по вероятности |
|
5. cov(x, y) |
K(x, y) |
Ковариация |
|
6. TSS (total squares sum) |
Q |
Общая сумма квадратов |
|
7. ESS (error squares sum) |
Qe |
Сумма квадратов ошибки |
|
8. RSS (regression squares sum) |
QR |
Регрессионная сумма квадратов |
|
9. BLUE (Best linear unbiased estimator) |
Наилучшая (с минимальной дисперсией) оценка в классе несмещенных линейных оценок |
|
|
10. Стандартное отклонение, S |
1.Исправленное среднеквадратическое отклонение. 2. Выборочное среднеквадратическое отклонение |
|
|
11. F.O.C. (first order condition) |
Необходимое условие экстремума |
|
|
12. S.O.C. (second order condition) |
Достаточное условие экстремума |
|
|
1 13. df (degrees of freedom) |
Число степеней свободы |
|
|
14. MSS (mean squares sum)
|
Сумма квадратов, деленная на число степеней свободы Оценка дисперсии.
|
|
|
15. P-value |
Р-значение,
Р( |
|
Парная регрессия
Рассмотрим типовую задачу. Пусть имеются данные о стоимости произведенной продукции (О) и стоимости основных производственных фондов (Ф) за год.
|
t(мес) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
|
О |
48 |
50 |
52 |
58 |
57 |
60 |
62 |
68 |
70 |
71 |
|
|
|
Ф |
24 |
26 |
30 |
32 |
35 |
40 |
42 |
45 |
46 |
48 |
51 |
53 |
-
Исходя из экономических соображений, определяем, что факторным признаком (х) является стоимость основных производственных фондов (Ф), а результативным (у) – объем произведенной продукции (О).
В данной задаче имеем два вида данных: перекрестный и временной ряд (у (х), у(t)).
Данные получены путем случайной выборки из достаточно большой генеральной совокупности. Следовательно, закономерности в изменении фактических данных есть лишь отражение общих закономерностей в генеральной совокупности.
-
Проведем графический анализ фактических данных для модели парной регрессии и модели временного ряда. Для этого на соответствующих диаграммах рассеяния отразим фактическое изменение объема произведенной продукции (у) от стоимости фондов (х) и изменение у от t.
Для двух истинных моделей:
![]()
определяем ориентировочный вид зависимости:
![]()
Характер зависимостей может быть оценен также исходя из экономических соображений, а также на основании специальных процедур.
-
Допустим, выбраны линейные модели:
и
![]()
Данные модели мы будем называть истинными, как отражающими закономерности в генеральной совокупности. Выбор типа модели, а также регрессоров, входящих в модель, называется спецификацией. Само уравнение регрессии описывает “процесс, порождающий данные”.
Причина появления ошибки (возмущения) состоит в неполном учете всех параметров, неточности измерений.
Модель называется нормальной линейной регрессионной, если выполнены условия Гаусса-Маркова:
-
Зависимая величина у (или возмущение ) есть величина случайная, а объясняющая переменная х – величина неслучайная.
-
М() = 0
-
D() = 2 = const
-
Cov(i; j) =
-
Зависимая величина у (или возмущение ) есть нормально распределенная случайная величина.
Студентам следует обратить особое внимание на осмысление условий Гаусса-Маркова.
Первое условие характеризует выбранный тип связи.
Второе условие говорит о том, что ошибка в среднем равна нулю (иначе это не ошибка, а неучтенный фактор).
Третье условие характеризует режим гомоскедастичности, в противном случае – гетероскедастичности. Дисперсия случайного члена должна оставаться постоянной.
Четвертое условие предполагает отсутствие систематической связи между значениями случайного члена (отсутствие автокорреляции).
Пятое условие не является обязательным, его соблюдение дает возможность проводить интервальную оценку.
В реальных условиях могут существовать процессы, не вписывающиеся в модель (например, корректировка планов, и т.д.). Однако, все явления, не учтенные при спецификации, будут для нас источниками ошибок, т.е. будут вредными.
Реальная экономика – это очень сложная, многофакторная, открытая система. Измерить параметры истинной модели не представляется возможным. Поэтому произведем оценку параметров генеральной совокупности (на примере модели парной регрессии).
-
истинная модель
![]()
-
оцененная модель, где
a0
=
0
- оценка 0,![]()
a1
=
1
- оценка 1,
е
=
- оценка ;
e
= y
-
.
Подобрать
а0
и а1
это значит обеспечить наилучшую точность
приближения оцененной модели к истинной.
Ошибка е -
это различие
между фактическими и расчетными данными.
![]()
Оценки параметров регрессии получают исходя из следующего условия:
![]()

Другие возможные формы представления:
;
.
Удобно для вычислений использовать уравнение в отклонениях:
.
Согласно
теореме Гаусса-Маркова МНК-оценки не
только обеспечивают наилучшую точность,
но и являются наилучшими оценками в
классе несмещенных оценок (BLUE). При этом
дисперсия ошибок
,
а дисперсия оценок:

![]()
Для определения МНК-оценок составим таблицу.
|
у |
х |
|
|
|
|
|
|
|
|
|
|
48 |
24 |
-11,6 |
-12.8 |
148,5 |
163,8 |
134,6 |
47,7 |
0,3 |
0,1 |
576 |
|
50 |
26 |
-9,6 |
-10.8 |
103,7 |
116,6 |
92,2 |
49,6 |
0,4 |
0,2 |
676 |
|
52 |
30 |
-7,6 |
-6.8 |
51,7 |
46,2 |
57,8 |
53,3 |
-1,3 |
1,7 |
900 |
|
58 |
32 |
-1,6 |
-4.8 |
7,7 |
23,0 |
2,6 |
55,2 |
2,8 |
8,1 |
1024 |
|
57 |
35 |
-2,6 |
-1,8 |
4,7 |
3,2 |
6,8 |
58,0 |
-1,0 |
1,0 |
1225 |
|
60 |
40 |
0,4 |
3,2 |
1,3 |
10,2 |
0,2 |
62,6 |
-2,6 |
6,8 |
1600 |
|
62 |
42 |
2,4 |
5,2 |
12,5 |
27,0 |
5,8 |
64,5 |
-2,5 |
6,1 |
1764 |
|
68 |
45 |
8,4 |
8,2 |
68,9 |
67,2 |
70,6 |
67,3 |
0,8 |
0,6 |
2025 |
|
70 |
46 |
10,4 |
9,2 |
95,7 |
84,6 |
108,2 |
68,2 |
1,8 |
3,3 |
2116 |
|
71 |
48 |
11,4 |
11,2 |
127,7 |
125,4 |
130,0 |
70,0 |
1,.0 |
1,0 |
2304 |
|
596 |
368 |
0 |
0 |
622,2 |
667,6 |
608,4 |
|
-0,3 |
28,5 |
14210 |
Здесь
= 36,8,
= 59,6.
Итоговые
данные таблицы позволяют определить
МНК-оценки параметров линейной парной
регрессии: а0
= 25,4; а1
= 0,93. Таким образом, оцененная модель
имеет вид:
.
Полезно определить выборочную оценку коэффициента корреляции:
![]()
Для правильно специфицированной модели связь между зависимой (у) и независимой (х) переменными должна быть сильной.
По
принятой классификации
![]()
В нашем случае r = 0,98 – сильная положительная связь.
Качество оцененной модели характеризует коэффициент детерминации R2:
![]()
![]()
![]()
![]()
Для
нашего случая
.
Это значит, что изменение зависимой переменной y на 95 % объясняется моделью и на 5 % прочими факторами.
Проверить значимость уравнения в целом и отдельных параметров модели можно, используя соответствующие нулевые гипотезы.
В общем случае для уравнения множественной регрессии
у = 0 + 1х + 2х + …nхn +
Н0: 1 = 2 = … = n = 0.
Сравнивают наблюдаемое и критическое значения критерия Фишера-Снедекора. Гипотеза выполняется, если Fнабл Fкр.
(для
парной регрессии).
Fкр находят по соответствующим таблицам, исходя из принятой доверительной вероятности. В нашем случае Fкр(0,95; 1; 8) = 5,32.
![]()
Так как Fнабл > Fкр нулевую гипотезу отвергаем. Уравнение в целом значимо.
Значимость параметров модели оцениваем исходя из гипотез:
Н0: 0 = 0; Н0: 1 = 0.
Н1:
0
0; Н1:
1
0.
Гипотеза принимается, если tнабл < tкр.
![]()
![]()
![]()

Для удобства в эконометрике принята следующая форма записи оцененной модели:
![]()
R2
=
0, 98
(2,77) (0,07)
![]()
tкр для = 5% и количестве степеней свободы к = n – 2 = 8 находим по таблицам распределения Стьюдента. tкр (0,95; 8) = 2,3.
,
следовательно, нулевые гипотезы
отвергаем.
Полезно
проверить гипотезу о значимости
коэффициента корреляции: Н0
=0; Н1
0;
аналогично
сравниваем с tкр.
Важнейшим
этапом является интерпретация полученных
результатов. Для оцененной модели
- увеличение стоимости основных
производственных фондов на 1 единицу
ведет к росту объема продукции на 0,93
единиц. При отсутствии производственных
фондов объем продукции равен 25,4 единиц.
Интерпретация параметра а0
может и не
иметь экономического смысла.
Графический
анализ временного ряда показывает
отсутствие сезонной компоненты.
Следовательно, модель
представляет собой линейный временной
тренд. Построение и анализ оцененной
модели тренда аналогичен вычислениям,
произведенным для парной регрессии -
проводим простую замену одной независимой
переменной х
на другую – t.
Важной разновидностью модели временного ряда являются адаптивные модели. В процедуре нахождения сглаженного уровня используют значения только предшествующих уровней ряда, взятые с определенным весом, причем вес наблюдения уменьшается по мере удаления его от момента сглаживания. Обозначим сглаженные значения как St, тогда
где
- параметр сглаживания,
= 1 - - параметр дисконтирования.
По модели Брауна:
ур(t) = а0(t - 1) + a1(t - 1)k , где
k – шаг прогнозирования. Примем k = 1.
ур(t) = а0(t - 1) + a1(t - 1)
а0(t) = a1(t - 1) + а0(t - 1) +e(t)(1 - 2)
a1 (t) = a1 (t - 1) + e (t) 2
Примем = 0,4; = 0,6. Тогда модель Брауна примет следующий вид:
ур(t) = а0(t - 1) + a1(t - 1);
а0(t) = a1(t - 1) + а0(t - 1) + 0,64 е(t);
a1 (t) = a1 (t - 1) + 0, 16 e (t)
Таким образом, на каждом шаге в зависимости от величины ошибки происходит корректировка параметров, модель адаптируется к изменяющимся условиям.
Для выявления начальных значений параметров а0 и а1 анализируют первые пять точек временного ряда.
Составим расчетную таблицу
|
t |
y |
|
|
|
|
|
1 |
48 |
-2 |
-5 |
10 |
4 |
|
2 |
50 |
-1 |
-3 |
3 |
1 |
|
3 |
52 |
0 |
-1 |
0 |
0 |
|
4 |
58 |
1 |
5 |
5 |
1 |
|
5 |
57 |
2 |
4 |
8 |
4 |
|
15 |
265 |
0 |
0 |
26 |
10 |
![]()
;
![]()


Процесс продолжается до t = 10. Полученное на последнем шаге уравнение является основой для линейной экстраполяции тренда. Отметим, что корректировка параметров а0 и а1 геометрически означает вращение в плоскости прямой, её “адаптацию” на изменение ошибки метода.
Таким образом, нами получены оценочные модели парной регрессии, временного тренда и модели Брауна. Для прогнозирования возможно использование только качественных моделей. Модель признается качественной, если она адекватна и точна. Адекватность модели означает её соответствие условиям Гаусса-Маркова. Поскольку прямое определение ошибки истинной модели невозможно, то исследуются ошибки оцененной модели. Адекватность устанавливается в виде проверки соответствующих гипотез.
Составим расчетную таблицу.
|
y |
e |
Т П. |
(e(t) – e(t-1))2 |
e(t) e(t-1) |
|
|
48 |
0,3 |
- |
- |
- |
0,6 |
|
50 |
0,4 |
1 |
0,01 |
0,12 |
0,8 |
|
52 |
-1,3 |
1 |
2,89 |
-0,52 |
2,5 |
|
58 |
2,8 |
1 |
16,81 |
-3,6 |
4,8 |
|
57 |
-1,0 |
0 |
14,44 |
-2,8 |
1,8 |
|
60 |
-2,6 |
1 |
2,56 |
2,6 |
4,3 |
|
62 |
-2,5 |
0 |
0,01 |
6,5 |
4,0 |
|
68 |
0,8 |
0 |
10,89 |
-2,0 |
1,2 |
|
70 |
1,8 |
1 |
1,0 |
1,44 |
2,6 |
|
71 |
1,0 |
- |
0.64 |
1,8 |
1,4 |
|
59,6 |
-0,3 |
5 |
49,99 |
3,5 |
2,4 |
1. Проверка гипотезы о равенстве нулю математического ожидания ошибки.
Используется t-критерий, описанный ранее.
.![]()
Гипотеза принимается, если tнаб < tкр.
В
нашем случае
.
tкр
= 2,3. Гипотеза принимается.
2. Проверка случайности ряда остатков на основе критерия поворотных точек. Точка в ряду ошибок признается поворотной (т.п.), если она больше или меньше последующей и предыдущей. Сумма поворотных точек для n = 10 и = 5% должна быть больше критического значения -

В нашем случае 5 > 2. Критерий адекватности выполнен.
3. Проверка отсутствия автокорреляции на основе критерия Дарбина-Уотсона.
.
В
специальных таблицах табулированы
значения d1
и d2;
в нашем случае d1
= 1,08 , d2
= 1,36;
.
Если dнабл (0; d1) –уровни сильно автокоррелированы, модель неадекватна. При dнабл (d2; 2) – уровни независимы. Если dнабл (d1; d2), требуются дополнительные исследования значимости коэффициента автокорреляции.
,
В нашем случае r (1) = 0,07 –связь практически отсутствует.
Значимость
можно определить либо по t-критерию,
либо по таблице Фишера-Йейтса. Так
,
следовательно, коэффициент автокорреляции
не значим.
Если
dнабл >
2, то исследуют
.
-
Проверка гипотезы о нормальном законе распределения ряда остатков. Наиболее прост RS-критерий.
.
Наблюдаемое значение RS должно попадать в интервал от 2,7 до 3,7. В нашем случае RS= 3,.03. Гипотеза принимается.
Для характеристики точности используется средняя относительная ошибка:
![]()
Если ошибка менее 5%, то точность признается высокой; если менее 15%, то допустимой.
Точечный прогноз на k шагов вперед при экстраполяции линейного тренда достигается подстановкой t = 10 и t = 11. В модели парной регрессии подставляем х10 и х11. В модели Брауна подставляем k=1 и k=2.
Доверительный интервал прогнозов будет иметь следующие границы:
Верхняя
граница прогноза = yр(n
+ k) +
Нижняя
граница прогноза = yр(n
+ k) -
![]()
-
для временного ряда и модели Брауна
При вычислении ошибки прогноза для модели Брауна используется значение подкоренного выражения модели временного ряда.
-
для парной регрессии.
-
стандартное отклонение ошибки
Для временного ряда и модели Брауна значения табулированы .
Для парной регрессии хn+k = x11; x12.
Образец оформления прогноза.
|
х |
Шаг, k |
Прогноз, yр(t) |
Нижняя граница |
Верхняя граница |
|
51 |
1 |
72,83 |
67,7 |
77,96 |
|
52 |
2 |
74,69 |
69,39 |
79,99 |
Прогноз оформляется для всех трех использованных моделей. В заключении приводится итоговая сравнительная таблица
|
Модель |
|
Se |
|
1. Парная линейная регрессия |
2,4 |
1,89 |
|
2. Временной тренд |
1,85 |
1,43 |
|
3. Адаптивная модель Брауна |
3,.41 |
2,78 |
На основании сравнительного анализа полученных результатов студент должен выдать рекомендации по использованию моделей прогнозирования.
