
- •Практикум по эконометрике
- •080109– «Бухгалтерский учет, анализ и аудит»
- •080105– «Финансы и кредит»
- •Лабораторная работа №1. Изучение возможностей Excel для получения и анализа уравнений множественной регрессии.
- •Лабораторная работа №2. Построение модели множественной регрессии со статистически значимыми факторами
- •Лабораторная работа №3. Устранение гетероскедастичности и автокорреляции в остатках.
- •2. Устранение автокорреляции в остатках.
- •Лабораторная работа №4. Проверка однородности данных. Уравнение регрессии с фиктивными переменными.
- •Лабораторная работа №5. Построение автокорреляционной функции и коррелограммы.
- •Лабораторная работа №6. Выявление структуры одномерного временного ряда.
- •Лабораторная работа №7. Моделирование взаимосвязей по временным рядам
- •Лабораторная работа №8. Модели с распределенным лагом. Метод Алмон.
- •Лабораторная работа №9. Изучение двухшагового метода наименьших квадратов.
- •Список литературных источников
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ
ЮИМ
Практикум по эконометрике
учебное пособие для студентов специальностей
080109– «Бухгалтерский учет, анализ и аудит»
080105– «Финансы и кредит»
Краснодар 2014
УДК 330.43(075.5)
ББК 65в631я73
П69
Рецензенты:
С.И. Берлин
(дэн, профессор - зав. кафедрой)
Грачёв И.С., Практикум по эконометрике: Учебное пособие. Краснодар: типография ЮИМ « », 2014. – 63 с.
Дано краткое систематическое изложение разделов государственного образовательного стандарта по эконометрике – множественная регрессия, статистический анализ экономических временных рядов и системы одновременных эконометрических уравнений. Практикум обеспечивает методическую поддержку практических занятий. Содержит краткие методические указания, решение типовых задач, описание реализации на компьютере с помощью прикладной программы EXCEL.
Предназначено для студентов и аспирантов высших учебных заведений экономических специальностей, ориентированных на прикладные задачи моделирования и прогнозирования в экономике.
Оглавление
Лабораторная работа №1. Изучение возможностей Excel для получения и анализа уравнений множественной регрессии. 6
Лабораторная работа №2. Построение модели множественной регрессии со статистически значимыми факторами 19
Лабораторная работа №3. Устранение гетероскедастичности и автокорреляции в остатках. 31
Лабораторная работа №4. Проверка однородности данных. Уравнение регрессии с фиктивными переменными. 37
Лабораторная работа №5. Построение автокорреляционной функции и коррелограммы. 44
Лабораторная работа №6. Выявление структуры одномерного временного ряда. 52
Лабораторная работа №7. Моделирование взаимосвязей по временным рядам 69
Лабораторная работа №8. Модели с распределенным лагом. Метод Алмон. 76
Лабораторная работа №9. Изучение двухшагового метода наименьших квадратов. 82
Лабораторная работа №1. Изучение возможностей Excel для получения и анализа уравнений множественной регрессии.
Для проведения эконометрической обработки исходных данных табличный процессор Microsoft Excel включает в себя программную надстройку «Пакет анализа» и библиотеку из 78 статистических функций. Если же пользователя не удовлетворяют возможности Excel, тогда необходимо обратиться к более мощным специализированным пакетам прикладных программ, как отечественные – STADIA, МЕЗОЗАВР, СИГАМД, СТОД, САНИ, ОЛИМП и др., так и зарубежные – Econometric Views, STATA, STATISTICA, STATGRAPHICS, SPSS, SAS, BMDP,NCSS, StatXact и др.
Рассмотрим некоторые аспекты работы с табличным процессором Excel, которые позволяют упростить расчеты, необходимые для решения эконометрических задач. Табличный процессор – это программный продукт, предназначенный для автоматизации обработки данных табличной формы.
Элементы экрана Excel. После запуска Excel на экране появляется таблица, вид которой показан на рис. 1.1.
Это изображение называется рабочим листом. Оно представляет собой сетку строк и столбцов, пересечения которых образуют прямоугольники, называемые ячейками. Рабочие листы предназначены для ввода данных, выполнения расчетов, организации информационной базы и т.п. В каждый конкретный момент времени активным может быть только один рабочий лист. Окно Excel отображает основные программные элементы: строку заголовка, строку меню, строку состояния, кнопки управления окнами.
При создании новой или открытии существующей книги Microsoft Excel появится окно активного рабочего листа. Для того, чтобы отыскать команду вызова надстройки Пакет анализа, необходимо воспользоваться меню Сервис.
Здесь возможны три ситуации, в которых нужно действовать следующим образом:
В меню Сервис присутствует команда Анализ данных. Это идеальный случай - достаточно щелкнуть указателем мыши по данной команде, чтобы попасть в окно надстройки.
В меню Сервис отсутствует команда Анализ данных. В этом случае необходимо в том же меню выполнить команду Надстройки. Раскроется одноименное окно (рис. 1.2.) со списком доступных надстроек. В этом списке нужно найти элемент Пакет анализа, поставить рядом с ним «галочку» и щелкнуть по кнопке ОК. После этого в меню Сервис появится команда Анализ данных.
В меню Сервис отсутствует команда Анализ данных, а в списке окна Надстройки нет элемента Пакет анализа. В этом случае придется доустановить надстройку Excel (Пакет анализа) с дистрибутивного компакт-диска Microsoft Office.
Рис. 1.1.
Рис. 1.2.
Рассмотрим пример построения модели множественной регрессии с помощью Excel.
Пример №1.
По данным за два года изучается зависимость оборота розничной торговли (Y, млрд. руб.) от ряда факторов: X1 – денежные доходы населения, млрд. руб.; X2 – доля доходов, используемая на покупку товаров и оплату услуг, млрд. руб.; X3 – уровень инфляции за последний год, %; X4 – официальный курс рубля по отношению к доллару США. Данные представлены в табл. 1.
Таблица 1
Месяц |
Y |
X1 |
X2 |
X3 |
X4 |
1 |
76,4 |
117,7 |
81,6 |
10,3 |
28,5 |
2 |
77,6 |
123,8 |
73,2 |
11,4 |
28,7 |
3 |
88,2 |
126,9 |
75,3 |
12,2 |
29,1 |
4 |
87,3 |
134,1 |
71,3 |
11,5 |
29,2 |
5 |
82,5 |
123,1 |
77,3 |
11,2 |
29,1 |
6 |
79,4 |
126,7 |
76,1 |
10,5 |
29,2 |
7 |
80,3 |
130,4 |
76,6 |
9,4 |
29,3 |
8 |
80,1 |
129,3 |
84,7 |
9,5 |
29,2 |
9 |
105,2 |
145,4 |
92,4 |
9,3 |
29,1 |
10 |
102,5 |
163,8 |
80,3 |
9,2 |
28,7 |
11 |
108,7 |
164,8 |
82,6 |
9,4 |
28,4 |
12 |
104,5 |
165,3 |
70,9 |
9,7 |
27,8 |
13 |
103,7 |
164,1 |
89,9 |
8,2 |
27,7 |
14 |
117,8 |
183,7 |
81,3 |
8,4 |
27,6 |
15 |
115,8 |
195,8 |
83,7 |
8,2 |
27,5 |
16 |
117,8 |
219,4 |
76,1 |
8,1 |
27,5 |
17 |
118,4 |
209,8 |
80,4 |
7,8 |
27,4 |
18 |
120,4 |
223,3 |
78,1 |
7,2 |
27,5 |
19 |
123,8 |
223,6 |
79,8 |
8,2 |
27,6 |
20 |
134,9 |
236,6 |
82,1 |
7,5 |
27,7 |
21 |
130,5 |
236,6 |
83,2 |
7,4 |
27,8 |
22 |
140,7 |
248,6 |
80,8 |
7,3 |
28,7 |
23 |
150,4 |
253,4 |
81,8 |
7,4 |
28,3 |
24 |
172,7 |
254,3 |
87,5 |
7,5 |
28,1 |
Требуется:
Для заданного набора данных построить линейную модель множественной регрессии.
Оценить адекватность и значимость построенного уравнения регрессии.
Выделить значимые и незначимые факторы в модели.
Построить уравнение регрессии со статистически значимыми факторами. Дать экономическую интерпретацию параметров модели.
Решение
Запишем исходные данные (табл.1) в виде таблицы EXCEL, как это сделано на рис.1.3.
Рис. 1.3.
Для решения задачи необходимо выполнить следующие действия:
В меню Сервис выбираем строку Анализ данных. На экране появится окно
Рис. 1.4.
В появившемся окне выбираем пункт Регрессия. Появляется диалоговое окно рис.1.5.
Рис. 1.5.
Диалоговое окно рис.1.5. заполняется следующим образом:
Входной интервал
– диапазон (столбец), содержащий данные
со значениями объясняемой переменной;
Входной интервал
– диапазон (столбцы), содержащий данные
со значениями объясняющих переменных.
Метки – флажок, который указывает, содержат ли первые элементы отмеченных диапазонов названия переменных (столбцов) или нет;
Константа-ноль
- флажок,
указывающий на наличие или отсутствие
свободного члена в уравнении (
);
Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона, в котором будет сохранен отчет по построению модели;
Новый рабочий лист – можно задать произвольное имя нового листа, в котором будет сохранен отчет.
Если необходимо
получить значения и графики остатков
(
),
установите соответствующие флажки в
диалоговом окне. Нажмите на кнопку Ok.
Вид отчета о результатах регрессионного анализа представлен на рис.1.6.
Рис. 1.6.
Рассмотрим таблицу «Регрессионная статистика»
Множественный
R – это
,
где
–
коэффициент
детерминации.
R-квадрат
- это
.
Коэффициент
является одной из наиболее эффективных
оценок адекватности регрессионной
модели, мерой качества уравнения
регрессии (или, как говорят, мерой
качества подгонки регрессионной модели
к наблюденным значениям
)
Величина
показывает, какая часть (доля) вариации
объясняемой переменной обусловлена
вариацией объясняющей переменной (
).
Чем ближе
к единице, тем лучше регрессия
аппроксимирует эмпирические данные.
Если
,
то между
и
существует линейная функциональная
зависимость. Если
,
то объясняемая переменная не зависит
от данного набора объясняющих переменных.
свидетельствует о том, что изменения
зависимой переменной
(
оборот розничной торговли) в основном
(на 94,8%) можно объяснить изменениями
включенных в модель объясняющих
переменных – X1,
X2,
X3,
X4.
Такое значение свидетельствует об
адекватности модели.
Нормированный R-квадрат – скорректированный (адаптированный, поправленный(adjusted)) коэффициент детерминации.
где
– число наблюдений,
– число объясняющих переменных.
Недостатком
коэффициента детерминации
является то, что он увеличивается при
добавлении новых объясняющих переменных,
хотя это и не обязательно означает
улучшение качества регрессионной
модели. В этом смысле предпочтительнее
использовать
.
В отличие от
скорректированный коэффициент
может уменьшаться при введении в модель
новых объясняющих переменных, не
оказывающих существенное влияние на
зависимую переменную.
Стандартная
ошибка
регрессии
,
где
– необъясненная дисперсия (мера разброса
зависимой переменной вокруг линии
регрессии).
Наблюдения – число наблюдений.
Рассмотрим таблицу «Дисперсионный анализ»
Поясним заголовки столбцов этой таблицы:
df – degrees of freedom – число степеней свободы связано с числом единиц совокупности и с числом определяемых по ней констант ;
SS – сумма квадратов (регрессионная – RSS, остаточная – ESS и общая - TSS);
MS- сумма квадратов на одну степень свободы;
F – вычисленное значение критерия Фишера (F-статистики);
Значимость F – уровень значимости, при котором вычисленное значение критерия Фишера является критической точкой распределения Фишера. Нулевая гипотеза о незначимости (Н0: β=0) уравнения регрессии отклоняется, если это значение меньше заданного уровня значимости. Значимость F- значение уровня значимости, соответствующее вычисленному значению F-критерия Фишера.
F и Значимость F позволяют проверить значимость уравнения регрессии, т.е. установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.
По эмпирическому значению статистики F проверяется гипотеза равенства нулю одновременно всех коэффициентов модели. Значимость F – теоретическая вероятность того, что при гипотезе равенства нулю одновременно всех коэффициентов модели F-статистика больше эмпирического значения F.
Уравнение регрессии
значимо на уровне
,
если
,
где
- табличное значение F-критерия
Фишера (
).
На уровне значимости
гипотеза
отвергается, если Значимость
,
и принимается, если Значимость
.
В нашем примере расчетное значение F- критерия Фишера равно 86,078. Значимость F= 6,69307E-12, что намного меньше 0,05. Таким образом, полученное уравнение в целом значимо.
В последней таблице (табл. 1, рис.1.6.) приведены значения параметров (коэффициентов) модели, их стандартные ошибки и расчетные значения t- критерия Стъюдента для оценки значимости отдельных параметров модели.
Таблица 1
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Y- |
-203,5524 |
82,8797 |
-2,4560 |
0,0238 |
377,0217 |
-30,0831 |
X1 |
0,6655 |
0,0658 |
10,1173 |
0,0000 |
0,5278 |
0,8032 |
X2 |
1,2393 |
0,3310 |
3,7443 |
0,0014 |
0,5465 |
1,9320 |
X3 |
6,9802 |
2,5299 |
2,7590 |
0,0125 |
1,6850 |
12,2754 |
X4 |
1,0907 |
2,8464 |
0,3832 |
0,7058 |
-4,8669 |
7,0484 |
В строке с именем «Y-пересечение» приводятся:
оценка коэффициента b0;
его стандартная ошибка mb0;
вычисленное значение t-статистики для b0;
P-значение, – вероятность того, что случайная величина распределенная по закону t(n-2) примет значение по абсолютной величине больше, чем модуль вычисленного значения t-статистики, т.е. P-значение это уровень значимости, при котором вычисленное значение t-статистики является критической точкой, следовательно, нулевая гипотеза
отклоняется, если P-значение меньше заданного уровня значимости, и принимается в противном случае;
нижняя и верхняя границы 95%-о доверительного интервала для b0.
В строках с именем «X» приводятся аналогичные данные для коэффициентов bk уравнения регрессии.
Таким образом, получена следующая модель зависимости оборота розничной торговли:
Y = -203,6 + 0,67X1 + 1,24X2 + 6,98X3 + 1,09X4 (1)
Анализ таблицы для рассматриваемого примера позволяет сделать вывод о том, что на уровне значимости α=0,05 незначимым оказался коэффициент при факторе X4, так как:
t–статистика (tp=0,38) для b4 меньше
=2,08 – критическая точка распределения Стьюдента,
;
Р – значение (P=0,7) больше 0,05;
Границы доверительного интервала для b4 содержит противоречивые результаты (-4,87 ≤ b4 ≤ 7,05), значения коэффициента одновременно содержат положительные и отрицательные величины и даже ноль, чего не может быть.
Проведенное исследование успешности параметров уравнения регрессии позволяет исключить несущественный фактор Х4 и построить уравнение зависимости Y= f(x1,x2,x3).