Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Ovsyannikova_M_M_Ekonometrika

.pdf
Скачиваний:
10
Добавлен:
29.02.2016
Размер:
4.18 Mб
Скачать

МИНОБРНАУКИ РОССИИ

ГЛАЗОВСКИЙ ИНЖЕНЕРНО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ (филиал) государственного образовательного учреждения высшего профессионального образования

«Ижевский государственный технический университет»

М.М. Овсянникова

КОМПЬЮТЕРНЫЙ ПРАКТИКУМ ПО ЭКОНОМЕТРИКЕ

Глазов 2011

ББК 65в6я73

Утверждено на заседании кафедры «Естественнонаучных

О34

и гуманитарных дисциплин» ГИЭИ (филиала) ГОУ ВПО

 

ИжГТУ (протокол № )

Овсянникова М.М. Компьютерный практикум по эконометрике: Для студентов специальности 080109 «Бухгалтерский учет, анализ и аудит», 080105 «Финансы и кредит». – Глазов: Глазовский инженерно-экономический институт, 2011. – 64 с.

Рецензент – профессор каф. «Финансы и кредит» ГОУ ВПО ИжГТУ А.С. Тонких

© ГИЭИ (филиал) ИжГТУ, 2011

2

Предисловие

Данный практикум представляет собой учебное пособие, ориентированное на специфику преподавания начального курса эконометрики в технических вузах.

Изучение этой дисциплины предполагает приобретение студентами следующих умений: построение эконометрических моделей, принятие решений о спецификации и идентификации модели, выбор метода оценки параметров модели, интерпретация результатов, получение прогнозных оценок. Студенты должны также научиться давать статистическую оценку значимости таких искажающих эффектов, как гетероскедастичность остатков зависимой переменной, автокорреляция. В связи с этим курс эконометрики обязательно включает решение задач.

Базовыми учебниками, структура и содержание которых взяты за основу данной брошюры, послужили:

1.Елисеева И.И. Эконометрика: Учебник. – М.: Проспект, 2011.

2.Елисеева И.И. Практикум по эконометрике. – М.: Проспект, 2011.

3.Кремер Н.Ш., Путко Б.А. Эконометрика. – М.: Юнити-дана, 2010.

4.Доугерти К. Введение в эконометрику. – М.: Инфра-М, 2009.

Данный практикум состоит из 5 разделов и посвящен изучению парного регрессионного анализа, множественного регрессионного анализа и исследованию этих моделей. Каждый раздел содержит методические указания и типовые эконометрические задачи, выполненные с помощью прикладной программы Excel (версии 2003 или 2007).

Также в данном практикуме содержится набор данных (20 вариантов), чтобы обеспечить индивидуальную работу студента. В них предусмотрена возможность различных комбинаций объясняющих переменных, выбор различной объясняемой переменной, предлагаются дифференцированные задания. Такая гибкость позволяет преподавателю охватить большее количество студентов, выполняющих самостоятельную работу.

В приложениях к практикуму приведены основные статистико-математические таблицы, необходимые для решения задач.

3

Раздел 1 ПАРНЫЙ ЛИНЕЙНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ

Методические указания

Парная регрессия – уравнение зависимости двух переменных х и у: yˆ = f(x),

где у – зависимая переменная, или объясненная; х – независимая, или объясняющая, переменная.

Рассмотрим случай, когда f(x) – линейная функция: у = α + β x+е.

Построение уравнения регрессии сводится к оценке ее параметров α , β . Для оценки этих пара-

метров используют метод наименьших квадратов (МНК). Этот метод позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений переменной у от теоретических уˆ минимальна, т.е.

 

 

 

 

 

 

 

 

 

 

ˆ

2

 

= e

2

® min.

 

 

 

 

 

 

 

 

( у - у)

 

 

 

 

Метод МНК дает следующие оценки a и b параметров α , β соответственно, которые вычис-

ляются по формулам:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b =

Cov(x, y)

, a =

 

b

 

,

 

 

 

 

 

 

 

 

y

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(x -

 

 

 

 

 

 

 

Var(x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

)( y -

 

)

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где Cov(x, y) =

 

 

 

 

 

=

 

xy -

x

×

y

 

= xy - x × y ;

 

 

 

 

 

 

 

 

n

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Var(x) = x2 - (x )2 = sx2 , Var( y) = y2 - ( y )2 = s2y .

Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции:

 

Cov(x, y)

 

Cov(x, y)

 

 

xy

-

 

×

 

 

;

 

 

Cov(x, y)

 

.

r =

=

=

 

x

y

r =

 

 

 

 

 

 

 

 

 

 

 

 

xy

(Var(x)Var( y))1/ 2

 

sx sy

 

 

 

sx sy

xy

Var(x)Var( y)

 

 

 

 

 

 

Коэффициент корреляции принимает значения: -1 £ rxy £ 1.

Проверку значимости коэффициента корреляции проводят по статистическому критерию: нахо-

дят t

 

= r

 

n k − 1

и сравнивают с tтабл – числом, которое находят по таблице значений Стью-

факт

1 − r2

 

xy

 

 

 

 

 

xy

 

дента на пересечении параметров γ = 0,95 ( α = 0,05 ) и n – k – 1.

Если tфакт > tтабл , то коэффициент корреляции значим (нулевая гипотеза о равенстве его нулю отвергается).

Оценку качества построенной модели даст коэффициент детерминации и коэффициент ап-

проксимации:

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

Var(e)

 

 

 

1

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

R2 =

Var( y)

, или R2 = 1 -

;

A =

y - y

 

×100% .

 

 

n

y

 

Var( y)

Var( y)

 

 

 

 

Допустимый предел значений

 

не более 8–10 %.

 

 

 

 

 

 

 

A

 

 

 

 

 

 

 

F-тест – оценивание качества уравнения регрессии, состоит в проверке гипотезы Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и табличного Fтабл значений F-критерия Фишера.

 

 

 

R2

 

 

Находим статистический критерий Fфакт

=

 

xy

(n - k -1)

и сравниваем его с Fтабл , которое

 

- Rxy2

 

1

 

 

находим по таблице Фишера– Снедекора на пересечении чисел k1 = k и k2 = n k −1, где k – число переменных Х в задаче.

Если Fфакт > Fтабл , то уравнение значимо в целом, нулевая гипотеза отвергается.

4

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки. Сначала высчитываем стандартную ошибку или стандартное отклонение каждого коэффициента:

 

 

 

 

 

 

 

 

 

x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c.o.(a) = sa = se

 

 

 

 

= se

 

 

 

 

 

 

x2

 

 

 

= se

 

 

x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

;

 

 

 

 

 

 

 

 

 

 

n(x -

 

)2

 

(x -

 

)2

Var(x) × n

 

 

 

 

 

 

 

 

 

 

x

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

co. .(b) = sb = se

 

 

 

 

1

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(x -

 

 

)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

se =

e2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n - k -1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Затем находим отношения:

 

 

 

(a) =

 

 

a

 

 

 

=

 

a

 

 

 

 

 

(b) =

 

 

 

b

 

=

 

b

 

 

 

tфакт

 

 

 

 

 

 

 

 

 

 

,

 

 

tфакт

 

 

 

 

 

 

 

 

 

 

 

и срав-

 

 

c.o.(a)

 

sa

 

 

 

c.o.(b)

sb

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ниваем с tтабл , которое находится по таблице Стьюдента на пересечении параметров α = 0,05 и

n – k – 1.

Если tфакт > tтабл , то параметр (коэффициент) значим (нулевая гипотеза отвергается).

Для расчета доверительного интервала определяем предельную ошибку для каждого показателя:

Da = tтабл ×со. .(а) , Db = tтабл ×со. .(b) .

Формулы для расчета доверительных интервалов имеют следующий вид: ga = a ± Da , gb = b ± Db .

Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым.

Прогнозное значение yp определяется путем подстановки в уравнение регрессии, например ли-

нейное: y = a + bx , соответствующего прогнозного значения xp. Вычисляется средняя стандартная

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

ошибка прогноза с.о.( yˆ p ):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

Var(e)

 

 

 

1

 

(xp -

 

)2

 

 

x

со. .( y p ) =

 

 

 

 

1

+

 

+

 

 

 

 

 

n

 

 

 

 

n - k -1

 

 

 

 

Var(x)

и строится доверительный интервал прогноза:

g yˆ p = yˆ p ± Dˆy p ,

где Dyˆ p = tтабл ×с.о.( yˆ p ) .

Решение типовых задач

Задача 1. Торговое предприятие имеет сеть, состоящую из 12 магазинов, информация о деятельности которых представлена в таблице:

 

Годовой товаро-

Торговая пло-

 

Годовой товаро-

Торговая пло-

№ магазина

оборот, млн. руб.

щадь, тыс. м2

№ магазина

оборот, млн. руб.

щадь, тыс. м2

 

(переменная Y)

(переменная Х)

 

(переменная Y)

(переменная Х)

1

19,76

0,24

7

75,01

0,94

2

38,09

0,31

8

89,05

1,21

3

40,95

0,55

9

91,13

1,29

4

41,08

0,48

10

91,26

1,12

5

56,29

0,78

11

99,84

1,29

6

68,51

0,98

12

108,55

1,49

5

Требуется:

1)рассчитать параметры линейной регрессии;

2)дать экономическую интерпретацию коэффициентов уравнения регрессии;

3)оценить модель через коэффициенты корреляции, аппроксимации, детерминации;

4)оценить статистическую значимость параметров регрессии и корреляции;

5)вычислить доверительные интервалы для коэффициентов регрессии;

6)выполнить прогноз годового товарооборота для строящегося нового магазина площадью

1тыс. м2. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал;

7)построить поле корреляции и линию регрессии.

Решение

Для решения задачи используем ППП Excel. Выполним пункт 1 по шагам. 1.1. Рассчитать параметры линейной регрессии.

1.1.1. Создать новый файл и ввести анализируемые данные (рис. 1).

Заливкой выделены ячейки, в которых считается сумма по столбцам (ячейки А14 и В14) и их среднее (ячейки А15 и В15).

1.1.2.Поставить курсор в ячейку А18. Выделить область 5 х 2 (5 строк, 2 столбца) для вывода результатов регрессионного анализа.

1.1.3.Находясь в левом верхнем углу области, активизировать Мастер функций. Это можно сделать следующими способами:

– для EXCEL 2003:

а) в главном меню выберите ВставкаФункция;

б) в подменю щелкните по значку f(x) . Если значок отсутствует в подменю, то для дальнейшего пользования вставьте его, щелкнув правой кнопкой мыши по любому разделу главного меню, и в появившемся окне, выбрав НастройкаКомандыВставкаФункция и удерживая левой кнопкой мыши значок Функция, перетащите его в подглавное меню;

– для EXCEL 2007 значок f(x) – мастер функций – есть обязательно под главным меню.

Рис. 1

6

Рис. 2

Впоявившемся окне Мастера функций выберите в разделе Категория строку статистические, а в разделе Функция строку ЛИНЕЙН (рис. 2). Щелкните по кнопке ОК.

1.1.4. В появившемся окне (рис. 3) заполните данные по переменным х и у:

известные значения у – координату первой ячейки значений у, двоеточие, координату последней ячейки значений у (А2:А13);

известные значения х – координату первой ячейки значений х, двоеточие, координату последней ячейки х (В2:В13);

константа – логическое значение, которое указывает на наличие или отсутствие свободного члена в уравнении регрессии. Если Константа = 1, то он присутствует, если 0, то отсутствует;

Статистика – логическое значение, которое указывает, выводить дополнительную информацию по анализу (1) или нет (0).

Щелкните по кнопке ОК.

Ввыделенной области появится первое значение итоговой таблицы. Чтобы раскрыть всю таблицу нажмите клавишу F2, а затем одновременно три клавиши CTRL, SHIFT, ENTER.

Появятся десять значений в таблице (рис. 4).

Рис. 3

7

 

 

Рис. 4

Дополнительная регрессионная статистика будет выводиться по следующей схеме:

 

 

 

 

 

 

Значение коэффициента b

 

Значение коэффициента а

 

 

с. о. (b)

 

с. о. (а)

 

 

R2

 

Среднеквадратичное отклонение у

 

 

F-статистика

 

Число степеней свободы

 

 

 

 

е2

 

Следовательно, в нашем уравнении

регрессии коэффициент а = 7,87377, а коэффициент

b = 67,88714, т.е. искомое уравнение регрессии имеет вид: yˆ = 7,87377 + 67,88714х.

1.2. Дать экономическую интерпретацию коэффициентов уравнения регрессии.

Дадим интерпретацию найденным коэффициентам: оценка коэффициента b = 67,88714 показывает, что с увеличением торговой площади на 1 тыс. м2 годовой товарооборот увеличится в среднем на 67,88714 млн. руб. Оценка коэффициента а = 7,87377, формально говоря, показывает прогнозируемый уровень переменной у, когда х = 0, т.е. площадь магазина 0 м2, а годовой товарооборот 7,87377 млн. руб. Можно сказать, что реального смысла в данной задаче этот коэффициент не имеет.

1.3. Оценить модель через коэффициенты корреляции, аппроксимации, детерминации.

1.3.1. Возвращаемся к нашим первоначальным данным и добавляем столбец yˆ = a + bx . После вычисления столбца yˆ добавляем столбец e = y – yˆ (в дальнейшем он нам понадобится для проверки на гетероскедастичность и автокорреляцию) и столбец е2 (рис. 5).

8

Рис. 5

1.3.2. После того как все столбцы посчитаны, нужно знать некоторые значения, такие как:

а) e2 . У нас это число в ячейке Е14 (это значение должно совпасть с нижним правым значением таблицы 5 х 2 (ячейка В22). Если не совпало, то ищите ошибку в вычислениях столбцов yˆ и е);

б) коэффициент детерминации. Берется из таблицы 5 х 2 и равен R2 ≈ 0,97, т. е. зависимая переменная у на 97 % зависит от значений переменной х и только на 3 % от случайной составляющей;

в) коэффициент корреляции r = R2 . В нашей задаче r = 0,98.

Проверим значимость уравнения в целом: Fфакт = 311,0799 (ячейка А21). Это больше табличного значения функции Фишера– Снедекора Fтабл = 4,96, находящегося на пересечении чисел k1 = 1 и k2 = 10, при α = 0,05. Следовательно, уравнение сформировалось не под воздействием случайных факторов.

1.4.Оценить статистическую значимость параметров регрессии и корреляции.

1.5.Вычислить доверительные интервалы для коэффициентов регрессии.

4 и 5 пункты задачи можно рассчитать вручную с помощью формул из методических указаний раздела 1, а можно опять же с помощью ППП Excel, для этого нужно:

1) проверить доступ к пакету анализа:

– для EXCEL 2003: в главном меню последовательно выберите СервисНадстройки. Установите флажок в строке Пакет анализаОК (рис. 6).

9

– для EXCEL 2007:

а) щелкните левой кнопкой мыши значок Кнопка Microsoft Office , в появившемся окне в самом низу щелкните Параметры Excel;

б) перейдите на вкладку Надстройки, а затем в поле Управление выберите Надстройки Excel;

в) нажмите кнопку Перейти;

г) в поле Доступные надстройки установите флажок Пакет анализа, а затем нажмите кнопку

ОК.

Совет. Если надстройка Пакет анализа отсутствует в списке поля Доступные надстройки, нажмите кнопку Обзор и найдите ее самостоятельно. Если выводится сообщение о том, что пакет анализа не установлен на компьютере, нажмите кнопку Да для его установки.

Далее для доступа к пакету анализа нажмите кнопку Анализ данных в группе Анализ на вкладке

Данные;

Рис. 6

2)

в главном меню (EXCEL 2003) выберите Сер-

 

висАнализ данныхРегрессия. Щелкните по ОК (рис. 7).

В главном меню (EXCEL 2007) выберите ДанныеАнализ данныхРегрессия. Щелкните по

ОК (рис. 7);

Рис. 7

3) заполните окно ввода данных и параметров вывода (рис. 8):

Входной интервал Y – координата первой ячейки столбца переменных у (взять на одну ячейку выше, т.е. с названием переменной. Это понадобится для названия переменной в таблице вывода), двоеточие, координата последней ячейки столбца у;

Входной интервал X – координата первой ячейки столбца переменных х (взять на одну ячейку выше. Это понадобится для названия переменной в таблице вывода), двоеточие, координата последней ячейки столбца х;

Метки – установить флажок, так как входные интервалы содержат названия строк; Константа – ноль – наличие флажка указывает, что в уравнении регрессии отсутствует сво-

бодный член; Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;

Новый рабочий лист – можно задать произвольное имя нового листа.

Если необходимо получить информацию и графики остатков, установите соответствующие флажки в окне.

Щелкните по кнопке ОК.

На вашем рабочем листе начиная с ячейки А25 появится таблица результатов регрессионного анализа (рис. 9). Теперь давайте разбираться с этой таблицей.

10

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]