Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика _лабор. раб

._.pdf
Скачиваний:
920
Добавлен:
23.03.2015
Размер:
1.44 Mб
Скачать

можно сделать при помощи средств фильтрации данных.

Если точно известны значения конкретного ряда, которые являются «нормальными» для рассматриваемой выборки, то можно исключить «лишние» наблюдения, задавая условие фильтрации данных if при определении sample (текущей выборки). Это можно сделать как при помощи специального окна для изменения sample (п. 6. лаб. работы № 1), так и при помощи команды smpl.

В рассматриваемой выборке Сербия с уровнем безработицы, превышающим 18 %, Люксембург со значением ВВП, превышающим 80 тыс. долл., слишком сильно нарушают относительную однородность выборки.

smpl @all if unemp < 18 — отобразить все наблюдения, в которых переменная unemp меньше 18.

smpl @all if unemp < 18 and GDP < 80000 — отобразить все наблюдения, в которых одновременно переменные unemp < 13 и

GDP < 80000.

При использовании окна Sample для изменения текущей выборки условие фильтрации записывается в поле IF condition (op- tional) (рис. 2.4).

Рис. 2.4. Фильтрация данных

5. Расчет и анализ выборочных характеристик рядов данных

При первичном анализе рядов важную роль играет анализ выборочных статистических характеристик. Они позволяют исследовать как ряды данных по отдельности, так и их взаимосвязь. Эти характеристики могут служить математическим подтверждением выводов, построенных на анализе графиков и диаграмм рас-

21

сеяния.

Расчет выборочных характеристик может быть проведен как при помощи специальных команд, используемых в пакете EViews, так и при помощи встроенных средств.

В первом случае используются следующие функции: @mean(x) — выборочное математическое ожидание x; @var(x) — выборочная дисперсия х;

@skew(x) — коэффициент асимметрии ряда x; @kurt(x) — коэффициент эксцесса ряда x;

@cor(x,y) — выборочный коэффициент корреляции х и у; @cov(x,y) — выборочный коэффициент ковариации х и у. Например, для того чтобы рассчитать выборочный коэффи-

циент корреляции между X и Y, необходимо сначала определить имя ряда для коэффициента корреляции (пусть это будет ряд R), а затем в строке ввода формул ввести genr R = @cor(X, Y).

Во втором случае необходимо в объекте Series (для одного ряда) или в объекте Group (для группы рядов) выбрать в окне ря-

да меню View / Descriptive Statistics / Histogram and Stats или View / Descriptive Statistics / Common sample соответственно.

Если описательная статистика рассчитывается для ряда данных, то появится окно, содержащее гистограмму частот ряда и выборочные характеристики (рис. 2.5). Если же характеристики строятся для группы рядов данных, то результатом будет являться таблица, отражающая перечисленные ниже характеристики для всех рядов, представленных в группе.

22

Рис. 2.5. Статистические характеристики ряда

При вызове описательной статистики пакет представляет следующие характеристики ряда (рис. 2.5):

Mean — средняя арифметическая ряда; Median — медиана ряда;

Maximum — максимальное значение ряда; Minimum — минимальное значение ряда; Std. Dev. — стандартное отклонение ряда;

Skewness — коэффициент асимметрии (если Skewness > 0, это правосторонняя асимметрия, если < 0 — левосторонняя); Kurtosis — коэффициент эксцесса (у нормального распределения эксцесс равен 3);

Jarque-Bera — статистика Жарке-Бера, показывает нормальность распределения (так, при доверительной вероятности 0,95 имеет место нормальное распределение, если Probability > 0,05; в противном случае распределение не является нормальным).

Для расчета выборочных ковариаций и коэффициентов корреляции необходимо в группе выбрать в меню следующие пунк-

ты: View / Covariance / Common Sample или View / Correlations / Common Sample. Результатом будет ковариационная или корреляционная матрица.

23

Анализ выборочных статистических характеристик позволя-

ет:

проверить гипотезу о нормальности рядов данных, используемых при построении модели;

оценить степень разброса значений результирующего признака и влияющих факторов;

определить степень тесноты исследуемых рядов и близость их зависимости к линейному виду.

Задания

Исследуется зависимость между несколькими экономическими показателями. Необходимо проверить собранные данные, провести первичный анализ и при необходимости скорректировать рабочую выборку.

Исходные данные по вариантам находятся в файле lab 2.xls, номер варианта соответствует номеру страницы в файле.

1.Создайте рабочий файл, соответствующий размерности выборки в вашем варианте.

2.Создайте ряды данных, в которые скопируйте необходимую информацию.

3.Создайте в рабочем файле группу(ы), включающую(ие) необходимые для анализа ряды данных.

4.Проведите графический анализ данных, совместное поведение исследуемых величин, отразите в тетради ваши заключения.

5.Проведите анализ диаграмм рассеяния, подготовьте выводы о форме функциональной зависимости между рядами, о тесноте связи (рассчитайте выборочные коэффициенты корреляции).

6.Проведите анализ выборочных характеристик рядов данных. Определите соразмерность колебаний. Сопоставьте полученные выводы с выводами, сделанными при проведении графического анализа и анализа графиков зависимости.

7.Проведите фильтрацию (очистку) рядов данных в соответствии с вашими выводами.

8.Сохраните рабочий файл в вашем разделе под именем «фа-

милия студента»_2.WF1.

9.Результаты покажите преподавателю и подготовьте аргумен-

24

тацию ваших действий.

Команды, используемые в лабораторной работе:

series x (либо genr x) — создание дискретного ряда с именем x;

alpha x — создание текстового ряда с именем x;

group first x y — создание группы с именем first и включение в нее рядов x и y;

line x y — создание графика с рядами x и y;

bar x y — создание гистограммы с рядами x и y;

scat x y — создание графика зависимости (облака рассеяния) значений ряда y от значений ряда x;

smpl 1 100 — изменение размера текущей выборки до 100;

smpl @all if — изменение размера текущей выборки в соответствии с условием после команды if.

Вопросы для самоконтроля

1.Что такое эконометрическая модель?

2.Каковы основные три класса моделей в эконометрике?

3.Каковы этапы эконометрического моделирования?

4.Что такое поле корреляции?

5.Что означает однородность данных?

6.Как по коэффициенту корреляции определить вид связи?

7.Как по коэффициенту корреляции определить тесноту связи?

8.Какие значения может принимать коэффициент корреляции?

9.Пусть стандартное отклонение ряда (Std. Dev.) равно 2,5 (см. рис. 2.5), что это означает?

Лабораторная работа № 3. ПАРНАЯ РЕГРЕССИЯ

Эконометрическое исследование проводится на основе выборочных данных, которые отбираются из части всей совокуп-

ности по определенным правилам выборки и обеспечивают получение данных, характеризующих всю совокупность в целом.

Наиболее простым и распространенным предположением о

25

взаимосвязи факторов является предположение об их линейной

зависимости.

Парная линейная регрессия представляет собой линейную зависимость между двумя переменными: y и x, т.е. модель вида

 

yi = β0 + β1 xi + εi, i =

1, n

,

 

 

где

yi — значение зависимой переменной для наблюдения i;

 

xi — значение независимой переменной для наблюдения i;

 

β0 и β1 — коэффициенты (параметры) регрессии;

 

 

εi — значение случайной ошибки для наблюдения i;

 

 

n — число наблюдений.

 

 

 

 

 

 

 

 

 

Оценки коэффициентов парной линейной регрессии

β 0 и

 

 

 

 

 

 

 

β 1

определяются методом наименьших квадратов (МНК). По-

 

 

 

 

 

лученные значения β 0 и

β 1 позволяют определить

yi

рас-

четное (прогнозное) значение зависимой (объясняемой, эндогенной) переменной для наблюдения i.

Функционал метода наименьших квадратов для случая пар-

ной линейной регрессии выглядит таким образом:

 

n

 

 

n

 

 

 

 

2

 

ε 2

=

[y

- (β

 

+ β x

)]

® min .

 

t = 1

t

 

t = 1

t

 

0

1 1t

 

β0,β1

Для оценки качества парной линейной регрессии необхо-

димо обратить внимание на следующие моменты.

1. Значимость коэффициентов регрессии

Истинное значение коэффициентов регрессии неизвестно. На основе имеющихся наблюдений можно рассчитать только их оценки (приближенные значения). Заметим, что если коэффици-

ент β1 = 0 (даже если значение этого коэффициента βˆ1 ¹ 0 ), то фактически переменная y не зависит от x и уравнение регрес-

сии не имеет смысла.

Коэффициент регрессии значим на заданном уровне до-

верия (значимости), если можно принять гипотезу, что его истинное значение отлично от нуля. Коэффициент регрессии не-

26

значим на заданном уровне доверия (значимости), если при-

нимается гипотеза, что его истинное значение равно нулю.

Для проверки значимости коэффициента регрессии (проверки гипотезы βi = 0 ) необходимо:

1)задать уровень значимости α (0,1) ; обычно он равен 0,05 (величина 1 − α называется уровнем доверия);

2)рассчитать стандартные ошибки оценок — среднеквадра-

тические отклонения коэффициентов регрессии от их истинных значений:

 

 

 

 

 

 

 

Ù

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ù 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

i

- y

 

 

× x2

 

 

 

 

 

 

 

 

y

- y

 

 

 

 

 

1

 

 

 

 

i

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

i

 

 

i

 

S

β0 =

×

i

 

 

 

 

 

 

 

, S

)

=

 

 

×

 

i

 

 

 

 

 

 

 

;

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n - 2

 

 

 

 

 

 

2

 

 

β1

 

n - 2

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(xi - x )

 

 

 

 

 

 

 

 

 

 

(xi - x )

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

=

 

 

 

βi

 

 

 

 

 

 

 

3) рассчитать значение критерия Стьюдента

i

 

 

 

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

β

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4)определить tкр — табличное (критическое) значение t-

критерия Стьюдента для уровня значимости α и числа степеней свободы n – 2 ( n — число наблюдений);

5)сравнить ti и tкр : если ti > tкр , то коэффициент βi значим с уровнем доверия (1 − α ), иначе — незначим.

Замечания

1)Значение tкр определяются по специальным таблицам для распределения Стьюдента. Так, при числе степеней свободы более 200

tкр = 1,65 для α = 0.10 (10 %); tкр = 1,96 для α = 0.05 (5 %);

tкр = 2,58 для α = 0.01 (1 %)

2) Чем меньше значение стандартной ошибки по сравнению со значением соответствующего коэффициента, тем ближе оценки коэффициентов регрессии к их истинным значениям.

27

3) Аналогично проверяется значимость и в случае многих переменных (множественной регрессии).

2. Доверительные интервалы коэффициентов показыва-

ют, что истинное значение параметра с вероятностью 1 – α находится в пределах

 

Ù

 

- t

× S

 

Ù

 

+ t

× S

 

 

β Î

β

i

 

; β

i

 

,

 

 

 

крит

βi

 

 

крит

βi

i

 

 

 

ˆ

 

 

 

ˆ

 

где α — уровень значимости.

Чем меньше доверительный интервал относительно коэффициента, тем точнее полученная оценка.

ˆ

= 2,1,

s

= 0.8, число наблюде-

Пример. Пусть значение β1

 

 

β1

 

ний 250. Тогда:

1)для уровня значимости 0,05 критическое значение критерия Стьюдента tкр = 1,96;

2)значение критерия Стьюдента для данного коэффициента

равно t1 = 2.1 = 2.625 > tкр = 1.96 , следовательно, коэффициент

0.8

β1 значим на уроне доверия 0,95 (на уровне значимости 0,05), т. е. с вероятностью 0,95 истинное значение этого коэффициента отлично от нуля;

3) истинное значение коэффициента β1 находится в интер-

вале

β1 (2,1 – 1.96 × 0.8; 2,1 + 1,9 × 60,8) = (2,1 – 1,568 ; 2,1 + 1,568) = (0,532; 3,668).

Величина интервала относительно оценки коэффициента βˆ 1 большая, следовательно, точность оценки низкая.

3. Коэффициент детерминации R2 показывает степень со-

ответствия найденного уравнения фактическим данным (качество подгонки уравнения):

28

 

 

 

 

 

 

 

2

 

 

 

 

 

yi

yi

 

 

 

 

R2 = 1 −

 

 

 

 

,

 

 

 

 

 

 

( yi y)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где yi

— прогнозные (расчетные)

значения зависимой переме-

ной yi ,

 

 

 

 

y — среднее значение зависимой переменой y .

R2 изменяется в пределах [0; 1], и чем ближе его значение к 1, тем лучше модель согласуется с выборочными данными.

Например, если R2 = 0,75, то говорят, что на 75 % изменение переменной y описывается полученным уравнением и влиянием переменной x , а 25 % изменения y — следствие влияния неучтенных в уравнении регрессии факторов.

Коэффициент детерминации не используется, если в уравнении отсутствует константа β0 (в этом случае его значения могут выйти за пределы [0; 1]).

4. Стандартная ошибка регрессии Se является оценкой ве-

личины квадрата ошибки, приходящейся на одну степень свобо-

ды модели

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

y

2

 

 

 

 

y

i

 

 

 

 

 

i =

 

 

i

 

 

Se =

1

 

 

 

.

 

n − 2

 

Она показывает, насколько прогнозные значения зависимой переменной отличаются от фактических значений. Чем меньше Se по сравнению с зависимой переменной, тем лучше качество модели.

5. Значимость уравнения регрессии Уравнение значимо на заданном уровне доверия (уровне

значимости), если можно принять гипотезу, о том, что существует хотя бы один коэффициент при независимых переменных, отличный от нуля. Проверяется по F-критерию Фишера:

29

 

R2

F =

1- R 2 ×(n - 2) .

Для заданного уровня значимости и по числу степеней свободы, равному (n – 2), определяется критическое значение критерия Фишера Fкр . Если F > Fкр , то уравнение статистически зна-

чимо, иначе — незначимо.

Замечание. Для парной регрессии значимость уравнения в целом равносильна значимости коэффициента при независимой переменной.

6. Средняя абсолютная процентная ошибка (ошибка ап-

проксимации) показывает в процентах среднее отклонение рас-

четных значений зависимой переменной y от фактических значений yi:

 

 

 

 

 

 

 

 

1

n

 

- yi

 

 

A =

 

yi

 

×100%.

 

 

yi

 

n i=1

 

 

Если A ≤ 10 %, то качество подгонки уравнения считается хорошим. Чем меньше значение A, тем лучше.

Экономическая интерпретация парной линейной регрессии

Параметр β 1 показывает, насколько изменится среднее зна-

чение Y при увеличении X на единицу.

Параметр β 0 является значением Y при X = 0. Он может не

иметь экономического содержания.

Пример. Пусть по 300 наблюдениям получено следующее уравнение регрессии:

yˆ = 2.01+ 3.46 x , R2 = 0.64 .

( s.e) (0.51) (1.28)

В скобках под значениями коэффициентов приведены их стандартные ошибки. По их значениям можно утверждать, что:

1)на 5 %-м уровне значимости коэффициенты значимы;

2)качество подгонки удовлетворительное, на 64 % изменение

30