Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ПРИКЛАДНАЯ ЭКОНОМЕТРИКА В ПРЕДПРИНИМАТЕЛЬСТВЕ.docx
Скачиваний:
17
Добавлен:
30.04.2019
Размер:
1.94 Mб
Скачать

2.12. Взаимосвязь между f-критерием общего качества регрессии и f-критерием для коэффициента наклона в парном регрессионном анализе

В случае парного регрессионного анализа (и только парного регрессионного анализа) как F-критерий для величины R2, так и t-критерий для коэффи­циента наклона рассматривают в качестве нулевой гипотезы Н0: β2 = 0

и Н1: β20 в качестве альтернативной гипотезы. Это поднимает вопрос о воз­можности получения на их основе разных выводов. К счастью, в действитель­ности они эквивалентны друг другу, F-статистика равна квадрату t-статисти­ки, и критическое значение F, при любом заданном уровне значимости, равно квадрату критического значения t. Начнем с определения F, подставив к = 2 в (2.86):

= (2.92)

Доказательство того, что критическое значение F равно квадрату крити­ческого значения t, несколько сложнее, и мы его опустим. Когда мы перейдем к множественному регрессионному анализу, то увидим, что F- и t-критерии играют в нем разную роль и имеют различные нулевые гипотезы. Тем не ме­нее, в парном регрессионном анализе тот факт, что они эквивалентны, озна­чает, что нет смысла выполнять оба этих теста. Проведение обоих тестов будет свидетельствовать о некомпетенции аналитика. Очевидно, если это соответ­ствует смыслу задачи, то односторонний t-критерий здесь предпочтительнее, чем какой-то другой.

Ключевые понятия

Автокорреляция центральная предельная теорема

гомоскедастичный случайный член теорема Гaycca—Маркова

гипотеза альтернативная уровень значимости

гипотеза нулевая эксперимент Монте-Карло

доверительный интервал данные перекрестной выборки

мощность критерия F-статистика

F-тест на качество оценивания

область принятия гипотезы t-статистика

ошибка I рода t-тест

ошибка II рода t-тест, односторонний

значение р данные временных рядов

стандартная ошибка коэффициента панельные данные

регрессии

стохастический регрессор

3. Множественный регрессионный анализ

В этой главе регрессионный анализ по методу наименьших квадратов обобщается для случая, когда в модели регрессии вместо одной объясняющей переменной ис­пользуется несколько объясняющих переменных. Рассматриваются два новых во­проса. Один из них касается проблемы разграничения эффектов различных объяс­няющих переменных. Эта проблема в случае обострения известна под названием мультиколлинеарности. Другой вопрос состоит в оценке объединенной объясня­ющей способности независимых переменных в противоположность их отдельным предельным эффектам.

Иллюстрация: модель с двумя объясняющими переменными

Множественный регрессионный анализ является развитием парного регрес­сионного анализа применительно к случаям, когда зависимая переменная ги­потетически связана с более чем одной объясняющей переменной. Большая часть анализа будет непосредственным расширением парной регрессионной модели, но здесь мы сталкиваемся с двумя новыми проблемами. Во-первых, при оценке влияния данной объясняющей переменной на зависимую пере­менную нам придется решать проблему разграничения ее воздействия и воз­действий других объясняющих переменных. Во-вторых, мы должны будем ре­шить проблему спецификации модели. Часто предполагается, что несколько переменных могут оказывать влияние на зависимую переменную, с другой стороны, некоторые переменные могут не подходить для модели. Мы должны решить, какие из них следует включить в уравнение регрессии, а какие — ис­ключить из него. Вторая проблема будет рассмотрена в гл. 6. В данной главе мы полагаем, что спецификация модели правильная. В большинстве ситуаций мы ограничимся базовым случаем, где используются только две объясняющие пе­ременные.

Начнем с рассмотрения примера с факторами, определяющими величину заработка. Расширим первоначальную модель, включив учет влияния числа лет работы наряду с образованием, и допустим, что истинную зависимость можно выразить следующим образом:

EARNINGS = β1 + β25 + β3 EXP + w, (3.1)

где EARNINGSчасовой заработок; Sпродолжительность обучения (число полных лет учебы); ЕХР — число лета работы после получения образования; и — случайный член. Такая модель, разумеется, является значительным упрощением как с точки зрения состава независимых переменных, включен­ных в зависимость, так и с точки зрения математической формулы связи.

Для геометрической иллюстрации этой зависимости необходима трехмерная диаграмма с отдельными осями для EARNINGS, S и ЕХР, как показано на рис. 3.1. Основание на рисунке содержит оси для S и ЕХР, и если пренебрег текущим влиянием случайного члена, то наклонная плоскость над ним показывает величину EARNINGS, соответствующую любому сочетанию (S, EXP), измеренную расстоянием по вертикали до этой плоскости над основанием в данной точке. Так как заработки могут увеличиваться под влиянием как продолжительности обучения, так и опыта работы, изображение на диаграмм было построено на основе допущения о том, что β2 и β3 положительны. Буквально свободный член β1 показывает ожидаемую величину заработка при первом сроке обучения и нулевом опыте работы. Однако такая интерпретаций была бы некорректной, поскольку в выборке NLSY не было лиц с нулевым сроком обучения. В действительности лишь очень немногие в этой выборке не завершили 8-летнее образование. Математическая формула (3.1) означает, что если бы ЕХР равнялось нулю, то для любого положительного S заработок раз­нялся бы β1 + β2S, где приращение β2S показывает «чистый эффект S» в будущем. При S, равном нулю, уравнение показывает, что при любой положительной величине ЕХР заработок был бы равен β1 + β2S, где приращение β2S показывает «чистый эффект ЕХР». На рис. 3.1 показан также совокупный эффект продолжительности обучения и опыта работы β2S + β3ЕХР.

До сих пор мы пренебрегали случайным членом. Если он отсутствует в ураз нении (3.1), то значения переменной EARNINGS в данной выборке наблюдений для EARNINGS, S и ЕХР будут находиться точно на обозначенной наклонной плоскости, и будет довольно просто вывести точные значения для β 1, β 2 и β3 (это не так просто сделать геометрически, если вы не имеете достаточно большого опыта в создании трехмерных моделей, однако это довольно просто сделать алгебраическим путем).

Рисунок 3.1 – Истинная модель с двумя объясняющими переменными: заработок как функция продолжительности обучения и опыта работы

Наличие случайного члена приводит к тому, что фактические значения ве­личины заработка будут лежать несколько выше или несколько ниже значе­ний, соответствующих данной наклонной плоскости. Следовательно, теперь мы имеем трехмерный аналог для двумерной задачи, показанной на рис. 1.2. Вместо нахождения линии, соответствующей двумерному рассеянию точек, мы теперь должны расположить плоскость так, чтобы она соответствовала трехмерному рассеянию. Уравнение для выбранной плоскости будет иметь вид

EARNINGS = b1+ b2S + b3EXP, (3.2)

и ее расположение будет зависеть от выбора величин b1 b2, и b3 являющихся соответственно оценками β1, β2 и β3. При использовании набора данных EAEF 21 мы получим распечатку результатов оценивания регрессии, представ­ленную в табл. 3.1.

Оцененное уравнение интерпретируется следующим образом. На каждый дополнительный полный год обучения при данном опыте работы приходится увеличение часового заработка в размере 2,68 долл. На каждый дополнитель­ный год опыта работы при данной продолжительности обучения приходится увеличение часового заработка в размере 0,56 долл. Постоянный член не имеет здесь содержательной интерпретации. Буквально он означал бы, что респон­дент с нулевым уровнем образования (на самом деле все респонденты учились не менее шести лет) и без опыта работы зарабатывал бы в час минус 26,49 долл.

Таблица 3.1

EARNINGS S EXP

Source

SS

df

MS

Number of obs =F(2,537) =

540

Model

22513.6473

2

11256.8237

F(2,537)

67.54

Residual

89496.5838

537

166.660305

Prob > F =

R-squared

Adj R-squared

Root MSE

0.0000

0.2010

0.1980

12.91

Total

112010.231

539

207.811189

EARNINGS

Coef.

Std. Err.

t

P>|t|

[95% Conf.

Interval]

S

2.678125

.2336497

11.46

0.000

2.219146

3.137105

EXP

.5624326

.1285136

4.38

0.000

.3099816

.8148837

_cons

-26.48501

4.27251

-6.20

0.000

-34.87789

-18.09213