Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
104.docx
Скачиваний:
14
Добавлен:
13.11.2022
Размер:
10.47 Mб
Скачать

4.4. Фиксированные эффекты или случайные?

Имея две различные спецификации модели панельных данных, учитывающие индивидуальные эффекты, необходимо решить, какую из них предпочесть. Как было отмечено, каждая из таких моделей обладает своими преимуществами и недостатками. Недостатки модели с фиксированными эффектами состоят в необходимости оценивать большое число параметров и невозможности включить неизменные во времени переменные. Модель со случайными эффектами эти проблемы решает, но требует введения дополнительного предположения о некоррелированности специфического для каждого объекта слагаемого ошибки с регрессорами. А эта предпосылка не всегда выполняется, что приводит к неэффективным оценкам случайных эффектов. Но если эта предпосылка выполнена, то рекомендуется применять модель со случайными эффектами. Таким образом, при выборе той или иной спецификации модели панельных данных, необходимо решить вопрос: зависят ли индивидуальные эффекты αi и регрессоры xit.

Хаусман предложил тестировать эту гипотезу, исходя из следующих соображений. Необходимо сравнить две оценки вектора параметров β модели панельных данных: одна из них состоятельна как при нулевой гипотезе, так и при альтернативной, а другая состоятельна (и эффективна) только при нулевой гипотезе. Значимое различие между ними укажет, что нулевая гипотеза вряд ли будет справедлива.

Пусть εit и xis независимы при любых t и s, так что оценка с фиксированными эффектами является состоятельной для вектора параметров β независимо от того, коррелированы ли xit и αi, тогда как оценка со случайными эффектами состоятельна и эффективна, только если xit и αi не коррелированы.

Рассмотрим вектор разностей . Чтобы оценить значимость этих разностей в соответствии с общим алгоритмом проверки статистических гипотез необходимо рассчитать определённую статистику, закон распределения которой известен при верности нулевой гипотезы. Хаусман показал, что если обе оценки, входящие в разность, имеют приближённо нормальное распределение (а это так, если верна нулевая гипотеза), то и разность имеет то же распределение, тогда такой статистикой может быть

H = ( )т( ),

где – оценка матрицы ковариаций

Если верна нулевая гипотеза (xit и αi не коррелированы), то эта статистика имеет асимптотическое χ2-распределение с к степенями свободы. Если расчётное значение этой статистики меньше критического (или расчётный уровень значимости больше принятого), то нулевая гипотеза не отклоняется и мы имеем модель со случайными эффектами.

Таким образом, критерий Хаусмана тестирует, значимо ли различие оценок с фиксированными и случайными эффектами. Необходимо отметить, что этот критерий асимптотический и в малых выборках ковариационная матрица может быть неположительно определённой, так что её обращение нельзя вычислить. В качестве альтернативы можно проводить такое тестирование лишь для подмножества элементов в векторе β.

4.5. Качество подгонки панельных данных моделью

Для стандартных моделей регрессии качество подгонки (при условии, что среди регрессоров есть константа) обычно измеряет коэффициент детерминации R2 или скорректированный коэффициент детерминации .

При анализе панельных данных возникают некоторые проблемы с определением коэффициента детерминации, связанные с неопределённостью в отношении того, что считать полной суммой квадратов отклонений, подлежащей разложению на объяснённую регрессией и остаточную. Кроме того, модель со случайными эффектами оценивается с помощью обобщённого МНК, для которого коэффициент детерминации вообще не является адекватной мерой качества подгонки.

В контексте рассматриваемой проблемы полную вариацию независимой переменной yit можно записать в виде суммы внутригрупповой и межгрупповой вариаций, т.е.

(1/nT) = (1/nT) + (1/n) ,

где обозначает общее выборочное среднее. Теперь можно определить альтернативные версии меры R2 в зависимости от размерности анализируемых данных. При этом предполагается, что коэффициенты множественной детерминации определяются в терминах квадратов коэффициентов корреляции между реальными и расчётными (по соответствующей модели) значениями объясняемой переменной.

Например, в объединённой модели МНК-оценка максимизирует общую меру качества подгонки данных моделью, т.е. максимизирует общий R2, о котором говорят как о «R2-полном» или R2overall. Определяется он из соотношения

= corr2( , ,

где т .

Оценка с фиксированными эффектами выбирается, чтобы наиболее полно объяснить внутригрупповую вариацию, и поэтому максимизируется «внутригрупповой R2», заданный в виде

= corr2( ),(

где - )т . Такой коэффициент называется R2within.

Межгрупповая оценка, являясь МНК-оценкой для модели в терминах индивидуальных средних, максимизирует «межгрупповой R2», который определяется как

= corr2( , ,

где т . И такой коэффициент называется R2between.

Описанные коэффициенты детерминации можно определить для любой оценки вектора параметров β, при этом естественно считать, что т , . Именно такой подход реализован в эконометрическом пакете STATA: при оценивании моделей с панельными данными вычисляются все три отмеченных коэффициента детерминации, независимо от того, какой метод оценивания применяется.

Следует отметить, что коэффициенты детерминации в моделях с панельными данными нецелесообразно использовать для того, чтобы определить, какой метод оценивания лучше. Однако эти коэффициенты можно применять для сравнения моделей, отличающихся набором регрессоров и оцениваемых одним и тем же методом.

Приведём пример анализа панельных данных на примере из Носко В. П. В нём рассматриваются три предприятия, каждое за 10 лет по двум показателям: y – объём инвестиций, x – прибыль. После структуризации информации, в рабочей области пакета EViews эти данные примут вид (рисунок 4.1).

Именно в таком виде (начиная со столбца F) эта информация и должна вноситься в базу данных пакета программ при анализе панельных данных.

Рисунок 4.1– Информация в рабочей области пакета EViews

Здесь F – индекс предприятия, YEAR – обозначение времени (10 лет).

Графически эта информация представлена на рисунке 4.2.

Рисунок 4.2 – График исходной информации

Здесь первые 10 наблюдений – это 1-е предприятие за 10 лет, вторые 10 наблюдений – 2-е предприятие и последние – 3-е предприятие. Видно, что у 2-го предприятия, в отличие от 1-го и 3-го прибыль выше, чем инвестиции. Количественно это выглядит следующим образом:

Предприятие

Инвестиции

Прибыль

1

155,02

153,97

2

150,15

165,59

3

143,13

128,58

Существенно ли это различие – попытаемся выяснить, используя модели панельных данных.

Приведём сначала расчёты в пакете EViews. Объединённая модель (без учёта структуры панельных данных – pooled) следующая (рисунок 4.3). Здесь она приведена для сравнительного анализа.

Рисунок 4.3 – Объединённая модель

Модель с фиксированными эффектами следующая (рисунок 4.4).

Рисунок 4.4– Модель с фиксированными эффектами

Сами эффекты в этой модели не вычисляются, но в пакете EViews есть опция, позволяющая их вычислить. Применив её, получим

Если использовать модель с фиктивными переменными (без константы), то получим (рисунок 4.5). Как видим, результаты этих двух методов вычисления эффектов не совсем совпадают. Показатели точности этих уравнений совпадают. Но особенности вычислений этих двух методов в том, что эффекты на рисунке 4.4 пронормированы таким образом, что их сумма равна нулю. И если эффекты на рисунке 4.5 пронормировать аналогичным образом, то получим то же самое, что и на рисунке 4.4.

Рисунок 4.5 – Модель с фиктивными переменными

При этом константа в уравнении модели с фиксированными эффектами (–1,323498) – это среднее арифметическое эффектов из модели с фиктивными переменными (рисунок 4.5). Вычтя это значение из эффектов модели на рисунке 4.5, получим в точности эффекты из рисунка 4.4.

Анализировать нормированные эффекты удобнее. Так, если попытаться проинтерпретировать численные значения эффектов (рисунок 4.4), то это можно сделать следующим образом. Как было отмечено в начале этого примера, второе предприятие отличается от 1-го и 3-го тем, что у него в анализируемом периоде прибыль выше инвестиций. Это и отмечено эффектами – у 2-го предприятия эффект с отрицательным знаком в отличие от эффектов 1-го и 3-го предприятий. Причём и численное значение эффектов показывает: различие в разности прибыли и инвестиций примерно одинаковое, но с обратным знаком, что и отражено в индивидуальных эффектах (рисунок 4.4).

И тем не менее фиксированные эффекты не объясняют вариацию между объектами, они только улавливают её. Т.е., если спросить, почему 2-е предприятие имеет прибыль больше, чем инвестиции по сравнению с другими анализируемыми предприятиями, то ответ, представляемый эффектами, есть просто: «потому, что это 2-е предприятие».

Рассчитаем модель со случайными эффектами. Получим (рисунок 4.6).

Рисунок 4.6 – Модель со случайными эффектами

Параметры этой модели оценены на основе обобщённого МНК с учётом ковариационной матрицы оценок, что и отражено в заголовке отчёта. Можно рассчитать индивидуальные случайные оценки (рисунок 4.7)

Рисунок 4.7 – Случайные эффекты

Они тоже нормированы под нулевое суммарное значение. И их интерпретация аналогична фиксированным эффектам.

Как было отмечено, тестирование, являются ли эффекты значимыми, можно определить на основе тестов Вальда и Бреуша – Пагана. Оба эти теста асимптотические, и в силу малого объёма выборки в анализируемом примере эти тесты здесь не приводятся.

По этой же причине можно было бы не приводить тест на спецификацию модели (с фиксированными эффектами или со случайными?), тем более, как отмечалось, результаты этого теста могут различаться при разных методах оценивания дисперсии остатков моделей. Тем не менее приведём для примера тест Хаусмана, рассчитанный в пакете EViews (рисунок 4.8). Как видим из отчёта работы этого теста, вероятность для χ2-статистики меньше 0,05, следовательно, гипотеза о значимом расхождении оценок по моделям с фиксированными и случайными эффектами отклоняется и можно предпочесть из этих моделей модель с фиксированными эффектами.

Рисунок 4.8 –Тест Хаусмана

Для сравнения приведём отчёт об оценке модели с фиксированными эффектами в пакете STATA.

panel variable: f, 1 to 3

time variable: year, 1 to 10

. xtreg y x, fe

Fixed-effects (within) regression Number of obs = 30

Group variable (i): f Number of groups = 3

R-sq: within = 0.9542

between = 0.5537

overall = 0.9178

F(1,26) = 541.66

corr(u_i, Xb) = -0.2342 Prob > F = 0.0000

------------------------------------------------------------------------------

y | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

x | 1.141378 .0490418 23.27 0.000 1.040572 1.242185

cons | -2.106577 .7938837 -2.65 0.013 -3.738429 -.474726

Рисунок 4.9 – Отчёт об оценке модели в пакете STATA

Как и отмечалось, при оценке по любому методу (объединённая модель, модель с фиксированными эффектами и др.) в этом пакете выдаются все три оценки коэффициента детерминации (R-sq: within, between и overall) (рисунок 4.9), и исследователю нужно уметь применять тот или иной коэффициент в зависимости от анализируемой модели.

Приведём пример, иллюстрирующий недостаток модели с фиксированными эффектами, заключающийся в том, что в этом случае не учитываются факторы, не меняющиеся во времени. Пусть рассматривается пример определения индивидуальной заработной платы (wage) 545 индивидуумов за 8 лет по показателям SCHOOL, EXPER, UNION, MAR, BLACK, HISP, PUB (образование, опыт работы, состоит ли в профсоюзе, семейное положение, негр, испанец, работа в индивидуальном секторе). При этом SCHOOL, BLACK, HISP не меняются во времени.

Оценка параметров модели с фиксированными эффектами (пакет STATA) имеет вид (сокращённый вариант отчёта)

------------------------------------------------------------------------------

| Coef. Std. Err. t P>|t| [95% Conf. Interval]

-----+------------------------------------------------------------------------

SCHOOL | (dropped)

EXPER | .116457 .0084309 13.81 0.000 .0999275 .1329865

EXPER2 | -.0042886 .0006054 -7.08 0.000 -.0054756 -.0031015

UNION | .081203 .0193159 4.20 0.000 .0433325 .1190736

MAR | .0451061 .0183114 2.46 0.014 .009205 .0810072

BLACK | (dropped)

HISP | (dropped)

PUB | .0349267 .0386082 0.90 0.366 -.040768 .1106214

_cons | 1.065698 .0266766 39.95 0.000 1.013396 1.118

Как видим, три указанных фактора не участвуют в оценке модели (dropped – «игнорируется»). А в модели со случайными эффектами они присутствуют.

------------------------------------------------------------------------------

WAGE | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

SCHOOL | .1010237 .0089219 11.32 0.000 .0835372 .1185103

EXPER | .1117851 .0082709 13.52 0.000 .0955744 .1279959

EXPER2 | -.0040575 .000592 -6.85 0.000 -.0052177 -.0028972

UNION | .1064134 .0178669 5.96 0.000 .0713949 .1414319

MAR | .0625465 .0167762 3.73 0.000 .0296658 .0954272

BLACK | -.1440026 .0476439 -3.02 0.003 -.237383 -.0506223

HISP | .0197269 .0426303 0.46 0.644 -.0638269 .1032807

PUB | .0301555 .0364671 0.83 0.408 -.0413187 .1016296

_cons | -.1043113 .110834 -0.94 0.347 -.3215421 .1129194

В тесте Хаусмана эти факторы также не участвуют:

Test hausman

| (b) (B) Difference S.E.

--------+----------------------------------------------------------------

EXPER | .116457 .1117851 .0046718 .0016345

EXPER2 | -.0042886 -.0040575 -.0002311 .0001269

UNION | .081203 .1064134 -.0252104 .0073402

MAR | .0451061 .0625465 -.0174403 .0073395

PUB | .0349267 .0301555 .0047713 .0126785

------------------------------------------------------------------------------

b = consistent under Ho and Ha; obtained from xtreg

B = inconsistent under Ha, efficient under Ho; obtained from xtreg

Test: Ho: difference in coefficients not systematic

chi2(5) = (b-B)'[(V_b-V_B)^(-1)](b-B) = 31.75

Prob>chi2 = 0.0000

Тест Хаусмана показывает, что в этом случае предпочтение желательно отдать модели с фиксированными эффектами (Prob>chi2 = 0.0000).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]