
- •67 «Эконометрика» Глава 5. Развитие регрессионной модели
- •5.1. Мультиколлинеарность
- •5.2. Проверка значимости исключенных и добавленных переменных
- •5.2.1. Частная корреляция*
- •5.2.2. Коэффициент множественный корреляции*
- •5.3. Линейные регрессионные модели с переменной структурой (фиктивные переменные)
- •Пример 5.1
- •5.4. Проверка гипотезы о совпадении уравнений регрессии для отдельных групп наблюдений (критерий Чоу)
- •Лабораторная работа № 5.4. Фиктивные переменные
- •Выполнение
- •5.5. Нелинейная регрессия
- •Пример 5.2.
- •5.5.1*. Подбор линеаризующего преобразования (подход Бокса – Кокса)
- •5. Вопросы
5.2.2. Коэффициент множественный корреляции*
Для определения связи между несколькими переменными используется множественный коэффициент корреляции.
Если переменных три: x1,х2иy. То влияниех1их2наyвычисляется по формуле:
,
(5. 0)
где под корнем стоят парные линейные коэффициенты корреляции.
В общем случае, когда объясняющих переменных более двух коэффициент множественной корреляции рассчитывают по формуле:
,
где- определитель
матрицы вида
аyалгебраическое дополнение к 0:
.
5.3. Линейные регрессионные модели с переменной структурой (фиктивные переменные)
До
сих пор мы предполагали, что в общую
линейную модель у
= a0+a1х1
+a2х2
+ ... +amхm+e
по п
наблюдениям с т
объясняющими
переменными входят лишь переменные,
существенные для экономической
теории. Некоторые из них в свою очередь
могут быть функциями, возможно и не
линейными, других переменных. Например,
и т. д. Однако
модель должна при этом оставаться
линейной относительно параметров {a0,
a1,
a2,
... ,am}
и удовлетворять всем свойствам,
необходимым для применения обыкновенного
метода наименьших квадратов. Тем не
менее, мы можем существенно расширить
сферу применения линейных моделей,
допустив включение фиктивных
переменных.
Это специальным образом сконструированные
переменные для отражения изменений в
таких факторах, как эффект сдвига во
времени или в пространстве, воздействие
качественных переменных или большого
числа количественных переменных.
Эффект сдвига во времени. Мы иногда предполагаем неизменными соотношения, объясняющие поведение объекта, перенося их из одного периода времени в другой. Например, можно ожидать, что потребительская функция во время войны окажется сдвинутой вниз по сравнению с ее значениями в мирное время; уравнение, определяющее заработную плату, может испытать импульсное воздействие в результате смены политической власти; можно ожидать, что многие уравнения будут подвержены сезонным возмущениям, если мы имеем дело с квартальными или недельными данными.
Пространственные сдвиги мы наблюдаем, анализируя одни и те же экономические зависимости для регионов страны, различающихся экономической структурой или перспективами на будущее.
Качественные переменные, такие, как пол, семейный статус, принадлежность к социальным или профессиональным группам, нередко также играют важную роль в определении экономического поведения и поэтому они должны быть введены в процесс оценивания.
Наконец, мы иногда можем располагать существенными переменными, такими, как доход или возраст, однако для достижения поставленной цели необходимо использовать эти данные в сильно агрегированном виде.
Во всех этих случаях целесообразно ввести подходящим образом выбранные фиктивные переменные.
Пример 5.1
Рассмотрим ситуацию детально на очень простом примере потребительской функции для военного и для мирного времени. Предположим, что в военное время уровень потребления С и уровень доходов Y связаны следующим соотношением:
С=0+1Y+ (5. 0)
а в мирное время -
С=0/+1Y+ (5. 0)
Где 0/>0. Заметим, что в модели предполагается общая предельная склонность к потреблению для обоих периодов1. Если же параметр1не будет общим, то нам ничего не удастся сделать с помощью фиктивных переменных, а останется лишь одно — подогнать с помощью уравнения (5.6) данные для военных лет, а с помощью уравнения (5.7) — данные для мирного времени. Однако предположив параметр1общим, мы делаем тем самым осмысленным использованиевсехимеющихся данных для получения эффективной (насколько это возможно) оценки этого параметра. Мы можем объединить уравнения (5.6) и (5.7) в одно соотношение -
С=0X+0/X/+1Y+ (5. 0)
где XиX/— фиктивные переменные, такие, что
Очевидно, что уравнение (5.8) в мирный год преобразуется к виду (5.7) (X=0), а в военный - к виду (5.6) (X/=0). Так что первый коэффициент уравнения (5.8) служит оценкой свободного члена только для военного времени, а второй — только для мирного, третий коэффициент есть общая для всего периода предельная склонность к потреблению.
В матрице данных (5.9) мы предположили, что выбранный период включает в себя два мирных года, затем три года войны, и, наконец, снова годы мирного времени.
(5.
0)
Ловушка, возникающая при введении фиктивных переменных. Если объясняющие переменные такие, как и в правой части уравнения (5.8), то применение для этого уравнения обычной процедуры вычисления регрессии, которая автоматически определяет величину свободного члена, приведет к нарушению процесса оценивания. В самом деле, включение указанных фиктивных переменных эквивалентно использованию матрицы данных с четырьмя столбцами (см. п.4.1.1), из которых первый целиком состоит из единиц, а три оставшихся определены в (5.9). Тогда существует линейная зависимость между столбцами, поскольку первый равен сумме второго и третьего. Следовательно, матрица (ХTХ) вырождена.
Однако когда прочие объясняющие переменные комбинируются с фиктивными, то в результате ошибок округления в ЭВМ определитель матрицы (ХTХ) может оказаться не равным нулю, так что вычисления будут выполнены и будут найдены оценки коэффициентов,R2и прочих статистических показателей. Эти оценки будут противоречить априорным соображениям и неосторожный исследователь придет к выводам, не имеющим ничего общего с реальностью.
Если вычислительная процедура предусматривает получение свободного члена, то единственный способ воспользоваться ею для наших целей — это переписать уравнение (5.8) в виде
С=+/X/+1Y+ (5. 0)
где
Очевидно, что уравнение (5.10) в мирный год преобразуется к виду (5.7) С=+/+1Y+ , а в военный - к видуС=+1Y+
Сопоставляя результат с предыдущим, мы видим, что
=0 = свободному члену для военного времени;
+/=0/ = свободному члену для мирного времени.
/=0/ -0 = разности между свободными членами, соответствующими мирному и военному времени.